본문 바로가기

자료분석 및 코딩/파이썬12

[파이썬] 4-1. 조위 자료 분석 (2) - dataframe의 칼럼명/열이름/헤더 수정 rename, 결측값 숫자변환 지난번 글에서는 판다스(pandas)의 read_csv를 활용해 데이터를 읽어오는 부분까지 진행했었다. 오늘은 읽은 데이터 중 특정 열을 뽑아내서 분석하기 위한 전 단계인 데이터 추출 및 칼럼명(헤더) 수정, 문자열의 숫자변환 등에 대해 설명해보도록 하겠다. 1. columns 이름 수정 (칼럼명, 헤더 수정) 지난번에 pandas의 read_csv로 읽은 데이터는 아래와 같다. 전체 데이터 중 분석할 데이터는 '관측시간'과 '조위(cm)'이다. 하지만 리눅스의 스파이더에서는 한글 입력이 안되기 때문에 데이터를 처리하기에 앞서 각 열이름을 영어로 변환해줘야 한다. 따라서, 먼저 칼럼명(열이름)을 먼저 바꿔보도록 하겠다. 칼럼명 변경은 dataframe의 columns 또는 rename 속성을 활용한다. .. 2023. 4. 12.
[파이썬] 4-1. 조위 자료 분석 - 텍스트 읽기, pandas, read_csv, 인코딩 및 옵션 파이썬으로 실제 데이터를 읽고 처리하는 방법에 대해 소개해볼텐데, 첫번째로 해양데이터 중 가장 기초적인 정보에 해당하는 조위정보를 읽어오는 과정을 진행해보려한다. 조위정보는 국립해양조사원에서 무료로 제공해주는데, 국립해양조사원 바다누리 해양정보 서비스에 가면 다운로드 받을 수 있다. 로그인이 필요하며, 해양정보다운로드 페이지로 가서 관측자료, 월별/년별, 관측소유형(조위관측소), 관측소 선택, 연도를 선택하여 검색한 뒤 다운받으면 된다. 텍스트 자료 읽기 - text read (판다스, Pandas, read_csv) Pandas를 이용해서 텍스트 데이터를 읽을텐데, 판다스는 시계열(time series)이나 표(table) 형태의 데이터를 처리할 때 매우 유용하게 쓰이는 파이썬 패키지이다. 자연과학 분.. 2023. 4. 4.
[파이썬] 3-3. 기본문법 - 조건문(if문)과 반복문(for문) 오늘은 자료분석 스크립트를 짜다보면 거의 무조건 쓰게되는 문법인 조건문과 반복문에 대해 알아보겠다. 처음 자료분석에 입문할 때는 이 if문과 for문을 어떤 상황에서 어떻게 써야하는지 감이 안오지만 한 두번 해보다 보면 정말 간단하면서도 필수적인 문법으로 느껴진다. 1. 조건문 - if / else / elif 조건문이란 '이럴땐 이렇게하고 저럴땐 저렇게 해라' 는 명령을 수식으로 나타내는 것이다. 자료분석에서는 특히, 어떤 값 이상일때는 ~~~~, 이하일 때는 ~~~~와 같이 조건을 거는 경우가 많다. 이러한 각 경우를 'if'와 'elif'와 'else'로 각각의 경우에 따라 로직 및 연산을 구현하는 것이다. if ~A~ : A라는 조건에 맞는다면 실행 elif ~B~ : A라는 조건에 맞지 않는 것.. 2023. 3. 28.
[파이썬] 3-2. 기본문법 - 기초연산(제곱, 루트), 인덱스, 주석 자료분석을 목적으로 파이썬을 사용한다면, 가장 기본이 되는 것이 계산 및 연산이다. 간단한 계산들은 별도의 라이브러리를 설치하지고 내장 함수로만으로도 가능하다. 그래서 오늘은 파이썬의 기초연산 명령어와 연산 및 자료처리를 위해 필요한 개념인 인덱스에 대해 알아보겠다. 1. 기본연산 기본적인 사칙연산은 키보드에 있는 그대로 쓰면되고, 이는 다른 개발언어에서도 동일할텐데 아래와 같다. 더하기 : + 빼기 : - 곱하기 : * 나누기 : / 제곱 : ** 제곱근(루트) : **(1/n) 제곱은 **로 구한다. 이제곱은 **2, 세제곱은 **3, 네제곱은 **4처럼 계산하면 된다. 위 사진처럼 3의 이제곱은 3**2로 구하고, 그 값인 9가 출력된다. 루트 역시 반대로 구하면 된다. 사실 제곱근도 루트가 아니라.. 2023. 3. 27.