데이터분석 3

외부 파일 읽어오기 - 2 (Excel, JSON)

이번 글에서는 Excel과 JSON 파일을 읽어오는 방법을 알아보고자 한다. Excel과 JSON 파일은 앞에서 살펴본 CSV와 읽어오는 방법이 거의 비슷하다. Excel 파일 읽어오기 Excel 파일의 행과 열은 데이터프레임의 행, 열로 일대일 대응된다. read_excel() 함수의 사용법은 앞에서 살펴본 read_csv() 함수와 거의 비슷하다. header, index_col 등 대부분의 옵션을 그대로 사용할 수 있다. Excel 파일 -> 데이터프레임: pandas.read.excel("파일 경로(이름)") 다음의 Excel 파일은 남북한의 발전량을 정리한 통계자료이다. header 옵션을 달리한 두 가지 df1, df2를 출력하는 코드입니다. import pandas as pd file_pat..

외부 파일 읽어오기- 1 (CSV)

이번 글에서는 CSV파일을 읽어오는 방법을 알아보고자 한다. CSV(comma separated values) 파일은 데이터 값을 쉼표(,)로 구분하는 파일이다. 쉼표(,)로 열을 구분하고 줄바꿈으로 행을 구분한다. 판다스 read_csv() 함수에 확장자(.csv)를 포함하여 파일 경로(파일명)를 입력하면 CSV 파일을 읽어와서 데이터프레임으로 변환한다. CSV 파일 -> 데이터프레임: pandas.read_csv("파일 경로(이름)") CSV 파일을 읽어올 때 추가적으로 행과 열 이름값 설정을 할 수 있다. header는 열 이름으로 사용할 행을 지정하는 옵션이다. pandas.read_csv("파일 경로(이름)", header=?)에서 ?에 1을 넣으면 1행을 열 이름으로 지정한다. 기본값은 0이며..

데이터프레임(Data Frame) 연산

이번 글에서는 데이터프레임 연산에 대해서 알아보고자 한다. 데이터프레임은 여러 시리즈가 모인 것이므로 시리즈 연산을 확장하는 개념으로 이해하는 것이 좋다. 행/열 인덱스를 기준으로 정렬하고 일대일 대응되는 원소끼리 연산을 처리한다. 데이터프레임 연산은 크게 2가지가 존재한다. 1. 데이터프레임 vs 숫자 2. 데이터프레임 vs 데이터프레임 데이터프레임 vs 숫자 데이터프레임과 숫자 연산: DataFrame 객체 + 연산자(+, -, *, /) + 숫자 시리즈 vs 숫자 연산과 똑같다. 데이터프레임에 어떤 숫자를 더하면 모든 원소에 숫자를 더한다. 덧셈, 뺄셈, 곱셈, 나눗셈 모두 가능하며 기존 데이터프레임의 형태를 그대로 유지한 채 원소 값만 새로운 계산 값으로 바뀐다. 새로운 데이터프레임 객체로 반환되..