데이터분석/Python Pandas

<Python> pandas 시작하기( pandas 설치, csv 읽기,행과 열 정보 읽기, 데이터 형태 알아내기)

창조적생각 2021. 7. 29. 22:55

Pandas를 사용하기에는 Jupyter notebook을 사용하는 것이 좋습니다.

바로바로 시각화된 자료를 쉽고 깔끔하게 볼 수 있기 때문입니다.

 

1. Pandas 설치하기

pip을 사용하여 pandas를 설치할수 있습니다.

 

pip install pandas

 

2. csv 파일 불러오기

 *공공 데이터 중 충청북도_날씨 현황을 예제로 사용했습니다.

 

(1) pandas를 사용하기에 앞서 pandas를 pd로 import 해 옵니다.

 

import pandas as pd

(2) df 라는 변수에 csv 파일 안의 내용을 저장해 봅시다.

 

df = pd.read_csv('충청북도_날씨 현황_20200930.csv')

*한글로 된 CSV 파일을 불러올 때 는 제대로 불러오지 못하는 현상이 발생할 수 있습니다.

이럴때는 encoding을 직접 지정해주는 방식으로 제대로 불러올 수 있습니다.

encoding ='euc-kr'을 경로 뒤에 붙여줍니다.

 

df = pd.read_csv('충청북도_날씨 현황_20200930.csv',encoding ='euc-kr')

로 한글로 된 CSV 파일을 제대로 불러올 수 있습니다.

영어로 된 CSV 파일이라면 따로 인코딩 해주지 않아도 됩니다.

 

pd.read_csv()는 괄호 안에 있는 경로에 있는 csv 파일을 읽어오는 역할을 합니다.

그리고 csv 파일에 있는 내용을 df에 저장합니다.

 

(3) df를 실행해 보겠습니다.

df

이렇게 안에 들어있는 표가 바로 나옵니다.

 

(4) df.shape

df.shape 는 자료의 column의 수와 row의 수를 보여 줍니다.

이번에 선택한 자료는 column 이 5, row가 11이라서 잘 보입니다. 하지만 이보다 큰 자료이면 df.shape는 더 유용하게 사용 될 수 있습니다.

 

(5) df.info()

df.info()는 데이터들의 형태를 나타내 줍니다.

 

 

 

728x90