Pandas를 사용하기에는 Jupyter notebook을 사용하는 것이 좋습니다.
바로바로 시각화된 자료를 쉽고 깔끔하게 볼 수 있기 때문입니다.
1. Pandas 설치하기
pip을 사용하여 pandas를 설치할수 있습니다.
pip install pandas
2. csv 파일 불러오기
*공공 데이터 중 충청북도_날씨 현황을 예제로 사용했습니다.
(1) pandas를 사용하기에 앞서 pandas를 pd로 import 해 옵니다.
import pandas as pd
(2) df 라는 변수에 csv 파일 안의 내용을 저장해 봅시다.
df = pd.read_csv('충청북도_날씨 현황_20200930.csv')
*한글로 된 CSV 파일을 불러올 때 는 제대로 불러오지 못하는 현상이 발생할 수 있습니다.
이럴때는 encoding을 직접 지정해주는 방식으로 제대로 불러올 수 있습니다.
encoding ='euc-kr'을 경로 뒤에 붙여줍니다.
df = pd.read_csv('충청북도_날씨 현황_20200930.csv',encoding ='euc-kr')
로 한글로 된 CSV 파일을 제대로 불러올 수 있습니다.
영어로 된 CSV 파일이라면 따로 인코딩 해주지 않아도 됩니다.
pd.read_csv()는 괄호 안에 있는 경로에 있는 csv 파일을 읽어오는 역할을 합니다.
그리고 csv 파일에 있는 내용을 df에 저장합니다.
(3) df를 실행해 보겠습니다.
df
이렇게 안에 들어있는 표가 바로 나옵니다.
(4) df.shape
df.shape 는 자료의 column의 수와 row의 수를 보여 줍니다.
이번에 선택한 자료는 column 이 5, row가 11이라서 잘 보입니다. 하지만 이보다 큰 자료이면 df.shape는 더 유용하게 사용 될 수 있습니다.
(5) df.info()
df.info()는 데이터들의 형태를 나타내 줍니다.
'데이터분석 > Python Pandas' 카테고리의 다른 글
<Python Pandas> 5.Column 이름과 Rows 변경하기 1 (0) | 2021.08.03 |
---|---|
<Python Pandas> 4. 중간점검 공공 데이터에 적용해보기 (0) | 2021.08.02 |
<Pandas 사용하기> 3.검색 필터 작성하기 [1] (0) | 2021.08.01 |
pandas 사용하기 2 index 바꾸기 (df.set_index()) (0) | 2021.07.30 |
<Python> Pandas 사용하기 [list와 dictionary 자료형의 사용] (0) | 2021.07.30 |