데이터분석/Python Pandas

<Python> Pandas 사용하기 [list와 dictionary 자료형의 사용]

창조적생각 2021. 7. 30. 00:29

dictionary 자료형의 형태는 표의 형태와 비슷합니다.

dictionary 자료형의 모습은

이렇게 중괄호 안에 Key 값 : value 값으로 나눠져 있습니다. 마치 자바의 해쉬맵과 흡사한 구조입니다.

 

dictionary 자료형은 key 값에 여러 value 값을 list로 지정할 수 있습니다.

이런식으로 name 이라는 key 값에 김똘칠, 박달달, 홍복길 이라는 value 값을 넣을 수 있습니다.

 

name을 column에 넣고, 김똘칠, 박달달, 홍복길을 그 값으로 넣을 수 있습니다.

name
김똘복
박달달
홍복길

pandas 의 데이터프레임에 dic형 자료 people를 넣으면 pandas에서 표로 만들어 줍니다.

(1) column안의 값 찾기 df['column의 이름']

 

df['address']을 사용하면 address의 값들을 다 출력합니다. dic형 자료형의 key값을 치면, value들이 나오는 것과 같습니다.

 

 

(2) 여러 column안의 값 찾기 df[['age','address']]

 

 두 개 이상의 column 안의 값을 찾으려면 대괄호를 두번 쳐준 후에 찾으려는 column의 이름들을 입력합니다.

 

※대괄호를 하나 입력하면 'age','address'을 하나의 키값으로 인식하기 때문에 오류가 납니다. 반드시 대괄호를 두개 쳐 줘서 list 형으로 들어가야 합니다.

 

 

(3) n번째 row 출력 df.iloc[n]

 

n번째 row 값을 알려면 iloc 나 loc를 사용할 수 있습니다.

먼저 iloc를 보면, 1번째 row를 보려면, df.iloc[0]을 입력하면 됩니다.

여러개의 row를 보고 싶다면 df.iloc[[n,m]] 형식으로 입력하면 됩니다.

1번째 row와 3번째 row를 출력하려면

df.iloc[[0,2]]

1번째 부터 3번째 까지 이어서 출력하고 싶으면

df.iloc[0:3] 입력해줍니다.

df.iloc에서는 보고싶은 컬럼만을 찝어서 볼 수 있습니다. 다만 컬럼의 번호로 입력해야 합니다.

 

df.iloc[0:3,0]

df.iloc[0:3,[0,2]]

df.iloc[0:3,0:3]

df.loc 은 iloc과 달리 column의 이름을 인식할 수 있습니다.

다음은 df.loc 으로 찾은 값들입니다.

 

df.loc[0:3,'name']

df.loc[0:3,['name','address']]

df.loc[0:3,name:address]

오늘은 dic형의 자료형을 pandas를 이용해 표로 변형하는 방법과 dic과 list를 이용해 검색하는 방법에 대해 알아보았습니다.

긴 글 끝까지 읽어봐주셔서 감사합니다. 

지난 시간에 썼던 충북 날씨자료를 통해 자료검색을 하는 사진으로 마무리 하겠습니다. 

728x90