dictionary 자료형의 형태는 표의 형태와 비슷합니다.
dictionary 자료형의 모습은
이렇게 중괄호 안에 Key 값 : value 값으로 나눠져 있습니다. 마치 자바의 해쉬맵과 흡사한 구조입니다.
dictionary 자료형은 key 값에 여러 value 값을 list로 지정할 수 있습니다.
이런식으로 name 이라는 key 값에 김똘칠, 박달달, 홍복길 이라는 value 값을 넣을 수 있습니다.
name을 column에 넣고, 김똘칠, 박달달, 홍복길을 그 값으로 넣을 수 있습니다.
name |
김똘복 |
박달달 |
홍복길 |
pandas 의 데이터프레임에 dic형 자료 people를 넣으면 pandas에서 표로 만들어 줍니다.
(1) column안의 값 찾기 df['column의 이름']
df['address']을 사용하면 address의 값들을 다 출력합니다. dic형 자료형의 key값을 치면, value들이 나오는 것과 같습니다.
(2) 여러 column안의 값 찾기 df[['age','address']]
두 개 이상의 column 안의 값을 찾으려면 대괄호를 두번 쳐준 후에 찾으려는 column의 이름들을 입력합니다.
※대괄호를 하나 입력하면 'age','address'을 하나의 키값으로 인식하기 때문에 오류가 납니다. 반드시 대괄호를 두개 쳐 줘서 list 형으로 들어가야 합니다.
(3) n번째 row 출력 df.iloc[n]
n번째 row 값을 알려면 iloc 나 loc를 사용할 수 있습니다.
먼저 iloc를 보면, 1번째 row를 보려면, df.iloc[0]을 입력하면 됩니다.
여러개의 row를 보고 싶다면 df.iloc[[n,m]] 형식으로 입력하면 됩니다.
1번째 row와 3번째 row를 출력하려면
df.iloc[[0,2]]
1번째 부터 3번째 까지 이어서 출력하고 싶으면
df.iloc[0:3] 입력해줍니다.
df.iloc에서는 보고싶은 컬럼만을 찝어서 볼 수 있습니다. 다만 컬럼의 번호로 입력해야 합니다.
df.iloc[0:3,0]
df.iloc[0:3,[0,2]]
df.iloc[0:3,0:3]
df.loc 은 iloc과 달리 column의 이름을 인식할 수 있습니다.
다음은 df.loc 으로 찾은 값들입니다.
df.loc[0:3,'name']
df.loc[0:3,['name','address']]
df.loc[0:3,name:address]
오늘은 dic형의 자료형을 pandas를 이용해 표로 변형하는 방법과 dic과 list를 이용해 검색하는 방법에 대해 알아보았습니다.
긴 글 끝까지 읽어봐주셔서 감사합니다.
지난 시간에 썼던 충북 날씨자료를 통해 자료검색을 하는 사진으로 마무리 하겠습니다.
'데이터분석 > Python Pandas' 카테고리의 다른 글
<Python Pandas> 5.Column 이름과 Rows 변경하기 1 (0) | 2021.08.03 |
---|---|
<Python Pandas> 4. 중간점검 공공 데이터에 적용해보기 (0) | 2021.08.02 |
<Pandas 사용하기> 3.검색 필터 작성하기 [1] (0) | 2021.08.01 |
pandas 사용하기 2 index 바꾸기 (df.set_index()) (0) | 2021.07.30 |
<Python> pandas 시작하기( pandas 설치, csv 읽기,행과 열 정보 읽기, 데이터 형태 알아내기) (0) | 2021.07.29 |