본문 바로가기

데이터 사이언스 /Pandas 판다스

판다스1. Pandas 시작하기 / 시리즈 Series

Pandas (판다스)
Pandas 는 데이터분석 라이브러리입니다. 

판다스 코드는 Jupyter Notebook으로 실행시킵니다. 판다스에서 주로 사용하는 자료구조는 Series 와 DataFrame 입니다.

Series 1차원 자료 , DataFrame2차원 자료, 그리고 판다스에서는 3차원까지 커버 가능한데 주로 1-2차원을 사용합니다. 



우선, 주피터 노트북과 판다스를 사용하려면 다운을 받아야 합니다. 


주피터 노트북 다운 http://jupyter.org/ 

-> 맥북에서는 터미널에서 , 윈도우에서는 커맨드창에서 ' Jupyter notebook '을 치면 주피터 노트북이 실행됩니다. )


판다스도 다운받습니다. https://pandas.pydata.org/ 




주피터 노트북과 판다스가 모두 준비되었으면 판다스를 사용해봅시다. 

판다스를 import 해줍니다. 



1
2
3
4
import pandas as pd
 
cs




이제, 판다스의 자료구조 중 하나인, Series(시리즈)를 파악해봅시다. 

시리즈 Series

ㄱ. 선언법 : pd.Series(리스트

** 주의할 점은, S가 대문자여야 합니다. 
1
mink = pd.Series([1,2,3,4,5])
cs


ㄴ. 인덱스 함께 선언하는 방법 : pd.Series([리스트], index=[리스트])

1
mink2 = pd.Series([1,2,3,4,5], index = ['a','b','c','d','e'])
cs


--------------------------------------------------------------------------------------
활용해봅니다.  


ㄱ) 시리즈 선언법



** 위와 같이 인덱스를 선언해주지 않으면 판다스에서 자동으로 0부터 인덱스를 선언해줍니다. 





ㄴ) .index 를 사용하여 인덱스를 불러오기 


ㄷ) 인덱스 선언하기 (바꿀 때도 사용)






ㄹ) 파이썬 딕셔너리를 사용해서 인덱스와 값을 나타내기 


파이썬 딕셔너리 자료형으로 판다스 시리즈를 만들 수 있습니다. 이때 , 딕셔너리의 key가 인덱스가 됩니다.