Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 바이트디그리
- 데이터컨퍼런스
- 메가바이트스쿨
- 패스트캠퍼스
- MegabyteSchool
- 내일배움카드
- K디지털크레딧
- 데이터분석초격차패치지
- index
- Aha Moment
- Toss PO SESSION
- Append
- Python
- 데이터분석초격차패키지
- Carrying Capacity
- MegaCon
- 데이터분석인강
- 엑셀기초통계
- 파이썬
- POP
- AI컨퍼런스
- 스타트업
- dropna
- K디지털그레딧
- 결측값
- MegaCon2022
- SQL부분일치
- NotNull
- SQL부분불일치
- SQL와일드카드
Archives
- Today
- Total
da-ta ta-da
데이터 분석 인강 3주차 : Pandas 본문
1. Pandas
- pandas(python data analysis)는 데이터 처리에 특화되어 있으며, 데이터 분석에서 필수적으로 사용된다.
- numpy array를 베이스로 파이썬과 시너지를 내므로 고성능 데이터 처리에 유용하다.
- 방대한 양의 데이터를 excel보다 훨씬 빠르고 간단하게 처리할 수 있다.
- pandas의 data 단위: DataFrame
import pandas as pd
import numpy as np
print(pd.__version__) # 판다스 버전 확인 코드
2. Serise, DataFrame
- series = 테이블의 한 줄 (행/열 로 구성)
- DataFrame = series의 모임
- date_rage 함수: date를 원하는 기간만큼 출력해준다.
date = pd.date_range('20220101', period = (6)) # 20220101 부터 20220106까지 index로 출력
s = pd.series([1, 3, 5, 7, 9]) # series 생성
df = pd.DataFrame(np.random.randn(6, 4), index = dates, columns = ['A', 'B', 'C', 'D']) # index가 dates고, column이 A, B, C, D,인 6 x 4 dataframe 생성
3. DataFrame Method
- df.head(), df.tail(), df.index, df.values, df.info(). df.describe(), df.sort_values 등이 있다.
4. indexing
- DataFrame은 기본적으로 dictionary 타입, ∴ Column이름을 활용해 Indexing이 가능하다.
- DataFrame Indexing에는 loc(location), iloc(integer location) method를 사용한다.
df.loc[name] # 해당 dataframe의 label 값으로 접근
df.iloc[number] # 해당 dataframd의 index 값으로 접근
df.loc['2022-01-03'] # 2022-01-03 raw 출력
df.loc[:, "B"] # B column 출력
df.iloc[2] # 세번째 row 출력
df.iloc[:, 2] # 세번째 column 출력
5. masking
- [출력할 dataframe 전체][masking할 dataframe의 조건] 형태
- isin method: df.isin(value) 데이터 프레임의 요소가 각 value에 해당하는지의 여부를 T/F(bool 형식)으로 반환
df['A'][df['A']>0] # df['A']가 데이터 프레임, df['A']>0이 마스킹 조건
'Data Analyst' 카테고리의 다른 글
데이터 분석 인강 3주차 : 데이터 시각화 분석 실전 (0) | 2022.05.08 |
---|---|
데이터 분석 인강 3주차 : Seaborn (0) | 2022.05.08 |
데이터 분석 인강 2주차 : Numpy (0) | 2022.05.01 |
데이터 분석 인강 2주차 : 데이터 분석 도구 Python (0) | 2022.05.01 |
데이터 분석 인강 1주차 : 데이터 분석 도구 Python (0) | 2022.04.24 |
Comments