da-ta ta-da

[Python] DataFrame의 기본 정보 확인하기 : info, describe, head, tail, index, columns, values, set 본문

Data Analyst/Python

[Python] DataFrame의 기본 정보 확인하기 : info, describe, head, tail, index, columns, values, set

jess1015 2022. 6. 9. 19:49

1. 데이터 요약 정보 및 값 확인하기

  • info()
    데이터 프레임 전반적인 정보 요약
    rangeIndex(행 길이), columns(열 개수), column 및 column별 Dtype, memory usage(데이터 용량)을 확인 가능
  • describe()
    데이터 프레임의 컬럼별 수치 정보 요약
    ▷ 데이터 value가 숫자일 경우: 컬럼별 값 개수, 평균, 표준편차, 최소값, 4분위 수, 최대값 확인
    ▷ 데이터 value가 문자일 경우: 컬럼별 값 개수, 고유 값 개수, 최빈값, 최빈값의 빈도 수 확인
  • head()
    데이터 프레임 상위 5개 row 추출, head(n)은 n개 행까지 확인 가능
  • tail()
    데이터 프레임 하위 5개 row 추출, tail(n)은 뒤에서부터 n개 행까지 확인 가능
✅ usage
df.info()
df.head()
df.head(n) # 상위 n개의 row 확인 
df.tail()
df.tail(n) # 하위 n개의 row확인

2. 데이터 컬럼, 로우, 값 확인하기

  • columns
    데이터 프레임의 컬럼을 모두 출력
  • index
    데이터 프레임의 로우 개수 출력
  • values 
    데이터 프레임의 값을 array 형태로 출력
✅ usage
df.columns
df.index
df.values

3. 데이터 종류 확인

  • set()
    컬럼, 로우, 값 종류(원소) 확인
✅ usage
set(df)  # 데이터 프레임의 컬럼 종류 확인
set(df['column명'])  # 컬럼 내 모든 값의 종류 확인
set(df.iloc[n])  # n-1번째 로우 값 종류 확인
set(df.loc['index명'])  # index명 로우의 값 종류 확인
set(series)  # 시리즈 내 모든 값의 종류 확인
Comments