일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Aha Moment
- MegabyteSchool
- MegaCon2022
- 엑셀기초통계
- 메가바이트스쿨
- SQL부분일치
- POP
- Append
- 데이터분석초격차패치지
- SQL부분불일치
- 데이터컨퍼런스
- MegaCon
- 결측값
- 데이터분석초격차패키지
- 스타트업
- K디지털크레딧
- NotNull
- 패스트캠퍼스
- Toss PO SESSION
- Carrying Capacity
- 파이썬
- dropna
- AI컨퍼런스
- 바이트디그리
- index
- 데이터분석인강
- Python
- SQL와일드카드
- K디지털그레딧
- 내일배움카드
- Today
- Total
목록전체 글 (22)
da-ta ta-da
1. 데이터 요약 정보 및 값 확인하기 info() 데이터 프레임 전반적인 정보 요약 rangeIndex(행 길이), columns(열 개수), column 및 column별 Dtype, memory usage(데이터 용량)을 확인 가능 describe() 데이터 프레임의 컬럼별 수치 정보 요약 ▷ 데이터 value가 숫자일 경우: 컬럼별 값 개수, 평균, 표준편차, 최소값, 4분위 수, 최대값 확인 ▷ 데이터 value가 문자일 경우: 컬럼별 값 개수, 고유 값 개수, 최빈값, 최빈값의 빈도 수 확인 head() 데이터 프레임 상위 5개 row 추출, head(n)은 n개 행까지 확인 가능 tail() 데이터 프레임 하위 5개 row 추출, tail(n)은 뒤에서부터 n개 행까지 확인 가능 ✅ usag..

피벗 테이블 피벗 테이블의 열과 행 필드에는 Demension 데이터를, 값 필드에는 Metric 데이터를 끌어와 구성한다. 피벗 테이블의 값 필드 설정을 활용해 기초 통계를 쉽게 확인할 수 있다. 필터 / 슬라이서를 활용해 3차원의 데이터로 확인할 수 있다. Box Plot (상자 수염) Box Plot 차트를 통해 기초 통계를 한눈에 파악할 수 있다. 삽입 > 차트 > 상자수염 이상치, 최대값, 제 3사분위수, 중앙값, 제 1사분위수, 최소값 확인이 가능하다. 이상치: 상자 바깥의 점으로 표현된 부분 최대값: 상자 바깥 선의 가장 위 가로 선으로 표현된 부분 제 3사분위수: 상자의 윗부분 중앙값: 상자 내 선으로 표현된 부분 제 1사분위수: 상자의 아랫부분 최소값: 상자 바깥 선의 가장 아래 가로 선..
탐색적 데이터 분석의 개념 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 주어진 자료를 활용해 충분한 정보를 찾을 수 있도록 하는 분석 방법 기능 데이터 전처리 가이드 기본적인 데이터 info 확인 결측치, 이상치 확인 기초 통계량 수식 합계 | SUM(범위) 중앙값 | MEDIAN(범위) 최대값 | MAX(범위) 최소값 | MIN(범위) 평균 | AVERAGE(범위) 최빈값 | MODE(범위) 분산 | VAR(범위) = STDEV.S(범위) 표준편차 | STDEV(범위) = STDEV.S(범위)