Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- compile time
- 윈도우 커맨드창
- AIFFEL 회고
- 마크다운 인라인 수식
- 아이펠
- 마크다운
- 런타임
- 아이펠 일기
- Markdown
- 파이썬 여러줄 주석
- 파이썬 긴 문자열 변수
- 파이썬 여러줄 문자열 변수
- AIFFEL일기
- 리눅스
- AIFFEL 일기
- 마크다운 inline 수식
- 파이썬 문법
- Linux
- python 문법
- 컴파일타임
- 파이썬 형변환
- 파이썬
- 아이펠 회고
- 파이썬 주석 변수
- 파이썬 진수변환
- Aiffel
- PYTHON 주석 변수
- 모듈 패키지 라이브러리
- Python
- 아이펠일기
Archives
- Today
- Total
튜토리얼에도 고난과 역경이 있다.
데이터 전처리) 결측치 처리 방법 본문
728x90
결측치 Missing Data란?
결측값은 입력이 누락된 값을 의미합니다. 즉, 누락된 값을 의미합니다. = 입력칸이 있는데 null인 값.
결측치 처리하는 방법
- 결측치 데이터를 제거
- 데이터가 너무 없어서 무쓸모일것 같다 -> 제거
- 결측치를 어떤 값으로 대체
- 데이터가 대부분 유효한 값이 있는데 한 두가지만 없다 -> 대체
결측치 데이터를 제거
drop 메소드를 이용.
결측치 데이터를 대체
- 수치형 데이터의 경우 대체 방법 4가지
- 특정 값으로 설정
- 결측치가 많은 경우, 모두 특정값으로 대체하면 분산이 작아지는 경우가 발생할 수 있음
- 평균 / 중앙 값으로 설정
- 결측치가 많은 경우, 분산이 작아지는 경우가 발생 가능
- 다른 데이터를 이용한 예측값으로 설정
- Q. Gan을 이용하나?
- 시계열 데이터의 경우 앞 뒤 데이터를 이용하여 데이터 설정
- ex. 전 후 데이터의 평균으로 보완
- 범주형 데이터인 경우
- 특정 값으로 설정
- 기타 / 결측 과 같이 새로운 범주를 만들어 결측치를 채움
- 최빈 값 등으로 대체
- 결측치가 많은 경우 적합하지 않음
- 다른 데이터를 이용한 예측값사용
- 시계열 데이터의 경우 앞 뒤 데이터를 이용하여 데이터 설정
출처
- AIFFEL LMS
반응형
'나의 공부 > 인공지능' 카테고리의 다른 글
[fd_18] 딥러닝 들여다보기 (0) | 2022.01.22 |
---|---|
[fd_16] 파이썬으로 이미지 다루기 (0) | 2022.01.20 |
데이터 전처리의 다양한 기법 (0) | 2022.01.19 |
강화학습 ) 1강. Introdution to Reinforcement Learning (0) | 2022.01.12 |
데이터 전처리) 이상치란? Outlier? (0) | 2022.01.03 |