데이터가 어떤 그룹에 속하는지 범주로 분류하여 예측하는데 사용하는 기법
# 분류분석 VS 예측분석
공통점 | 레코드의 특정 속성의 값을 미리 알아맞힌다. |
차이점 | 분류 : 레코드(튜플)의 범주형 속성의 값을 알아맞히는 것 예측 : 레코드(튜플)의 연속형 속성의 값을 알아맞히는 것 |
※ 예측분석은 시계열 분석처럼 시간에 따른 값 두개만을 이용해 앞으로의 매출, 온도 등을 예측하는 것
여러 개의 다양한 설명변수(독립변수)가 아닌, 한 개의 설명변수로 생각하면됨
모델링을 하는 입력 데이터가 어떤 것인지에 따라 특성이 다름
분류 분석의 예 | 예측 분석의 예 |
학생들의 국어, 영어, 수학 점수를 통해 내신등급 맞히기 | 학생들의 여러가지 정보를 입력해 수능점수 예측 |
카드회사가 가입정보를 통해 1년 후 신용등급 예측 | 카드회사 회원의 가입정보를 통해 연매출액 예상 |
분류 모델을 개발할 때에는 train data와 test data로 구분지어 모델링
[개미의 걸음 scikit-learn 4차시] 의사결정트리 실습(with iris) (0) | 2021.02.04 |
---|---|
[개미의 걸음 scikit-learn 3차시] Classification① 의사결정트리(Decision Tree)의 이해 (0) | 2021.02.03 |
[개미의 걸음 scikit-learn 1차시] 사이킷런의 이해 (0) | 2021.02.01 |
[개미의 걸음 Pandas 9차시] 데이터 제거(drop) (0) | 2021.01.09 |
[개미의 걸음 Pandas 8차시] 인덱스 지정(.index, set_index, reset_index, .index +1) (0) | 2021.01.08 |
댓글 영역