※'통계 기반 머신러닝' Statistical Machine learning 수업을 듣고 정리한 포스팅입니다.※
머신 러닝이란?
Def. from Arthur Samuel(1959) : Def. from Tom Mitchell(1998) : |
학습의 종류는 크게 다음과 같습니다. 이번 포스팅에서는 지도 학습의 Classification(분류)와 Regression(회귀)에 대해서 포스팅하고자 합니다.
먼저 Statistical Machine learning에서의 Supervised learning,지도학습이 쓰이는 경우는 어떤 경우일까요?
1)Prediction of future cases :
미래의 Input에 대해서 Output(출력)을 예측하는 데 쓰입니다
2)Knowledge extraction :
이해하기 쉬운 규칙(Rule)
3)Compression :
규칙(Rule)이 data 그 자체를 설명하는 것 보다 간단할 때
4)Outlier detection :
규칙(Rule)에 의해서 커버되지 않는 예외 경우들
Supervised Learning의 종류
1. Classification '분류'
말 그대로 주어진 데이터에서 '분류'가 목적일 때 사용합니다. Discrete한 결과를 예측하죠. 많은 예시에서 고양이과 개를 분류하는 것 등의 예시를 사용하지만, Credit scoring을 예로 들어보겠습니다.
예시) Credit scoring
고객들의 수입과 저축현황으로부터 Low-risk(저위험)과 High-risk(고위험)을 구별하는 것
$\mathrm{If}\;\mathrm{income}\;{>\Theta }_1 \;\mathrm{AND}\;\mathrm{savings}>\Theta_2$
$\mathrm{THEN}\;\mathrm{low}-\mathrm{risk}$
$\mathrm{ELSE}\;\mathrm{high}-\mathrm{lisk}$
$\mathrm{END}$
2. Regression '회귀'
회귀는 Classification과 다르게 연속적인 값을 예측 할 때 사용합니다. 아래 그림에서도 Linear한 input과 output의 관계를 가지고 있는 것을 볼 수 있습니다.
예시)x축 년도(age)에 따른 중고차 가격 y 를 나타낼 때
'Statistical Machine learning' 카테고리의 다른 글
[Statistical ML]확률 분포 (2) - Cumulative distributuion function(cdf) (0) | 2021.04.17 |
---|---|
[Statistical ML]확률 분포 - Probability distribution/pmf/pdf (0) | 2021.04.17 |
[Statistical ML]확률의 규칙(Basic probability rules) (0) | 2021.04.17 |
[Statistical ML]Probability - 주변 확률,결합 확률,조건부확률 (0) | 2021.04.17 |
[Statistical ML]Unsupervised learning (0) | 2021.04.17 |