머신러닝(ML)이란?
개발자가 일일이 지시를 내리지 않고, 프로그램이 스스로 데이터를 보고 학습하는 능력을 가진 프로그램.
학습을 하기 위해서는 데이터가 미리 준비되어야 한다.
학습의 종류에는 supervised learning과 unsupervised learning이 있다.
Supervised learning
- learning with labeled example(training set)
이미 라벨링을 거진 예시(트레이닝 셋)를 가지고 학습하는 것.
가장 흔한 supervised learning은 이미지 라벨링, 이메일 스팸 필터, 시험 점수 예측 등이 있다.
알파고(Alpha-Go) 또한 기보를 학습한 것으로 일종의 supervised learning.
- supervised learing의 종류
: 1) 공부 시간에 따른 점수 예측( 0 ~ 100점 사이 ) - regression
x(hours) | y(score) |
10 | 100 |
9 | 90 |
3 | 30 |
2 | 20 |
x가 7로 주어질 경우 y의 값은 70으로 예측할 수 있다.
2) 공부 시간에 따른 pass/fail 예측(pass/fail) - binary classification
x(hours) | y(pass/fail) |
10 | P |
9 | P |
3 | F |
2 | F |
x가 7로 주어질 경우 y의 값은 P로 예측할 수 있다.
3) 공부 시간에 따른 성적 예측(A, B, C, D, E, F 중 하나) - multi-label classification
x(hours) | y(grade) |
10 | A |
9 | B |
7 | D |
6 | E |
x가 8로 주어질 경우 y의 값은 C로 예측할 수 있다.
Unsupervised learning
- un-labeled data
일일이 레이블을 줄 수 없는 경우(유사한 뉴스를 묶는 Google news grouping, 비슷한 단어를 모으는 Word Clustering)
출처 : 홍콩과기대 김성훈 교수님 강의(www.youtube.com/watch?v=qPMeuL2LIqY)
'하고 싶은 거 하는 개발 > 머신러닝' 카테고리의 다른 글
[머신러닝] 머신러닝 유튜브 강의(홍콩과기대 김성훈 교수님 강의) (0) | 2021.02.26 |
---|