본문 바로가기

하고 싶은 거 하는 개발/머신러닝

[머신러닝] 머신러닝이란 무엇인가(홍콩과기대 김성훈 교수님 강의)

728x90

 

머신러닝(ML)이란?

개발자가 일일이 지시를 내리지 않고, 프로그램이 스스로 데이터를 보고 학습하는 능력을 가진 프로그램.

학습을 하기 위해서는 데이터가 미리 준비되어야 한다.

 

학습의 종류에는 supervised learning과 unsupervised learning이 있다.

 

Supervised learning 

- learning with labeled example(training set)

  이미 라벨링을 거진 예시(트레이닝 셋)를 가지고 학습하는 것.

  가장 흔한 supervised learning은 이미지 라벨링, 이메일 스팸 필터, 시험 점수 예측 등이 있다.

  알파고(Alpha-Go) 또한 기보를 학습한 것으로 일종의 supervised learning. 

  

시각적 분류를 위한 트레이닝 셋의 예시.

- supervised learing의 종류

  :  1) 공부 시간에 따른 점수 예측( 0 ~ 100점 사이 ) - regression

x(hours) y(score)
10 100
9 90
3 30
2 20

        x가 7로 주어질 경우 y의 값은 70으로 예측할 수 있다.

 

 

     2) 공부 시간에 따른 pass/fail 예측(pass/fail) - binary classification

     

x(hours) y(pass/fail)
10 P
9 P
3 F
2 F

        x가 7로 주어질 경우 y의 값은 P로 예측할 수 있다.

 

 

     3) 공부 시간에 따른 성적 예측(A, B, C, D, E, F 중 하나) - multi-label classification 

         

x(hours) y(grade)
10 A
9 B
7 D
6 E

        x가 8로 주어질 경우 y의 값은 C로 예측할 수 있다.

 

 

Unsupervised learning 

- un-labeled data

  일일이 레이블을 줄 수 없는 경우(유사한 뉴스를 묶는 Google news grouping, 비슷한 단어를 모으는 Word Clustering)

 

 

 

 

출처 : 홍콩과기대 김성훈 교수님 강의(www.youtube.com/watch?v=qPMeuL2LIqY)

 

 

반응형