Coursera ML, Lecture 1 : Introduction
What is Machine Learning?
- A. Samuel (1959) : ์ปดํจํฐ๊ฐ
explicitly program
๋์ง ์์ ๋ด์ฉ์ ํ์ตํ๊ฒ ํ๋ ๋ถ์ผ - T. Mitchell (1998) : Task T, Performance measure P, Experience E๊ฐ ์๊ณ , E์ ์ํด P๊ฐ ๋ฐ์ ํ๋ Learning problem.
- Supervised / Unsupervised Learning
- Reinforcement Learning, Recommenders, โฆ
์์ฉ ๋ถ์ผ
- Web search, photo tagging, etcโฆ
- ์ปดํจํฐ์๊ฒ ์ ๊ณต๋๋ ์๋ก์ด ๊ฐ๋ฅ์ฑ - ์ธ๊ฐ์ ์ฌ๊ณ /ํ์ตํ๋ ๋ฐฉ์ ๋ชจ๋ฐฉํ์ฌ ์๋.
- Database mining (web click, medical records, โฆ)
- Computational biology, ์ ์ ์ ๋ถ์ ๋ฑ.
- ์ง์ ํ๋ก๊ทธ๋๋ฐํ ์ ์๋ ๋ฌธ์ ๋ค
- ์์จ์ฃผํ ๊ธฐ์ - How?
- Handwriting recognition
- Natural Language Processing
- Self customizing
- ๊ฐ๋ณ ์ ์ ์ ๋ํด customized๋ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ
- Understanding Brains / Human Learning
- Database mining (web click, medical records, โฆ)
Supervised Learning
- ์ฌ๋ฐ๋ฅธ ์ ๋ต ์ด ์ฃผ์ด์ง๋ Learning problem.
- ์ฌ๋ฐ๋ฅธ ์ ๋ต ์ฒ๋ผ ํ๋ํ๋ ํ๋ก๊ทธ๋จ ๋ง๋ค๊ธฐ.
- ex) ์ฃผํ ๊ฐ๊ฒฉ์ ์์ธก. ์ด๋ป๊ฒ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฒ์ธ๊ฐ?
- ์ผ์ฐจํจ์ ํผํ ? ์ด์ฐจํจ์ ํผํ ?
- Regression Problem (์ฐ์์ ์ธ ๊ฐ ์์ธกํ๊ธฐ)
- ex) ์ข
์ ํฌ๊ธฐ($x$)์ ๋ฐ๋ฅธ ์์ฑ / ์
์ฑ ($y$) ์์ธก.
- Probability ์์ธกํ๊ธฐ.
- Classification Problem (์ด์ฐ์ ์ธ ๊ฐ์ ๋ํ ํ๋ฅ )
- Seperating Line ์ฐพ๊ธฐ.
- ๋ช๊ฐ์ Feature์ ๋ํด ์ฐพ์ ๊ฒ์ธ๊ฐ?
- Support Vector Machine - Infinite number of feature์ ๋ํด์๋ ๋์ํ ์ ์๋ ์ํ์ ์ธ ๋ฐฉ๋ฒ.
Unsupervised Learning
- ์ฌ๋ฐ๋ฅธ ์ ๋ต ์ด ์ฃผ์ด์ง์ง ์๋ Learning Problem
- Clustering algorithm
- ex) Google News : ์๋ง์ ๋ด์ค๋ฅผ AUTOMATICALLY ๊ฐ ์ฃผ์ ๋ณ๋ก ๋ชจ์์ ๋ณด์ฌ์ฃผ๋ ์๋น์ค ์ ๊ณต.
- ex) Genomics : ์ ์ ์ ์ ๋ณด๋ฅผ ์ด์ฉํ clustering
- Astronomical data, SNS Analysis, Computing cluster organizing, Market segmentation โฆ
- ex) Cocktail Party Problem : ๊ฒน์น๋ ๋ชฉ์๋ฆฌ ๊ตฌ๋ถํด ๋ด๋ ๋ฌธ์ .
- ์งง๊ณ ๊ฐ๊ฒฐํ ์ฝ๋๋ก ์ ์๋ฏธํ ๊ฒฐ๊ณผ ๋์ถ ๊ฐ๋ฅ.
- ์ด ๊ฐ์์์๋ Octave ์ด์ฉ.