s t u d y . . ๐Ÿง/AI ์•ค ML ์•ค DL

[ML ์ด๋ก ] ๊ธฐ๊ณ„ํ•™์Šต์ด๋ž€

H J 2023. 5. 1. 17:46

๊ธฐ๊ณ„ ํ•™์Šต ๊ฐœ๋…

๊ธฐ๊ณ„ํ•™์Šต์€ ์˜ˆ์ธก ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐ

  • ํšŒ๊ท€ regression : ์‹ค์ˆซ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ
  • ๋ถ„๋ฅ˜ classification : ๋ถ€๋ฅ˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ

๊ธฐ๊ณ„ ํ•™์Šต์ด๋ž€ ๊ฐ€์žฅ ์ •ํ™•ํ•˜๊ฒŒ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋Š” ์ตœ์ ์˜ ๋งค๊ฐœ๋ณ€์ˆซ๊ฐ’์„ ์ฐพ๋Š” ์ž‘์—…์ž„

 

1. ํ•™์Šต (์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋ฉฐ ์ตœ์ ์˜ ์ƒํƒœ์— ๋„๋‹ฌํ•˜๋Š” ์ž‘์—… 

2. ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ์˜ˆ์ธก

 

ํ›ˆ๋ จ์ง‘ํ•ฉ์œผ๋กœ ๋ชจ๋ธ ํ•™์Šต → ํ…Œ์ŠคํŠธ์ง‘ํ•ฉ์œผ๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์ธก์ • ⇒ ๋ชจ๋ธ์„ ๋…๋ฆฝ์ ์œผ๋กœ ํ•™์Šต์‹œํ‚จ ํ›„ ๊ฐ€์žฅ ์ข‹์€ ๋ชจ๋ธ์„ ์„ ํƒ

 

์ตœ์ข… ๋ชฉํ‘œ๋Š” ํ›ˆ๋ จ์ง‘ํ•ฉ์— ์—†๋Š” ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ(ํ…Œ์ŠคํŠธ ์ง‘ํ•ฉ)์— ๋Œ€ํ•œ ์˜ค๋ฅ˜๋ฅผ ์ตœ์†Œํ™” + ๋†’์€ ์„ฑ๋Šฅ ๋ณด์žฅํ•˜๋Š” ๊ฒƒ → ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ

 

ํŠน์ง• ๊ณต๊ฐ„ ๋ณ€ํ™˜๊ณผ ํ‘œํ˜„ ํ•™์Šต

๊ธฐ๊ณ„ ํ•™์Šต์€ ์ข‹์€ ํŠน์ง• ๊ณต๊ฐ„์„ ์ฐพ์•„๋‚ด๋Š” ์ž‘์—… ์ค‘์š”

ใ„ด ํ‘œํ˜„ ํ•™์Šต(representation learning) : ์ข‹์€ ํŠน์ง• ๊ณต๊ฐ„์„ ์ž๋™์œผ๋กœ ์ฐพ๋Š” ์ž‘์—…

 

๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ์ค‘์š”์„ฑ

๊ธฐ๊ณ„ ํ•™์Šต์€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์˜ ํ’ˆ์งˆ์ด ์ค‘์š”

ใ„ด ํ›ˆ๋ จ์ง‘ํ•ฉ์„ ์ด์šฉํ•ด ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๊ณผ์ •์„ ์—ญ์œผ๋กœ ์ถ”์ฒญ ํ•˜๋Š” ๋ฌธ์ œ์ด๊ธฐ ๋•Œ๋ฌธ

 

๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ํฌ๊ธฐ์™€ ๊ธฐ๊ณ„ ํ•™์Šต ์„ฑ๋Šฅ

๋ฐฉ๋Œ€ํ•œ ๊ณต๊ฐ„์—์„œ ์‹ค์ œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ๊ณณ์€ ํ›จ์”ฌ ์ž‘์€ ๋ถ€๋ถ„์ž„

๋งค๋‹ˆํด๋“œ ๊ฐ€์ • : ๋ฐœ์ƒํ•˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์‹ฌํ•œ ๋ณ€ํ™”๋ฅผ ๊ฒช์ง€๋งŒ ์ผ์ •ํ•œ ๊ทœ์น™์— ๋”ฐ๋ผ ๋งค๋„๋Ÿฝ๊ฒŒ ๋ณ€ํ•จ

 

๋ชฉ์ ํ•จ์ˆ˜(objective function)

์ง์„ ์„ ์›€์ง์ด๋Š” ๋™๋ ฅ

ใ„ด ๊ธฐ๊ณ„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ชฉ์ ํ•จ์ˆซ๊ฐ’์ด ์ž‘์•„์ง€๋Š” ๋ฐฉํ–ฅ์„ ์ฐพ์•„ ๋งค๊ฐœ๋ณ€์ˆซ๊ฐ’ ์กฐ์ • ๋ฐ˜๋ณต

  • ์ˆ˜์น˜์  ๋ฐฉ๋ฒ•(numerical method) : ์ž‘์€ ๊ฐœ์„ ์„ ๋ฐ˜๋ณตํ•˜๋ฉฐ ์ตœ์ ํ•ด๋ฅผ ์ฐพ์•„๊ฐ€๋Š” ๋ฐฉ๋ฒ•
  • ๋ถ„์„์  ๋ฐฉ๋ฒ•(analytical method) : ์œ ๋„ํ•œ ์‹์— ํ›ˆ๋ จ์ง‘ํ•ฉ์˜ ์ƒ˜ํ”Œ์„ ๋Œ€์ž…ํ•ด ํ•œ๊บผ๋ฒˆ์— ์ตœ์ ํ•ด๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•

 

๊ณผ์†Œ์ ํ•ฉ๊ณผ ๊ณผ์ž‰์ ํ•ฉ

๊ณผ์†Œ์ ํ•ฉ(underfitting) : ๋ชจ๋ธ์˜ ์šฉ๋Ÿ‰์ด ์ž‘์€ ๊ฒฝ์šฐ ๋“ฑ๋“ฑ ํฐ ์˜ค์ฐจ๊ฐ€ ์ƒ๊น€ (์ง์„  ๋ชจ๋ธ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ง์„ ์„ ์ด๋ฃจ๋Š” ๊ฒฝ์šฐ์—๋งŒ ์ˆ˜์šฉ ๊ฐ€๋Šฅ)

→ ๋น„์„ ํ˜• ๋ชจ๋ธ์„ ์‚ฌ์šฉ

๊ณผ์ž‰์ ํ•ฉ(overfitting) : ๋ชจ๋ธ์˜ ์šฉ๋Ÿ‰์ด ๋„ˆ๋ฌด์ปค์„œ ์•„์ฃผ ์ž‘์€ ์žก์Œ๊นŒ์ง€ ์ˆ˜์šฉํ•จ (ํ›ˆ๋ จ์ง‘ํ•ฉ์€ ์™„์ „ํžˆ ๋Œ€๋ณ€ํ•˜์ง€๋งŒ ์ƒˆ๋กœ์šด ์ ์€ ์ œ๋Œ€๋กœ ์˜ˆ์ธกํ•˜์ง€ ๋ชปํ•จ)

 

๋ฐ”์ด์–ด์Šค์™€ ๋ถ„์‚ฐ

๋ฐ”์ด์–ด์Šค(bias)๊ฐ€ ํฌ๋‹ค : ๋ฐ์ดํ„ฐ์™€ ๋ชจ๋ธ ์‚ฌ์ด์— ํฐ ์ฐจ์ด๊ฐ€ ์žˆ์Œ

๋ถ„์‚ฐ(variance)์ด ์ž‘๋‹ค : ํ›ˆ๋ จ์ง‘ํ•ฉ์ด ๋ฐ”๋€Œ๋”๋ผ๋„ ํ•™์Šต ๊ฒฐ๊ณผ๋กœ ์–ป์€ ๊ณก์„ ๋“ค์ด ๋น„์Šทํ•จ

๋‹จ์ˆœํ•œ ๋ชจ๋ธ์ผ์ˆ˜๋ก ๋ฐ”์ด์–ด์Šค๋Š” ํฌ๊ณ  ๋ถ„์‚ฐ์€ ์ž‘์Œ

๋ณต์žกํ•œ ๋ชจ๋ธ์ผ์ˆ˜๋ก ๋ฐ”์ด์–ด์Šค๋Š” ์ž‘๊ณ  ๋ถ„์‚ฐ์€ ํผ

 

๋ฐ”์ด์–ด์Šค์™€ ๋ถ„์‚ฐ์€ tradeoff ๊ด€๊ณ„ → ๋ฐ”์ด์–ด์Šค์˜ ํฌ์ƒ์„ ์ตœ์†Œ๋กœ ์œ ์ง€ํ•˜๋ฉฐ ๋ถ„์‚ฐ์„ ์ตœ๋Œ€๋กœ ๋‚ฎ์ถ”์–ด์•ผ ํ•จ

 

๊ฒ€์ฆ์ง‘ํ•ฉ๊ณผ ๊ต์ฐจ๊ฒ€์ฆ์„ ์ด์šฉํ•œ ๋ชจ๋ธ ์„ ํƒ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๊ฒ€์ฆ์ง‘ํ•ฉ (validation set)

๋ชจ๋ธ์„ ๋น„๊ตํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•  ๋ณ„๋„์˜ ๋ฐ์ดํ„ฐ์ง‘ํ•ฉ

 

๊ฒ€์ฆ์ง‘ํ•ฉ์ด ์—†์„ ๋•Œ ๊ต์ฐจ๊ฒ€์ฆ(cross-validation)์„ ์‚ฌ์šฉํ•˜๋ฉด ํšจ๊ณผ์ ์ž„

 

๊ต์ฐจ๊ฒ€์ฆ (cross-validation)

ํ›ˆ๋ จ์ง‘ํ•ฉ์„ ๋“ฑ๋ถ„ํ•ด ํ•™์Šต๊ณผ ํ‰๊ฐ€๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ๋ฐ˜๋ณตํ•œ ํ›„ ํ‰๊ท  ์‚ฌ์šฉ

๋ถ€ํŠธ์ŠคํŠธ๋žฉ boot strap

๋‚œ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์ƒˆ๋กœ์šด ํ›ˆ๋ จ์ง‘ํ•ฉ ์ƒ˜ํ”Œ๋ง (๋Œ€์น˜ ํ—ˆ์šฉ → ๊ฐ™์€ ์ƒ˜ํ”Œ์ด ์—ฌ๋Ÿฌ ๋ฒˆ ๋ฝ‘ํž ์ˆ˜ ์žˆ์Œ)

ํ˜„์‹ค์ ์ธ ํ•ด๊ฒฐ์ฑ…

์šฉ๋Ÿ‰์ด ์ถฉ๋ถ„ํžˆ ํฐ ๋ชจ๋ธ ์„ ํƒ → ์„ ํƒํ•œ ๋ชจ๋ธ์ด ์ •์ƒ์„ ๋ฒ—์–ด๋‚˜์ง€ ์•Š๋„๋ก ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๊ทœ์ œ(regularization) ๊ธฐ๋ฒ•์„ ์ ์šฉํ•˜๋Š” ํ˜„์‹ค์ ์ธ ์ ‘๊ทผ๋ฐฉ๋ฒ• ์ฑ„ํƒ

 

๊ธฐ๊ณ„ ํ•™์Šต ์œ ํ˜•

1. ์ง€๋„ ๋ฐฉ์‹์— ๋”ฐ๋ฅธ ์œ ํ˜•

  • ์ง€๋„ ํ•™์Šต (supervised learning)
    • ๋ฐ์ดํ„ฐ๊ฐ€ ์ž…๋ ฅ(ํŠน์ง• ๋ฒกํ„ฐ)๊ณผ ์ถœ๋ ฅ(๋ชฉํ‘ฏ๊ฐ’) ์Œ์œผ๋กœ ์ฃผ์–ด์ง
    • ํšŒ๊ท€, ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์Œ
  • ๋น„์ง€๋„ ํ•™์Šต (unsupervised learning)
    • ์ž…๋ ฅ(ํŠน์ง• ๋ฒกํ„ฐ)๋งŒ ์ฃผ์–ด์ง€๊ณ  ์ถœ๋ ฅ(๋ชฉํ‘ฏ๊ฐ’)์€ ์ฃผ์–ด์ง€์ง€ ์•Š์Œ
    • ๊ตฐ์ง‘ํ™” ๊ณผ์—… : ํŠน์ง• ๊ณต๊ฐ„์—์„œ ๊ฐ€๊นŒ์ด ์žˆ๋Š” ์ƒ˜ํ”Œ์„ ๊ฐ™์€ ๊ตฐ์ง‘์œผ๋กœ ๋ชจ์œผ๋Š” ์ž‘์—…
    • ๋ฐ€๋„ ์ถ”์ •, ํŠน์ง• ๊ณต๊ฐ„ ๋ณ€ํ™˜ ๊ณผ์—…
  • ๊ฐ•ํ™” ํ•™์Šต (reinforcement learning)
    • ์ถœ๋ ฅ(๋ชฉํ‘ฏ๊ฐ’)์„ ์ฃผ์–ด ์ง€๋„ํ•˜๋Š”๋ฐ ๋ชฉํ‘ฏ๊ฐ’์˜ ํ˜•ํƒœ๊ฐ€ ์ง€๋„ ํ•™์Šต๊ณผ ๋‹ค๋ฆ„
    • ์ง€๋„ ํ•™์Šต - ์ƒ˜ํ”Œ๋งˆ๋‹ค ๋ชฉํ‘ฏ๊ฐ’์„ ์คŒ / ๊ฐ•ํ™” ํ•™์Šต - ๊ฒŒ์ž„์ด ๋‹ค ๋๋‚œ ํ›„ ์Šน, ํŒจ ๋˜๋Š” ์ ์ˆ˜๋ฅผ ๋ชฉํ‘ฏ๊ฐ’์œผ๋กœ ์คŒ → ์—ฐ์†๋œ ์ƒ˜ํ”Œ์˜ ์—ด์— ๋ชฉํ‘ฏ๊ฐ’ ํ•˜๋‚˜๋งŒ ์คŒ
    • ์ƒ˜ํ”Œ ์—ด์— ์†ํ•œ ๊ฐ๊ฐ์˜ ์ƒ˜ํ”Œ์— ๋ชฉํ‘ฏ๊ฐ’์„ ๋ฐฐ๋ถ„ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ•„์š”
  • ์ค€์ง€๋„ ํ•™์Šต (semi-supervised learning)
    • ์ผ๋ถ€๋Š” ์ž…๋ ฅ์— ํ•ด๋‹นํ•˜๋Š” X, ์ถœ๋ ฅ์— ํ•ด๋‹นํ•˜๋Š” Y๋ฅผ ๊ฐ€์ง€์ง€๋งŒ, ๋‚˜๋จธ์ง€๋Š” X๋งŒ ๊ฐ€์ง„ ์ƒํ™ฉ
    • X๋ฅผ ๋ชจ์œผ๋Š” ์ผ์€ ์‰ฝ์ง€๋งŒ ๋ชฉํ‘ฏ๊ฐ’ Y๋ฅผ ๋ถ€์—ฌํ•˜๋Š” ์ผ์€ ๋น„์šฉ์ด ๋งŽ์ด ๋“ฆ

2. ๋‹ค์–‘ํ•œ ๊ธฐ์ค€์— ๋”ฐ๋ฅธ ์œ ํ˜•

  • ์˜คํ”„๋ผ์ธ ํ•™์Šต๊ณผ ์˜จ๋ผ์ธ ํ•™์Šต
    • ์˜คํ”„๋ผ์ธ ํ•™์Šต : ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ˆ˜์ง‘, ํ•™์Šต, ์„ค์น˜ ํ›„ ์˜ˆ์ธก
    • ์˜จ๋ผ์ธ ํ•™์Šต : ์ธํ„ฐ๋„ท์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ ๋ฐœ์ƒ + ์ถ”๊ฐ€ ํ•™์Šต → ์„ฑ๋Šฅ ๊ฐœ์„ 
  • ๊ฒฐ์ •๋ก ์  ํ•™์Šต๊ณผ ์Šคํ† ์บ์Šคํ‹ฑ ํ•™์Šต
    • ๋Œ€๋ถ€๋ถ„์€ ๊ฒฐ์ •๋ก ์ 
    • ๊ฒฐ์ •๋ก ์  ํ•™์Šต : ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋กœ ๋‹ค์‹œ ํ•™์Šตํ•˜๋ฉด ํ•ญ์ƒ ๊ฐ™์€ ์˜ˆ์ธก๊ธฐ ๋งŒ๋“ค์–ด์ง (๋‚œ์ˆ˜๋กœ ์ดˆ๊นƒ๊ฐ’์„ ์„ค์ •ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋‹ค๋ฅธ ์˜ˆ์ธก๊ธฐ๊ฐ€ ๋งŒ๋“ค์–ด์งˆ ๋ฟ)
    • ์Šคํ† ์บ์Šคํ‹ฑ ํ•™์Šต : ์ค‘๊ฐ„ & ์˜ˆ์ธก ๊ณผ์ •์—์„œ ๋‚œ์ˆ˜ ์‚ฌ์šฉ → ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋กœ ์ƒˆ๋กœ ํ•™์Šตํ•ด๋„ ๋‹ค๋ฅธ ์˜ˆ์ธก๊ธฐ ๋งŒ๋“ค์–ด์ง
  • ๋ถ„๋ณ„ ๋ชจ๋ธ ํ•™์Šต๊ณผ ์ƒ์„ฑ ๋ชจ๋ธ ํ•™์Šต
    • ๋ถ„๋ณ„ ๋ชจ๋ธ : ์ƒ˜ํ”Œ์˜ ๋ถ€๋ฅ˜๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ์ผ์—๋งŒ ๊ด€์‹ฌ
    • ์ƒ์„ฑ ๋ชจ๋ธ : x๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด๋‚˜ ๋ถ€๋ฅ˜ y์—์„œ x๊ฐ€ ๋ฐœ์ƒํ•  ํ™•๋ฅ  ์ถ”์ •
      • ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ

 

 

[Chapter 1] ์†Œ๊ฐœ

๊ธฐ๊ณ„ํ•™์Šต์ด๋ž€

lydian-rubidium-388.notion.site

์ „์— ๊ณต๋ถ€ํ–ˆ๋˜ ๋จธ์‹ ๋Ÿฌ๋‹ ์ฑ… ! ์ค‘์— ์ค‘์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฐœ๋…๋งŒ ๋Œ€์ถฉ ๊ฐ€์ ธ์™€๋ดค๋‹ค