s t u d y . . ๐Ÿง/AI ์•ค ML ์•ค DL

[ML ์ด๋ก ] ํผ์…‰ํŠธ๋ก  & ๋‹ค์ธต ํผ์…‰ํŠธ๋ก 

H J 2023. 5. 1. 19:06

ํผ์…‰ํŠธ๋ก 

ํ•™์Šต์ด ๊ฐ€๋Šฅํ•œ ์ดˆ์ฐฝ๊ธฐ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ

 

๋™์ž‘

  1. ์ž…๋ ฅ์ธต์— ํŠน์ง• ๋ฒกํ„ฐ๊ฐ€ ๋“ค์–ด์˜ค๋ฉด ์„œ๋กœ ์—ฐ๊ฒฐ๋œ ํŠน์ง•๊ฐ’๊ณผ ๊ฐ€์ค‘์น˜๋ฅผ ๊ณฑํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ชจ๋‘ ๋”ํ•ด s๋ฅผ ์–ป์Œ
  2. s๋ฅผ ํ™œ์„ฑํ•จ์ˆ˜(activation function)์— ์ž…๋ ฅ์œผ๋กœ ๋„ฃ๊ณ  ๊ณ„์‚ฐ
  3. ํ™œ์„ฑํ•จ์ˆ˜์˜ ์ถœ๋ ฅ์ด ํผ์…‰ํŠธ๋ก ์˜ ์ตœ์ข… ์ถœ๋ ฅ → 1 ๋˜๋Š” -1

ํผ์…‰ํŠธ๋ก ์€ (+) ์˜์—ญ๊ณผ (-) ์˜์—ญ์œผ๋กœ ๋‚˜๋ˆ  (+) ์˜์—ญ์˜ ์ ์€ ๋ชจ๋‘ +1๋กœ, (-) ์˜์—ญ์˜ ์ ์€ ๋ชจ๋‘ -1๋กœ ๋ณ€ํ™˜ → ์ด์ง„ ๋ถ„๋ฅ˜๊ธฐ

(๊ทธ๋ฆฌ๊ณ  ํผ์…‰ํŠธ๋ก  ๋ชฉ์ ํ•จ์ˆ˜ ์„ค๊ณ„๋ž‘ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜๊นŒ์ง€ ๋…ธ์…˜์— ์ •๋ฆฌ๋˜์–ด ์žˆ์Œ !)

 


๋‹ค์ธต ํผ์…‰ํŠธ๋ก 

ํผ์…‰ํŠธ๋ก ์€ ์„ ํ˜•๋ถ„๋ฆฌ(linearly separable)๊ฐ€ ๊ฐ€๋Šฅํ•œ ์ƒํ™ฉ์—์„œ๋งŒ ๊ฐ€๋Šฅ, ์„ ํ˜•๋ถ„๋ฆฌ๊ฐ€ ๋ถˆ๊ฐ€๋Šฅ(linearly non-separable)ํ•œ ์ƒํ™ฉ์€ ์˜ค๋ฅ˜ ๋ฐœ์ƒ

⇒ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํผ์…‰ํŠธ๋ก ์„ ๊ฒฐํ•ฉํ•œ ๋‹ค์ธต ๊ตฌ์กฐ๋ฅผ ์ด์šฉํ•ด ์„ ํ˜•๋ถ„๋ฆฌ๊ฐ€ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ƒํ™ฉ์„ ํ•ด๊ฒฐํ•จ

 

๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด

 

ํŠน์ง• ๊ณต๊ฐ„ ๋ณ€ํ™˜

์›๋ž˜ ํŠน์ง• ๊ณต๊ฐ„ x๋ฅผ ์ƒˆ๋กœ์šด ํŠน์ง• ๊ณต๊ฐ„ z๋กœ ๋ณ€ํ™˜ → ์ƒˆ๋กœ์šด ํŠน์ง• ๊ณต๊ฐ„ z๋Š” ์„ ํ˜•๋ถ„๋ฆฌ ๊ฐ€๋Šฅํ•ด์ง

 

 

ํ™œ์„ฑ ํ•จ์ˆ˜ 

๋…ธ๋“œ์— ๋Œ€ํ•œ ์ž…๋ ฅ๊ฐ’์„ ๋ณ€ํ™˜ํ•˜๋Š” ํ•จ์ˆ˜์ธ ํ™œ์„ฑํ•จ์ˆ˜๋Š” @

์„ ํ˜• ๊ฒฐ๊ณผ์ธ ํ™œ์„ฑ๊ฐ’ z์— ๋น„์„ ํ˜•์ธ ํ™œ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•ด์„œ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ๋„ ํ•จ

  • ํผ์…‰ํŠธ๋ก  : ๊ณ„๋‹จํ•จ์ˆ˜
  • ๋‹ค์ธต ํผ์…‰ํŠธ๋ก  : ๋กœ์ง€์Šคํ‹ฑ ์‹œ๊ทธ๋ชจ์ด๋“œ, ํ•˜์ดํผ๋ณผ๋ฆญ ํƒ„์  ํŠธ
  • ๋”ฅ๋Ÿฌ๋‹ : ์†Œํ”„ํŠธํ”Œ๋Ÿฌ์Šค, ๋ ‰ํ‹ฐํŒŒ์ด์–ด(ReLU)

 

๊ตฌ์กฐ

๋‹ค์ธต ํผ์…‰ํŠธ๋ก (multy-layer perceptron) : ํผ์…‰ํŠธ๋ก ๊ณผ ๋‹ฌ๋ฆฌ ์ธต์ด ์—ฌ๋Ÿฌ ๊ฐœ

์ž…๋ ฅ์ธต : ์ฃผ์–ด์ง„ ํŠน์ง• ๋ฒกํ„ฐ๋ฅผ ์ž…๋ ฅํ•˜๋Š” ๊ณณ

์ถœ๋ ฅ์ธต : ์‹ ๊ฒฝ๋ง์˜ ์ตœ์ข… ์ถœ๋ ฅ์ด ๋‚˜์˜ค๋Š” ๊ณณ → ๋‘ ๊ณณ ๋ชจ๋‘ ๊ฐ’ ๊ด€์ฐฐ ๊ฐ€๋Šฅ

์€๋‹‰์ธต(hidden layer) : ์ž…๋ ฅ์ธต๊ณผ ์ถœ๋ ฅ์ธต ์‚ฌ์ด์˜ ์ƒˆ๋กœ์šด ์ธต → ๊ณ„์‚ฐ์˜ ์ค‘๊ฐ„๊ณผ์ •์œผ๋กœ์„œ ๋ณด์ด์ง€ ์•Š๋Š” ๊ณณ

 

๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ๋ถ„์‚ฐ์ฒ˜๋ฆฌ์™€ ๋ณ‘๋ ฌ์ฒ˜๋ฆฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๋ณ‘๋ ฌ๋ถ„์‚ฐ ๊ตฌ์กฐ๋ผ๊ณ  ํ•จ

 

๋™์ž‘

⇒ ํ–‰๋ ฌ๋กœ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ‘œ๊ธฐ

 

์€๋‹‰์ธต์€ ํŠน์ง• ์ถ”์ถœ๊ธฐ

๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ๋ฒกํ„ฐ x๋ฅผ ์ž…๋ ฅ ๋ฐ›์•„ ๋ฒกํ„ฐ o ์ถœ๋ ฅ

  • x : ์ตœ์ดˆ์˜ ์ž…๋ ฅ (์„ผ์„œ๋กœ ํš๋“ํ•œ ์›์‹œ ์‹ ํ˜ธ, ์ „์ฒ˜๋ฆฌ๊ธฐ์— ํ•ด๋‹นํ•˜๋Š” ํŠน์ง• ์ถ”์ถœ๊ธฐ๊ฐ€ ์›์‹œ ์‹ ํ˜ธ๋กœ๋ถ€ํ„ฐ ์ถ”์ถœํ•œ ํŠน์ง• ๋ฒกํ„ฐ ๋“ฑ๋“ฑ)
  • o : ๋ถ€๋ฅ˜ ์ •๋ณด๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฏ€๋กœ ๋ถ€๋ฅ˜๊ณต๊ฐ„ ํ˜•์„ฑ

์€๋‹‰์ธต์€ ํŠน์ง• ๋ฒกํ„ฐ๋ฅผ ๋ถ„๋ฅ˜์— ๋” ์œ ๋ฆฌํ•œ ์ƒˆ๋กœ์šด ํŠน์ง• ๊ณต๊ฐ„์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ํŠน์ง• ์ถ”์ถœ๊ธฐ(feature extractor)๋กœ ๋ณผ ์ˆ˜ ์žˆ์Œ

! ์ƒˆ๋กœ์šด ํŠน์ง• ๊ณต๊ฐ„์€ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์ด ๋ชฉ์ ์„ ๋‹ฌ์„ฑํ•˜๋Š” ๋ฐ ๋” ์œ ๋ฆฌํ•ด์•ผ ํ•จ !

 

์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋‹ค์ธต ํผ์…‰ํŠธ๋ก  (์€๋‹‰์ธต์œผ๋กœ ์„ ํ˜•๋ถ„๋ฆฌ๊ฐ€ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ƒํ™ฉ๋„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์šฉ๋Ÿ‰์„ ๊ฐ€์ง) → ์šฉ๋Ÿ‰์ด ์ปค์ง€๋ฉด ์ถ”์ •ํ•  ๋งค๊ฐœ๋ณ€์ˆ˜๋Š” ๋งŽ์•„์ง ⇒ ์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ(error backpropagation)

 

o : output / y : ์‹ค์ œ ๊ฐ’

์ „๋ฐฉ ๊ณ„์‚ฐ(์™ผ→์˜ค)๊ณผ ๋ฐ˜๋Œ€ ๋ฐฉํ–ฅ์œผ๋กœ ๊ณ„์‚ฐ์ด ํ๋ฅด๊ณ  ๊ณ„์‚ฐ ๊ณผ์ •์—์„œ o์™€ y์˜ ์ฐจ์ด, ์ฆ‰ ์˜ค๋ฅ˜๋ฅผ ์ค„์ด๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐ’์„ ์ „ํŒŒํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ(error backpropagation)๋ผ๋Š” ์ด๋ฆ„์ด ๋ถ™์Œ

์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ : 4๊ฐœ์˜ ์‹์„ ์ด์šฉํ•ด ์ถœ๋ ฅ์ธต์˜ ์˜ค๋ฅ˜๋ฅผ ์—ญ๋ฐฉํ–ฅ(์™ผ์ชฝ)์œผ๋กœ ์ „ํŒŒํ•˜๋ฉฐ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

 

(๋ชฉ์  ํ•จ์ˆ˜๋ž‘ ์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„ ๋‚ด์šฉ์€ ์•„๋ž˜ ๋…ธ์…˜ ๋งํฌ์— ์ •๋ฆฌ๋˜์–ด ์žˆ์Œ !)

 


๋ฏธ๋‹ˆ๋ฐฐ์น˜ ์Šคํ† ์บ์Šคํ‹ฑ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•

์Šคํ† ์บ์Šคํ‹ฑ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ• / ์˜จ๋ผ์ธ ๋ฐฉ์‹ (t:๋ฏธ๋‹ˆ๋ฐฐ์น˜ํฌ๊ธฐ=1)

ํ•œ ๋ฒˆ์— ์ƒ˜ํ”Œ 1๊ฐœ์”ฉ ์ฒ˜๋ฆฌ → ์˜ค๋ฅ˜ ์—ญ์ „ํŒŒ๋ฅผ ์ด์šฉํ•ด ํ•œ ์ƒ˜ํ”Œ์˜ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ ๊ณ„์‚ฐ ํ›„ ๊ฐ€์ค‘์น˜ ์ฆ‰์‹œ ๊ฐฑ์‹  → ๋ชจ๋“  ์ƒ˜ํ”Œ์— ์ˆ˜ํ–‰(ํ•œ ์„ธ๋Œ€) → ์ˆ˜๋ ดํ•  ๋•Œ๊นŒ์ง€ ์—ฌ๋Ÿฌ ์„ธ๋Œ€ ๋ฐ˜๋ณต → ์‹œ๊ฐ„์ด ์˜ค๋ž˜ ๊ฑธ๋ฆผ

 

๋ฐฐ์น˜ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ• (t=n)

๋ชจ๋“  ์ƒ˜ํ”Œ์˜ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ๋ฅผ ๊ณ„์‚ฐํ•œ ํ›„ ํ‰๊ท  ๊ทธ๋ ˆ์ด๋””์–ธํŠธ๋ฅผ ๊ตฌํ•ด ํ•œ ๋ฒˆ์— ๊ฐฑ์‹ 

 

์Šคํ† ์บ์Šคํ‹ฑ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•๊ณผ ๋ฐฐ์น˜ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ• ์ค‘๊ฐ„์— ํ•ด๋‹นํ•˜๋Š”

๋ฏธ๋‹ˆ๋ฐฐ์น˜ ๋ฐฉ์‹ mini batch (t=์ˆ˜์‹ญ~์ˆ˜๋ฐฑ)

ํ›ˆ๋ จ์ง‘ํ•ฉ X์—์„œ t๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ๋ฌด์ž‘์œ„๋กœ ๋ฝ‘์•„ ๋ฏธ๋‹ˆ๋ฐฐ์น˜ ๊ตฌ์„ฑ → ๋ฏธ๋‹ˆ ๋ฐฐ์น˜์— ์†ํ•œ ์ƒ˜ํ”Œ์˜ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ ํ‰๊ท ์œผ๋กœ ๊ฐ€์ค‘์น˜ ๊ฐฑ์‹  → ์ˆ˜๋ ด ์†๋„ ๋นจ๋ผ์ง & GPU๋ฅผ ์ด์šฉํ•œ ๋ณ‘๋ ฌ์ฒ˜๋ฆฌ์—๋„ ์œ ๋ฆฌ

 

๋ฐฐ์น˜, ์Šคํ† ์บ์Šคํ‹ฑ ๋ฐฉ์‹ : ์„ธ๋Œ€๋งˆ๋‹ค ํ›ˆ๋ จ์ง‘ํ•ฉ์˜ ๋ชจ๋“  ์ƒ˜ํ”Œ์ด ์ฐธ์—ฌ

๋ฏธ๋‹ˆ๋ฐฐ์น˜ : ๋ฏธ๋‹ˆ๋ฐฐ์น˜๋ฅผ ๋ฌด์ž‘์œ„๋กœ ๋ฝ‘๊ธฐ ๋•Œ๋ฌธ์— ํ•™์Šต์ด ์™„๋ฃŒ๋  ๋•Œ๊นŒ์ง€ ํ•œ ๋ฒˆ๋„ ํ•™์Šต์— ์ฐธ์—ฌํ•˜์ง€ ์•Š๋Š” ์ƒ˜ํ”Œ์ด ์žˆ์„ ์ˆ˜๋„ ์žˆ์Œ → ๋ฏธ๋‹ˆ๋ฐฐ์น˜๊ฐ€ ๋ชจ๋“  ์ƒ˜ํ”Œ์˜ ๋Œ€๋žต์ ์ธ ๋Œ€ํ‘œ์„ฑ์„ ๋ ๋ฏ€๋กœ ์„ฑ๋Šฅ์— ํ•ด๋ฅผ ๋ผ์น˜์ง€ ์•Š์Œ / ๋ฌด์ž‘์œ„์„ฑ์ด ๋” ๋†’์Œ → ๊ทœ์ œ ํšจ๊ณผ → ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ํ–ฅ์ƒ


 

 

[Chapter 3] ๋‹ค์ธต ํผ์…‰ํŠธ๋ก 

๊ฐ€์žฅ ๋‹จ์ˆœํ•œ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ ํผ์…‰ํŠธ๋ก  → ์€๋‹‰์ธต์ด ์ถ”๊ฐ€๋ผ ์‹ค์šฉํ™” ์ˆ˜์ค€์— ์˜ค๋ฅธ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก 

lydian-rubidium-388.notion.site