s t u d y . . ๐Ÿง/AI ์•ค ML ์•ค DL

[ML ์ด๋ก ] ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ์ˆ˜ํ•™

H J 2023. 5. 1. 18:16

์„ ํ˜•๋Œ€์ˆ˜์™€ ํ™•๋ฅ ๊ณผ ํ†ต๊ณ„๊ฐ€ ๋จธ์‹ ๋Ÿฌ๋‹์ด ์ค‘์š”ํ•จ

์„ ๋Œ€๋ž‘ ํ™•ํ†ต์€ ๋”ฐ๋กœ ์—ฌ๊ธฐ์— ์ •๋ฆฌํ•˜์ง„ ์•Š์„ ๊ฑฐ์ง€๋งŒ ์•„๋ž˜ ๋…ธ์…˜ ๋งํฌ์— ์ •๋ฆฌํ•ด๋‘ 

 

์ตœ์ ํ™”

์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋กœ ์ตœ์ ํ™” ๋ฌธ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ๊ณต์‹ํ™” ? → ์ตœ์ ํ™” ๊ณต์‹์„ ์–ด๋–ป๊ฒŒ ํ’€์–ด ์ตœ์ ์˜ ํ•ด, ์ฆ‰ ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œ๋กœ ํ•˜๋Š” ์ ์„ ์ฐพ์„ ๊ฒƒ์ธ๊ฐ€ ⇒ ๊ธฐ๊ณ„ ํ•™์Šต์˜ ํ•ต์‹ฌ์ฃผ์ œ

์ตœ์ ํ™” ๋ฌธ์ œํ•ด๊ฒฐ

  • ํ•ด ๊ณต๊ฐ„ ์ „์ฒด๋ฅผ ์ƒ…์ƒ…์ด ๋’ค์ง€๋Š” ๋‚ฑ๋‚ฑํƒ์ƒ‰(exhaustive search) ์•Œ๊ณ ๋ฆฌ์ฆ˜
    ๊ณ ์ฐจ์›์—์„œ๋Š” ๋ถˆ๊ฐ€๋Šฅ → ๋งค์šฐ ๋งŽ์€ ์ ์— ๋Œ€ํ•ด ๋ชฉ์ ํ•จ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•ด์•ผ ํ•จ
    ๊ฐ๊ฐ์˜ ์ฐจ์›์„ ๊ตฌ๊ฐ„์œผ๋กœ ๋‚˜๋ˆ„๊ณ , ์ด๋“ค ๊ฐ๊ฐ์˜ ๋ชฉ์ ํ•จ์ˆซ๊ฐ’์„ ๊ณ„์‚ฐํ•ด ๊ฐ€์žฅ ์ž‘์€ ์ ์„ ์ฐพ์Œ

 

  • ๋ฌด์ž‘์œ„๋กœ ์„ ํƒ๋œ ์ ๋“ค์„ ํƒ์ƒ‰ํ•˜๋Š” ๋ฌด์ž‘์œ„ ํƒ์ƒ‰(random search) ์•Œ๊ณ ๋ฆฌ์ฆ˜ 

 

  • ๊ธฐ๊ณ„ ํ•™์Šต์ด ์‚ฌ์šฉํ•˜๋Š” ์ „ํ˜•์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜

 

๋ฏธ๋ถ„

๋ฏธ๋ถ„์— ์˜ํ•œ ์ตœ์ ํ™”

1์ฐจ ๋„ํ•จ์ˆ˜๋Š” ์–ด๋–ค ์ ์—์„œ์˜ ๊ธฐ์šธ๊ธฐ, ์ฆ‰ x๊ฐ€ ๋ฏธ์„ธํ•˜๊ฒŒ ์ฆ๊ฐ€ํ–ˆ์„ ๋•Œ ํ•จ์ˆซ๊ฐ’์˜ ๋ณ€ํ™”์œจ์„ ์•Œ๋ ค์คŒ

→ ์ด๋Ÿฐ ์„ฑ์งˆ์ด ๊ธฐ๊ณ„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ชฉ์ ํ•จ์ˆ˜์˜ ์ตœ์ €์ ์„ ์ฐพ์•„๊ฐ€๋Š”๋ฐ ๊ธธ์žก์ด ์—ญํ• ์„ ํ•จ

 

ํŽธ๋ฏธ๋ถ„ partial defferentiation

๋ณ€์ˆ˜๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ์ธ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„

๋ณ€์ˆ˜ ๊ฐ๊ฐ์— ๋Œ€ํ•ด ๋…๋ฆฝ์ ์œผ๋กœ ๋ฏธ๋ถ„ & ์–ด๋–ค ๋ณ€์ˆ˜๋กœ ๋ฏธ๋ถ„ํ•  ๋•Œ ๋‚˜๋จธ์ง€ ๋ณ€์ˆ˜๋Š” ๋ชจ๋‘ ์ƒ์ˆ˜๋กœ ๊ฐ„์ฃผ

ํŽธ๋ฏธ๋ถ„์˜ ๊ฒฐ๊ณผ๋Š” ๋ฒกํ„ฐ ํ˜•ํƒœ๊ฐ€ ๋˜๋Š”๋ฐ, ์ด ๋ฒกํ„ฐ๋ฅผ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ(gradient)๋ผ๊ณ  ํ•จ

f’(x) = 0 ์ผ ๋•Œ f(x)๋Š” ์ตœ์†Ÿ๊ฐ’์„ ๊ฐ€์ง → ๋ชฉ์  ํ•จ์ˆ˜๋ฅผ ํŽธ๋ฏธ๋ถ„ํ•˜์—ฌ ์–ป์€ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ์— ๋”ฐ๋ผ ์ตœ์ €์ ์„ ์ฐพ์Œ

 

 

๊ฒฝ์‚ฌ ํ•˜๊ฐ• ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋ชฉ์  ํ•จ์ˆ˜๋ฅผ ๋ฏธ๋ถ„ํ•œ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ๊ฐ€ ์˜ค๋ฅด๋ง‰ ๋ฐฉํ–ฅ์„ ๊ฐ€๋ฆฌํ‚ฌ ๋•Œ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ์˜ ์Œ์ˆ˜๋ฅผ d์„ธํƒ€๋กœ ์‚ฌ์šฉํ•˜๋ฉด ๋‚ด๋ฆฌ๋ง‰ ๋ฐฉํ–ฅ์„ ์ฐพ์•„๊ฐ

⇒ ์ด ์‹์„ ์ด์šฉํ•˜๋Š” ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•(gradient desent method)๋ผ๊ณ  ํ•จ

 

 

๋ฐฐ์น˜ ๊ฒฝ์‚ฌ ํ•˜๊ฐ• ์•Œ๊ณ ๋ฆฌ์ฆ˜(BGD)

๋ชจ๋“  ์ƒ˜ํ”Œ์˜ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ์˜ ํ‰๊ท ์„ ๊ตฌํ•œ ํ›„ ํ•œ ๋ฒˆ์— ๊ฐฑ์‹ 

 

์Šคํ† ์ผ€์Šคํ‹ฑ ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•(SGD = stochastic gradient descent)

์ด๋Ÿฐ ์ž‘์—…์„ ๋ชจ๋“  ์ƒ˜ํ”Œ์— ์ˆ˜ํ–‰ํ•˜๋ฉด ํ•œ ์„ธ๋Œ€(epoch)๊ฐ€ ์ง€๋‚ฌ๋‹ค๊ณ  ํ•จ

๋ฉˆ์ถค ์กฐ๊ฑด์ด ๋งŒ์กฑ๋  ๋•Œ๊นŒ์ง€ ์„ธ๋Œ€ ๋ฐ˜๋ณต. ์ƒˆ๋กœ์šด ์„ธ๋Œ€๊ฐ€ ์‹œ์ž‘ํ•  ๋•Œ๋งˆ๋‹ค ์ƒ˜ํ”Œ์˜ ์ˆœ์„œ๋ฅผ ์„ž์–ด ์ž„์˜์„ฑ ํˆฌ์ž… → ์ด ์ž„์˜์„ฑ ๋•Œ๋ฌธ์— ์Šคํ† ์ผ€์Šคํ‹ฑ์ด๋ผ๋Š” ์šฉ์–ด๊ฐ€ ๋ถ™์Œ

ํ•œ ๋ฒˆ์— ์ƒ˜ํ”Œ ํ•˜๋‚˜์˜ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ  ์ฆ‰์‹œ ๋งค๊ฐœ๋ณ€์ˆ˜ ๊ฐฑ์‹ 


 

 

[Chapter 2] ๊ธฐ๊ณ„ํ•™์Šต๊ณผ ์ˆ˜ํ•™

๋ฐ์ดํ„ฐ์— ์žˆ๋Š” ๋ถˆํ™•์‹ค์„ฑ์„ ๋‹ค๋ฃจ๋ฉฐ ์˜ค๋ฅ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ฐพ๋Š” ์ผ์„ ๋ชจ๋‘ ์ˆ˜ํ•™์œผ๋กœ ํ•ด๊ฒฐ

lydian-rubidium-388.notion.site

 

๊ธฐ๊ณ„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ชฉ์  ํ•จ์ˆซ๊ฐ’์ด ์ž‘์•„์ง€๋Š” ๋ฐฉํ–ฅ์„ ์ฐพ์•„ ๋งค๊ฐœ๋ณ€์ˆซ๊ฐ’ ์กฐ์ • ๋ฐ˜๋ณต

 

์ง์„ ์„ ์›€์ง์ด๋Š” ๋™๋ ฅ์ธ ๋ชฉ์  ํ•จ์ˆ˜์˜ ์ตœ์ €์ ์„ ์ฐพ๊ธฐ ์œ„ํ•ด ๋ชฉ์  ํ•จ์ˆ˜๋ฅผ ํŽธ๋ฏธ๋ถ„ ํ•˜์—ฌ ์–ป์€ ๊ทธ๋ ˆ์ด๋””์–ธํŠธ์— ๋”ฐ๋ผ ์ตœ์ €์ ์„ ์–ป์Œ

ใ„ด ๋‚ด๊ฐ€ ์ด๋ฒˆ ์ฑ•ํ„ฐ์—์„œ ์ค‘์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•œ ๊ฒƒ !

 

๊ทธ๋ฆฌ๊ณ  ๋’ค์— ๋‚˜์˜ฌ ๋‚ด์šฉ์ด๊ธด ํ•œ๋ฐ..

 

๋…ธ๋“œ์— ๋Œ€ํ•œ ์ž…๋ ฅ๊ฐ’์„ ๋ณ€ํ™˜ํ•˜๋Š” ํ•จ์ˆ˜์ธ ํ™œ์„ฑํ•จ์ˆ˜๋Š” @

์„ ํ˜• ๊ฒฐ๊ณผ์ธ ํ™œ์„ฑ๊ฐ’ z์— ๋น„์„ ํ˜•์ธ ํ™œ์„ฑ ํ•จ์ˆ˜๋ฅผ ์ ์šฉํ•ด์„œ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ๋„ ํ•จ

 

๊ทธ๋ฆฌ๊ณ  ๊ทœ์ œ๋„ ์ค‘์š”ํ˜€ ~

 

๋’ท ๋ถ€๋ถ„ ๊ณต๋ถ€ํ•˜๋‹ค๊ฐ€ ๊ฐœ๋…์ด ํ—ท๊ฐˆ๋ ค์„œ ์ •๋ฆฌํ•˜๋Š” ์ค‘ !