countvectorizer 2

[์ถ”์ฒœ ์‹œ์Šคํ…œ] ๋ฉ”๋‰ด ์ถ”์ฒœ ์‹œ์Šคํ…œ (2)

์ €๋ฒˆ ๊ธ€์—์„œ ์ด์–ด์ง‘๋‹ˆ๋‹ค ~ ์ €๋ฒˆ์— ์–ด๋–ค ๊ฑด ๊ฐ™์€ ์นดํ…Œ๊ณ ๋ฆฌ๊ฐ€ ์ œ๋Œ€๋กœ ๋ฝ‘ํžˆ๋Š”๋ฐ ์–ด๋–ค ๊ฑด ์•ˆ ๋ผ์„œ ์—ด์‹ฌํžˆ ์„œ์น˜ํ•ด๋ดค๋”๋‹ˆ...! CountVectorizer๊ฐ€ ์ž์ฒด์ ์œผ๋กœ ํ•œ ๊ธ€์ž์ธ ๊ฒฝ์šฐ์—๋Š” ๋”ฐ๋กœ ์นด์šดํŠธ๋ฅผ ํ•ด์ฃผ์ง€ ์•Š๋Š”๋‹ค๊ณ  ํ•œ๋‹ค.. ์•„๋งˆ ์˜์–ด์—์„œ๋Š” ํ•œ ๊ธ€์ž์ธ ๊ฒฝ์šฐ์—๋Š” ์ค‘์š”ํ•œ ์˜๋ฏธ๊ฐ€ ์—†์–ด์„œ ๊ทธ๋Ÿฐ ๊ฒƒ ๊ฐ™๋‹ค.. ๊ทธ์น˜๋งŒ ๋‚ด ๋ฐ์ดํ„ฐ์…‹์€ ํ•œ๊ธ€์ด๊ณ  ๋–ก, ๊ตญ, ํƒ•, ์ „, ์ฐœ, ๋ฉด ๋“ฑ๋“ฑ ํ•œ ๊ธ€์ž์ธ ๊ฒƒ๋“ค๋„ ๋งค์šฐ ๋งŽ๊ณ .. ,๋‚˜ ๊ณต๋ฐฑ, /๊ฐ€ ํฌํ•จ๋œ ํ…์ŠคํŠธ๋„ ์ธ์‹ํ•ด์ฃผ์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•ด์„œ ๋”ฐ๋กœ ๋ฐ์ดํ„ฐ ๊ฐ’์„ ๋ณ€๊ฒฝํ•ด์ฃผ์—ˆ๋‹ค import pandas as pd df = pd.read_csv('food_list.csv',encoding='cp949') data = df[['๊ตฌ๋ถ„', '์Œ์‹๋ช…']] # ํ•„์š”ํ•œ ๋ฐ์ดํ„ฐ๋งŒ ๊ฐ€์ ธ์˜ค๊ธฐ for i in ra..

[์ถ”์ฒœ ์‹œ์Šคํ…œ] ๋ฉ”๋‰ด ์ถ”์ฒœ ์‹œ์Šคํ…œ (1)

๋ฉ”๋‰ด๋ช…์„ ๋ฐ›์œผ๋ฉด ์นดํ…Œ๊ณ ๋ฆฌ ์œ ์‚ฌ๋„์— ๋”ฐ๋ผ ์Œ์‹์„ ์ถ”์ฒœํ•ด ์ฃผ๊ณ , ์‚ฌ์šฉ์ž์˜ ํ‰๊ฐ€๋ฅผ ๋ฐ›์•„ ์ถ”์ฒœ์— ๋ฐ˜์˜ํ•˜๋Š” ์ปจํ…์ธ ๊ธฐ๋ฐ˜ ์ถ”์ฒœ ์‹œ์Šคํ…œ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ด๋‹ค !! ์šฐ์„ ์€ ๊ณต๊ณต ๋ฐ์ดํ„ฐ ์ค‘ ํ•œ๊ตญ๊ตญ์ œ๊ต๋ฅ˜์žฌ๋‹จ_ํ•œ๊ตญ์Œ์‹์ •๋ณด_์˜๋ฌธ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ–ˆ๋‹ค AI hub์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ์…‹๋“ค์€ ์Œ์‹ ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹์ด๋ผ ์ด๋ฏธ์ง€๋ช…์—์„œ ์นดํ…Œ๊ณ ๋ฆฌ์™€ ์Œ์‹๋ช…์„ ๋ฝ‘์•„์™€์•ผ ํ•ด์„œ ํ…์ŠคํŠธ๋กœ ์ œ๊ณตํ•ด ์ฃผ๋Š” ๋ฐ์ดํ„ฐ์…‹์„ ์„ ํƒํ–ˆ๋‹ค ํ•œ๊ตญ๊ตญ์ œ๊ต๋ฅ˜์žฌ๋‹จ_ํ•œ๊ตญ์Œ์‹์ •๋ณด_์˜๋ฌธ_20230228 ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋Š” ์žฌ๋ฃŒ(๋ฉด, ๋–ก, ์ฑ„์†Œ๋ฅ˜, ์ “๊ฐˆ ๋“ฑ) ๋ฐ ์กฐ๋ฆฌ๋ฒ•(์ฐœ, ๊ตฌ์ด, ์กฐ๋ฆผ, ๋“ฑ) ๋ณ„๋กœ ๋ถ„๋ฅ˜ํ•œ ์•ฝ 700์—ฌ๊ฐ€์ง€์˜ ํ•œ๊ตญ์Œ์‹์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์˜๋ฌธ์œผ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. www.data.go.kr ์•„๋ž˜๋Š” ๋…ธ์…˜์— ์ •๋ฆฌํ•ด ๋‘” ๋ฐ์ดํ„ฐ์…‹ ํ›„๋ณด๋“ค ๐Ÿ’ค ๋”๋ณด๊ธฐ ๋ฐ์ดํ„ฐ์…‹ ์Œ์‹ ์ด๋ฏธ์ง€ ๋ฐ ์˜์–‘์ •๋ณด ํ…์ŠคํŠธ + ์นดํ…Œ๊ณ ..