์ ๋ฒ ๊ธ์์ ์ด์ด์ง๋๋ค ~
์ ๋ฒ์ ์ด๋ค ๊ฑด ๊ฐ์ ์นดํ ๊ณ ๋ฆฌ๊ฐ ์ ๋๋ก ๋ฝํ๋๋ฐ ์ด๋ค ๊ฑด ์ ๋ผ์ ์ด์ฌํ ์์นํด๋ดค๋๋...!
CountVectorizer๊ฐ ์์ฒด์ ์ผ๋ก ํ ๊ธ์์ธ ๊ฒฝ์ฐ์๋ ๋ฐ๋ก ์นด์ดํธ๋ฅผ ํด์ฃผ์ง ์๋๋ค๊ณ ํ๋ค..
์๋ง ์์ด์์๋ ํ ๊ธ์์ธ ๊ฒฝ์ฐ์๋ ์ค์ํ ์๋ฏธ๊ฐ ์์ด์ ๊ทธ๋ฐ ๊ฒ ๊ฐ๋ค..
๊ทธ์น๋ง ๋ด ๋ฐ์ดํฐ์ ์ ํ๊ธ์ด๊ณ ๋ก, ๊ตญ, ํ, ์ , ์ฐ, ๋ฉด ๋ฑ๋ฑ ํ ๊ธ์์ธ ๊ฒ๋ค๋ ๋งค์ฐ ๋ง๊ณ ..
,๋ ๊ณต๋ฐฑ, /๊ฐ ํฌํจ๋ ํ ์คํธ๋ ์ธ์ํด์ฃผ์ง ์๋๋ค๋ ๊ฒ์ ํ์ธํด์ ๋ฐ๋ก ๋ฐ์ดํฐ ๊ฐ์ ๋ณ๊ฒฝํด์ฃผ์๋ค
import pandas as pd
df = pd.read_csv('food_list.csv',encoding='cp949')
data = df[['๊ตฌ๋ถ', '์์๋ช
']] # ํ์ํ ๋ฐ์ดํฐ๋ง ๊ฐ์ ธ์ค๊ธฐ
for i in range (len(data)): # ,๊ฐ ํฌํจ๋๊ฑฐ๋ ํ ๊ธ์์ธ ์นดํ
๊ณ ๋ฆฌ๋ช
๋ณ๊ฒฝ / ๋ฌธ์๊ฐ ์๊ฑฐ๋ ํ ๊ธ์์ธ ์์๋ช
๋ณ๊ฒฝ
if (',' in data['๊ตฌ๋ถ'][i]):
data.loc[i, "๊ตฌ๋ถ"] = data['๊ตฌ๋ถ'][i].replace(',', '_')
if (len(data['๊ตฌ๋ถ'][i]) == 1):
data.loc[i, "๊ตฌ๋ถ"] = data['๊ตฌ๋ถ'][i] + "_"
if (len(data['์์๋ช
'][i]) == 1):
data.loc[i, "์์๋ช
"] = data['์์๋ช
'][i] + "_"
if (" / " in data['์์๋ช
'][i]):
data.loc[i, "์์๋ช
"] = data['์์๋ช
'][i].replace(" / ", '_')
if ("/" in data['์์๋ช
'][i]):
data.loc[i, "์์๋ช
"] = data['์์๋ช
'][i].replace("/", '_')
์ด๋ ๊ฒ ๋ฐ์ดํฐ ํ๋ ์์ ๊ฐ์ ๋ณ๊ฒฝํ๋ ๋ฐฉ๋ฒ์ ์ฐพ์ data.loc์ ์ฌ์ฉํด์ ๊ฐ์ ๋ณ๊ฒฝํด์ฃผ์๋ค..!
์จ์ ~
์ด์ ๋ค์์ผ๋ก ํ ์ผ์.. !
์ ํํ์ง ์์ ์์๋ช ์ ์ ๋ ฅ๋ฐ์์ ๋ ์ ์ฌํ ์์์ ์ถ์ฒํด์ค์ผ ํ๊ธฐ ๋๋ฌธ์ ์๋ง๋ ์์ฐ์ด์ฒ๋ฆฌ๋ฅผ ํด์ผ๋์ง ์์๊น..?? ๐๐ฝ
's t u d y . . ๐ง > ์ด๊ฒ์ ๊ฒ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[chatGPT] chatGPT API ์ฌ์ฉํ๊ธฐ ๐ซง (0) | 2023.04.14 |
---|---|
[์ถ์ฒ ์์คํ ] ๋ฉ๋ด ์ถ์ฒ ์์คํ (3) (0) | 2023.04.11 |
[์ถ์ฒ ์์คํ ] ๋ฉ๋ด ์ถ์ฒ ์์คํ (1) (0) | 2023.03.28 |
๊น,,, ๋น์ ,,, ๋๋์ฒด ๋ญ์ผ,, (0) | 2020.12.21 |
๊นํ๋ธ ์์ (0) | 2020.12.21 |