ai허브에서 다운 받은 일상생활구어체데이터가 json데이터로 되어있었다.
이를 csv로 바꿔보자!!
다음과 같은 json 파일이 존재한다.
import json
import csv
# 일상생활및구어체_영한_train_set.json' 파일을 읽어서 train_set.csv 파일에 저장
with open('./data/일상생활및구어체_영한_train_set.json', 'r', encoding = 'utf-8') as input_file, open('./data/train_set.csv', 'w', newline = '',encoding = 'utf-8') as output_file :
data = json.load(input_file)
f = csv.writer(output_file)
# csv 파일에 header 추가
f.writerow(['en', 'ko'])
for line in data['data']:
f.writerow([line['en'],line['ko']])
1. json 파일을 읽어서(input_file) data에 저장
2. 저장할 csv파일 초기화 (f)
3. csv파일에 컬럼 정의하기
4. json의 각각의 객체들이 csv에 저장됨
위의 json파일의 경우 "data"라는 요소안에 객체들의 정의 되어있으므로 data['data']로 불러와야 객체들이 각각 불러올 수 있다.
import pandas as pd
p_data = pd.read_csv('./data/train_set.csv',encoding='utf-8')
csv파일을 읽어본다.
참고
https://seohyunc.tistory.com/3
'코딩 > 파이썬' 카테고리의 다른 글
윈도우에서 파이썬 os.fork()함수 사용하기 - (feat pycharm, vscode) (1) | 2023.10.12 |
---|---|
파이썬 sorted() 람다(lambda), key, x[0],x[1] (0) | 2022.02.24 |
python에서 .HEIC 확장자 .jpg로 변경하기 (0) | 2021.10.22 |