
파이썬 빅데이터 분석 Day 17
·
데이터분석실습/데이터 과학 기반의 파이썬 빅데이터 분석
17. 데이터 분석하기 코로나 뉴스 토픽분석(22.08.03) [토픽 분석 + LDA 토픽 모델] 목표: 뉴스에서 코로나 관련 토픽을 분석하고 결과 시각화 1. 데이터 수집 이전에 사용한 네이버에서 크롤링한 코로나 뉴스에서 명사만을 추출한 단어 상태의 리스트를 준비 저번시간에 "코로나navernews.csv" 파일을 사용하면 된다. 2.데이터 준비 및 탐색 train데이터부터 데이터 전처리를 해볼 것이다. data=pd.read_csv("../data/Corona/코로나_naver_news.csv",encoding='euc-kr') description=data['description'] description_noun_tk=[] for d in description: description_noun_tk...