안녕하세요,
워드클라우드는 텍스트의 단어, 키워드 등을 시각화하는 방법으로 많은 분들이 사용하고 있습니다. 사실 짧은 문장은 워드클라우드 기능을 제공하는 홈페이지를 이용하면 쉽게 시각화할 수 있습니다. 간단한 문서의 워드클라우드를 만드시는 것이 목적이라면 아래의 웹사이트를 이용하면 빠르게 시각화할 수 있습니다.
워드클라우드
워드클라우드 워클생성기 워클 단어구름 한글 워드클라우드 구름단어 글자구름 구름글자 태그클라우드 워드클라우드 태그구름 랜덤이미지 블로그이미지 페이스북이미지
wordcloud.kr
Free online word cloud generator and tag cloud creator
Wordclouds.com is a free online word cloud generator and tag cloud generator, similar to Wordle. Create your own word clouds and tag clouds. Paste text or upload documents and select shape, colors and font to create your own word cloud. Wordclouds.com can
www.wordclouds.com
그런데 만일 대용량 문서에서의 빈도 수가 높은 단어나 키워드를 시각화하고 싶다면 파이썬을 이용하는 것이 좋습니다. 이번 포스팅도 chatgpt와 함께 하였습니다.
워드 클라우드를 위해서는 wordcloud, matplotlib 패키지가 필요합니다. 우선 패키지를 불러옵니다.
from wordcloud import WordCloud
import matplotlib.pyplot as plt
만일 아직 WordCloud를 설치하지 않으셨다면 아래의 코드를 이용하여 설치해주시면 됩니다.
pip install wordcloud
우선 샘플 문장을 만들어 보겠습니다. 가상의 데이터는 chatgpt가 정말 잘 만들어줍니다.
text = "This is some sample text for the wordcloud. We can use any text or dataset to create the wordcloud."
다음으로 아래의 코드를 실행하여 wordcloud에 텍스트의 워드클라우드 정보를 저장하고,
wordcloud = WordCloud().generate(text)
plt.imshow 를이용하여 시각화합니다. interpolation='bilinear'을 추가하면 조금 더 부드러운 워드클라우드 결과가 출력됩니다. 그리고 테두리가 출력되지 않게 하기 위하여 plt.axis("off") 코드를 실행한 후 마지막 줄의 plt.show()를 실행하면,
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
아래와 같이 시각화 결과가 출력됩니다. text, wordcloud는 문장에서 2번이나 언급되었기 때문에 1번 언급된 create나 use와 비교할 때 단어의 크기가 큰 것을 확인할 수 있습니다.
이상으로 파이썬을 활용한 워드클라우드 만들기를 살펴보았습니다.
궁금하신 점은 언제든 댓글로 담겨주세요:)
감사합니다!
☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.
[Python] Bokeh 패키지 반응형 선 그래프 시각화 (0) | 2023.04.24 |
---|---|
[Python] 구글 코랩으로 구글 드라이브 데이터셋 불러오기 (1) | 2023.04.20 |
[Python] 구글 코랩에 로컬PC 데이터 불러오기 (0) | 2023.04.19 |
[Python] 데이터 사이언스의 시작, 구글 코랩 추천 (0) | 2023.04.14 |
댓글 영역