词云图是一种用来展示高频关键词的可视化表达,它利用文字、色彩、图形的搭配,来呈现一种丰富的视觉体验。 上篇文章我们介绍了中文分词库jieba,今天我们就在jieba分词的基础上,介绍wordcloud、stylecloud和pyecharts三种制作词云图的方法。
这次词云图的材料,我们用的是国务院印发的《2030年前碳达峰行动方案》,我们来看一看这篇文章提到了哪些关键词。为了省事,我们直接用 jieba自带的TF-IDF 算法提取关键词。
返回的关键词如下所示。
wordcloud是制作词云图最常用的工具,上手简单,操作方便,直接利用pip install wordcloud进行安装。下面我们利用worldcloud来制作词云图。
制作完成的词云图如下所示。
stylecloud是wordcloud优化改良版,操作简单,可以使用 Font Awesome 提供的免费图标更改词云的形状;通过palettable更改调色板以自定义风格,更改背景颜色。安装方式同样是利用pip install wordcloud。下面我们用stylecloud分别画两张不同形状与颜色的词云图。
两种形状与配色的词云图如下所示。
Pyecharts是一款将python与echarts结合的强大的数据可视化工具,它也提供了词云图的绘制方法。
pyecharts输出的是html格式的可交互结果。
今天我们学习了三种词云图的制作方式,整体来看,三种方法都比较简单,不知道你更喜欢哪一种方法。对词云图的制作感兴趣的同学,赶紧来试一试啦。