1,背诵单词:vice 邪恶;恶习 drop滴;落下;微量 otherwise 另样,用别的方法 bind捆,绑,包括,束缚 eligible 符合条件的 narrative 叙述性的 叙述 tile 瓦片,瓷砖bundle 捆,包,束 mill 磨粉机,磨坊 heave (用力)举,提 gay 快乐的,愉快的 statistical统计的,统计学的 fence 篱笆;围栏;剑术 magnify 放大,扩大 graceful优美的,文雅的,大方的 analyse 分析,分解 artificial 人工的,人造的 privacy 独处,自由,隐私;私生活 tub 木盆,澡盆 feedback 反馈;反应;回授 property 财产,资产upper 上面的;上部的
2,完善了北京信件统计系统的一些功能,爬取了百度信息领域热词并存入mysql并简单实现了词云图功能:
1,爬取百度热词的URL,存入citiao_list.txt中
2,通过citiao_list.txt文件中的URL爬取词条名称和简介并存入citiao.txt中
3,对citiao.txt中内容进行分词,根据每个词的出现频率展示词云图
3,遇到的问题:
1,爬取百度百科词条URL时发现百度百科的词条是通过Ajax传的json数据在前端渲染展示的,而且是通过post方式传的数据,因此网上查找,通过requests库的post方法,将参数设置好就能访问到json数据了,然后通过json库的loads方法将json数据转为list类型,从而取得每个词条的URL链接
2,生成词云图的代码我看的不是太懂
3,关于对词条分类我初步猜想可以通过对特定的分类根据词条的简介进行模糊查询进行分类
4,对词条与词条之间的关系图不知道怎么实现
4,明天就上课了,希望在新的学期能学到很多知识