搜索资源列表
extractWiki
- 从enwiki-latest-pages-articles.xml中抽取维基页面的正文内容。-Extract text content enwiki-latest-pages-articles.xml.
keyword_find
- 实现了将pdf转换为txt,并且进行分模块的关键词抽取算法-Realized convert pdf to txt, and dividing module keyword extraction algorithm
hearder.py
- 利用python抽取单个电影的豆瓣影评信息(use python to get all user reviews from douban movie site)
