搜索资源列表
ICQandAIMListener
- 聊天机器人,关于用自然语言处理,自动聊天的程序.-chatting robot, on the use of natural language processing, automatic Chat procedures.
02100813320
- 提取网页内容,去掉标签,去掉无用链接,主要服务于自然语言处理中对网页内容要求的应用。 -extract the content of the sites and remove labels, eliminating useless links, major service on natural language processing of web content requirements of the application.
nltk-2[1].0b3.tar
- NLTK -自然语言工具包-是一套开放源码 的Python模块,数据集,并支持研究和教学 发展中的自然语言处理。 文件:大量文件如何使用NLTK ,包括一本教科书和API文档,是可从NLTK网址: http://www.nltk.org/ -这本书涉及范围广泛的介绍性主题,自然语言处理,并显示如何做的所有处理任务使用的工具包。 -该工具包的参考文件介绍了每一个模块, 接口,类,方法,功能,和可变的工具包。 这个文件应该是有益的用户和开发人员。-NLTK--
ltp-service-1.0
- 哈尔滨工业大学信息检索中心自然语言处理工具WebService,若要使用需自行和哈工大联系-Harbin Institute of Technology Centre for Natural Language Processing Information Retrieval tools WebService, and to use at your own contact HIT
HMM
- 这是一个HMM 隐马尔科夫算法,是属于自然语言处理的重要算法之一,本算法的精确度取决于词库-this is an HMM program
RMM
- 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
findleft
- 这个是概率统计最大算法,此算法是分词算法的一种,是自然语言处理中最有效的分词算法之一,本算法精确度达到95 以上-This is the probability statistics algorithm, this algorithm is a sub-word segmentation algorithm is the most effective natural language processing word segmentation algorithm, the algorithm an
WPCrawler
- 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需要爬虫程序来完成这样的任务。而且搜索引擎必不可少的组件之一也