搜索资源列表
meaning
- 关键词信息提取技术效率很低, 潜在语意索引技术是对它的改进. 在分析潜在语意索引技 术的结构与原理的基础上, 探讨了利用它改进汉语信息处理及中西文信息交叉提取的可能性.
SearchEngine
- 搜索引擎模块是一个很主要且常见的功能。一个好的搜索引擎能给用户使用带来方便。在“站内”选项卡下的搜索框中输入欲查询的关键词,如“PHP 字符串,处理技术!”,单击“极速搜索”按钮,系统会首先过滤欲查询关键词的标点符号,然后对过滤标点符号的关键词进行分词操作,接下来在数据库中检索与之匹配的信息资源。同时实现搜索计时及查询结果汇总功能,并在结果集中高亮显示查询关键词,最后以分页形式输出匹配结果给用户。-Search engine module is one of the main and commo
Search_engine
- 基于字词结合的信息处理方式。巧妙解决了中文信息的理解问题,极大地提高了搜索的准确性和查全率.-Information based on the word combination approach. Cleverly solved the problem of the Chinese understanding of information, has greatly improved the accuracy of search and recall.
rjgctx
- 提出了一个完整的语义网信息搜索模型,它可以实现更快更准的网络信息搜索,以减少当前网络搜索的弊端。介绍了语义网领域发展背景和语义网的三个关键技术,论述了该模型的三个主要模块及其各自功能,详细说明了各功能的实现原理。比较传统的直接使用关键字来进行信息检索的主流网络信息检索引擎,这里使用的是在本体论基础上经过语义逻辑推理器处理后的语义索引词作为查询的输入,使查询变得准确快速而且节省网络资源。-In this paper,a model of information retrieval based on
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
wordseg
- 词性标注 中文信息处理 在输入一段文字之后它会分析句子中的各种成分-word segment
1
- 中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中文分词入门最简单应该是最大匹配法了-Chinese word segmentation in Chinese information processing is the most basic, whether in machine translation Yihuo information retrieval, or other related appli
WPCrawler
- 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需要爬虫程序来完成这样的任务。而且搜索引擎必不可少的组件之一也
