搜索资源列表
classifier-1.12
- 能对从Google中搜索出来的文本进行聚类,提供了Java包,及调用源代码.-can right from the Google Search for the text clustering, a Java package, source code and call.
Pwswnr
- 一个人名识别的程序,可用在需要对人名进行搜索的系统中。-a name identification procedures can be used in the names of the need to search for the system.
20066613556773-2189
- 利用Visual Basic6.0制作的字符串搜索处理系统!推荐中-use Visual Basic 6.0 produced by the search string processing system! Recommendation
REFs
- REFS 本程序用于处理IEEE搜索结果,提出作者、标题、页号,形成参考文献列表。-REFS the procedures for handling IEEE search results, author, title, page, References to form links.
changname
- 批量改名程序,将文件进行批量改名.改名后可以还原!有文件的搜索,查询功能!-batch renamed procedures for batch file renaming. Renamed after Reduction! Document search, query!
用VB5实现搜索功能
- 用VB5实现搜索功能-search function
main
- 从文件中搜索EMAIL地址,帮住公司搜集一些信息
wendangsousuo
- 此系统是由VB编写的文档搜索器,是学习VB的很好的参考源码。它是一个简单的文档搜索器,可供大家参考
mmseg-v0.3
- 基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
src_v1.3.01
- KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) * 处理速度: 600KBytes/s
Source_Code
- 中文分词系统分析库,可以对UTF8表述的中文文字进行分词操作, 支持外挂的词库和手动干预(回调方式)的加权处理。 可用于搜索引擎的基础分词开发-Chinese word segmentation system analysis libraries, can be expressed UTF8 Chinese text segmentation operation, support plug and manual intervention in the thesaurus (callback me
spider
- 本系统为简易网络爬虫,输入初始url,系统自动在网上搜索网页信息,并记录下来做为搜索引擎的数据.-The system for the Simple Network reptiles, enter the initial url, system automatically searches the Web page information, and record data as a search engine.
V1.4
- 由KaiToo搜索开发的一款基于字典的简单中英文分词算法-Search by KaiToo developed a simple dictionary based on English and Chinese word segmentation algorithm
fenci
- 中文分词 中文搜索引擎中的关键字识辨-Chinese word segmentation in Chinese search engine keywords that identify
seadog-installer
- 对于垂直搜索引擎来说,网络蜘蛛是非常重要的,因为在垂直搜索领域,数据的收集工作都是由蜘蛛程序来完成的。垂直搜索引擎除了要设计蜘蛛程序外,还要管理这些蜘蛛程序的运行,这是比较复杂的工作。如果缺乏一套有效的管手段,那么垂直搜索引擎将面临一场恶梦。 然而幸运的是,我们有了海蛛--这个领先的垂直搜索专用网络蜘蛛系统。有了海蛛,垂直搜索更简单!使用了海蛛,一切变得有条不紊,变得简单起来。 -The vertical search engine for Web Spider is very
wordsegment1
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!-It s an arithmetc of word segment,it has a very high efficiency!
ChineseTokenizer
- 中文分词演示程序,可以对字符串进行按照词义分词。在搜索技术中有广泛应用。-Chinese Segmentation demo program can be carried out in accordance with the meaning of the string segmentation. In the search technology has wide application.
spider
- 目前流行的网络搜索程序的网络蜘蛛源码。c++实现-netspider
googrep.tar
- 类似于google命令行的字符串搜索,对于全文搜索有参考意义-Google command line similar to the string searching, full text search for the reference value
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅