搜索资源列表
harvest-1.6.1.tar.gz
- 又一个建立索引的搜索引擎
swish-efiles.1.3.2.tar.gz
- 用C语言写的搜索引擎,包含多种建立索引的方式
Nalanda-iVia-Crawler-1.0.1.tar
- 主题爬行源码.很经典的.对研究主题爬行的人很有帮助.-theme crawling source. Very classic. The themes were very helpful crawling.
combine_3.4-1.tar
- combine Focused Crawler
htdig-3.1.6.tar
- 比较大型的网络搜索引擎,C++实现,可惜只支持unix系统-relatively large network search engines, C realized, but unfortunately, only unix support system
asearchd-1.01.tar
- 开源搜索引擎源代码,供大家深入理解搜索引擎源码!
locust-1.01.tar
- 开源搜索引擎源代码,供大家深入理解搜索引擎源码!
xapian-omega-1.0.2_svn9209.tar
- 一个linux开源的搜索引擎源代码, 使用C++代码编写的。
apache-tika-0.1-incubating-src.tar
- apache基金项目tika,是一个可以对内容进行分析、提取的开发包,结合正则开发包,可以开发基于垂直搜索引擎,目前正处于孵化阶段,这里是目前的最新版本
swish-efiles.1.3.2.tar
- 用C语言写的搜索引擎,包含多种建立索引的方式-C serach engine, contains many methods for index establishing
larbin_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system. www.av.com robot similar to the rapid indexing tool for Internet web pages cable guidelines generation
larbn_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 > 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 > 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system, similar to the robot www.av.com indexing tools
ModestMaps-1.0.tar
- 一个用flex技术实现的地图开源代码。 可以实现google map之类的地图-A flex technology with open source code of the map. Can be achieved, such as google map map
lucene-1.2-src.tar
- 学搜索引擎必须看的经典 入门的经典资料 代码特少-Science search engine must see classic classic data entry code small
hispider-0.1.4.tar
- hispider.tar.gz Http请求与发送示例-hispider.tar.gz Http request and send sample
lucene-2.4.1-src.tar
- Lucene是apache软件基金会[4] jakarta项目组的一个子项目,是一个开放源代码[5]的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 Lucene的原作者是Doug Cutting,他是一位资深全文索引/检索专家,曾经是
aspell-0.60.6.tar-1
- aspell,搜索查询时的拼写检查程序,同时给出建议的词语。-aspell, at the time of the search query spelling checker, given the proposed terms at the same time.
aspseek-1.2.10.tar
- STL写的搜索引擎, 有lucence还有larbin 的功能但是要比他们都好. -STL to write a search engine, there are also lucence than larbin functions but they are good.
SogouT.mini.tar
- 百度搜索引擎具有响应速度快、查找结果准确全面、时效性强、无效链接少、符合中文语言特点和中国人使用习惯等优点。 1...这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定- IHTMLDocument3* pHTMLDoc3 HRESULT hr = m_pHTMLDocument2->QueryInterface(IID_IHTMLDocument3, (LPVOID*)&pHTMLDoc3)
google-blog-CodePub.tar
- Google “解放数据”(Data Liberation)团队今天正式发布 Google Blog Converters 1.0,该开源工具可以让你在不同博客服务之间自由转移文章和评论数据。第一个版本提供了 Python 程序库及相关可执行脚本,用于相互转换 Blogger、LiveJournal、MovableType 和 WordPress 导出的各种数据文件格式。-Google " the liberation of Data" (Data Liberation) te
