资源列表
Heri1
- 使用eclipse进行编辑编译,用来抓取网页-net crawler
API_lucene3.0.0
- 最新的lucene3中文api,是了解lucene的最好的学习文档。-The latest lucene3 Chinese api, is to understand the best learning lucene document.
lucene-2.3.2
- Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。
zhihu-master
- 爬虫程序,python语言,希望大家可以交流。。。。。。。。。。。。(Crawler procedures, python language, I hope we can exchange)
lucene-2.3.0
- apache的开源搜索引擎框架,可以用其中的类包轻松建立文档索引程序
heritrixProject
- 搜索引擎的一个分支,在搜索网页时首先得用一个爬虫来获取网址该代码的功能就是获取所需网址的
lucenePnutchPmapreducePsearch-engine
- 三篇关于开源搜索引擎的硕士论文 1、基于Lucene的Web搜索引擎实现 2、基于MapReduce的分布式智能搜索引擎框架研究 3、基于Nutch的垂直搜索引擎的分析与实现-Three open source search engine on the master' s thesis 1, the Web search engine based on Lucene implementation 2, based on the MapReduce framework
ansj
- ictclass的java版本开源实现,用于实现中文分词功能。-the java version that the open source implementation of ictclass
heritrix-1.14.4-src
- heritrix-1.14.4-src
6
- 自己动手写搜索引擎第三章代码,随书光盘中的内容,整个太大,只能分别上传-Chapter code search engine to write himself, with the contents of the CD-ROM, the whole is too big, we were only able to upload
LucenePINPACTION
- lucene in action 中文版; 学习lucene必备书籍-lucene in action Chinese version learning essential books for lucene
heritrix-1.14.3-src
- 这是一个很好的网络爬虫,很适合一般的搜索引擎!-This is a good web crawler, it is suitable for general search engines!