搜索资源列表
weblucene
- Lucene Web interface, use XML as a lightweight protocol. developer can convert data source (text, DB, MS Word, PDF... etc) into xml format, indexing with lucene engine, and get full text search result via HTTP, with XML format output, user can easily
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
Searcharoo
- web search engine: refactored to search Word, PDF and more
Manning.Lucene.in.Action
- Lucene是一个开源世界瑰宝- 高度可扩展的,快速的搜索引擎。它提供的性能,是disarmingly易于使用。在行动Lucene是Lucene的权威指南。它描述了如何索引你的类型,包括你一定要知道,如MS Word,PDF格式,HTML和XML数据。它向您介绍了搜索,排序,筛选,突出搜索结果。 -Lucene is a gem in the open-source world--a highly scalable, fast search engine. It delivers perfo
red-piranha-4-alpha-snapshot-src
- Red-Piranha是一个开源搜索系统,它能够真正”学习”你所要查找的是什么。Red-Piranha可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎,或与wiki结合作为一个知识/文档管理解决方案,或搜索你要的RSS聚合信息,或搜索你公司的系统(包括SAP,Oracle或其它任何Database/Data source),或用于管理PDF,Word和其它文档,或作为一个提供搜索信息的WebServic
Search.test1
- 主要是測試以asp.net下載網路上的檔案,並可以解析word,excel,pdf格式的檔案為文字檔。限制:必須安裝office 2-The test asp.net download files over the Internet, and can parse word, excel, pdf format file as a text file. Restrictions: must install office 2000
