搜索资源列表
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
Lucene
- .net写的luncen 可以参考写搜索 索引之类
IKAnalyzer2.0.2
- Java lucene开源全文搜索,中文分词组件
je-analysis-1.5.3
- java lucene 开源全文检索,中文分词组件之 je-analysis-1.5.3
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
PDFBox-0.6.7a
- 采用java编写的处理PDF文档的程序,可从PDF文档中抽取txt文本,可与lucene搜索引擎相结合。-adopting the java programs compiled to dispose the PDF document, taking out the txt text from the PDF document, and combining with the lucene searcher.
lucene2.0 src
- lucene2.0 源文件
luncene查询分析器中文词典
- 中文分词词库
搜索引擎分词支
- 搜索引擎分词支持Lucene.net.rar
SearchEnginePrincipleTechnolog
- 结合实际例子“天网”详细介绍搜索引擎原理,Combination of practical examples of " Sky Net" and the principle of detailed search engine
webSearch.rar
- 基于lucene的垂直搜索引擎,支持上亿级数据的全文查询,时间在毫秒级。,Lucene-based vertical search engine, the 100 million to support the full text of query data, the time in milliseconds.
pangusegment-80115
- PanGuSegment 这个是盘古分词的组件包,包括 PanGu.dll 盘古分词的核心组件 DictManage.exe 字典管理工具 Demo.exe 分词演示程序 PanGu.HighLight.dll 高亮组件 PanGu4Lucene 这个是盘古分词针对Lucene.net 提供的接口 PanGu.Lucene.Analyzer.dll 盘古分词针对Lucene.net 的接口组件 PanGu.Lucene.ImportTool.exe 示例程
JSearchEngine
- lucene search engine with pagerank
UindexWeb_SVN189
- 开源的web搜索源码uindex最新版。采用lucene索引,前台使用.net开发。
StandardTokenizer
- 分词算法的测试 基于lucene 的分词算法设计-segment the chinese word
nut_source_1.0a6
- lucene + hadoop 分布式索引,希望对开发搜索引擎的同志有帮助-lucene+ hadoop distributed index, hope to develop a search engine to help comrades
compass
- compass对lucene行进了封装 这个是对compass的应用,index的建立,搜索以及高级搜索-compass on the lucene marching compass of the package, this is the application, index creation, search and advanced search
SearchEngine
- 基于lucene的在线新闻搜索系统以及相关文档-Lucene-based search system for online news and related documents
tips_for_search_technoloyg_paper
- 自己网上整理的文献搜索技巧,觉得蛮实用的。正所谓授人于鱼,不如授人于渔。 当你不在学校或者科研机构的时候,其实电信网也可以下载文献,free。-Finishing their own online literature search skills, find quite useful. Is the so-called delegate to the fish, it is better to delegate to the fishery. When you are not schools