搜索资源列表
文本聚类的文档.tar
- 文本聚类的文档-text of the document clustering
一种实现中文HTML文档自动聚类的方法
- 让你的检索更精确——一种实现中文HTML文档自动聚类的方法-let you search more accurate -- A Chinese automatic HTML document clustering methods
NewsSpider
- 我以前自己写的能够抓取新闻的新闻蜘蛛。上载的包中有文档。代码中也有注释。-past, I wrote it myself to crawl business news spiders. Upload the files included in the package. The code also notes.
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
bdxt
- 搜索链接。包括网页、黄页、文档、新闻、MP3、英语翻译、书籍搜索等-search link. Including web, yellow pages, documents, news, MP3, English translation, book search
43554TheResearchandDesignofSearchEngine
- 搜索引擎的研究与设计.rar The Research and Design of Search Engine 吉 林 大 学 硕 士 学 位 论 文 搜索引擎(Search Engine)是一个对互联网上的信息资源进行搜集整理, 然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分,以目 录分类或全文检索的方式来提供查询服务。本文提出了一种简化的向量空间检 索模型,通过统计主题词条对文档的贡献度来建立倒排序索引库,为用户提供 智能的检索服务。-search
sogzq
- 功用:跟踪搜索引擎的蜘蛛(BOT),并进行记录,提供在线察看和生成cvs格式文档下载。-function : tracking search engine spiders (BOT), and make a record, View online and generate cvs format files downloaded.
htmlparser
- HTML的解析器,是Majestic-12分布式搜索引擎的一部分。作者Alex Chudnovsky, Majestic-12 Ltd (UK)。这个是3.0版本,性能经过多次优化,文档也比较全。也可以到http://www.majestic12.co.uk下载。-HTML parser, Majestic-12 distributed search engine part. Author Alex Chudnovsky, Majestic-12 Ltd (UK). This is versio
SEO
- 搜索引擎优化 通向成功十步 这个文档是通向SEO的一步 SEO,学会了就不用去担心程序员不好找工作了。-search engine optimization leading to the successful 10-step documentation is a step towards SEO SEO, learned not worried spent programmers not easy to find work.
lab2-indexing
- 实现了搜索引擎中的建立索引的部分,里面有详细的文档说明-realized the search engine of the establishment of the index, with a detailed document shows
lucene-2.3.0
- apache的开源搜索引擎框架,可以用其中的类包轻松建立文档索引程序
hyperestraier-1.4.13
- 1.Hyper Estraier是一个用C语言开发的全文检索引擎,他是由一位日本人开发的.工程注册在sourceforge.net(http://hyperestraier.sourceforge.net). 2.Hyper的特性: 高速度,高稳定性,高可扩展性…(这可都是有原因的,不是瞎吹) P2P架构(可译为端到端的,不是咱们下大片用的p2p) 自带Web Crawler 文档权重排序 良好的多字节支持(想一想,它是由日本人开发的….) 简单实用的A
CompileCHMDemo
- 很多人问起现在的CHM帮助文档如何作为软件的热点敏感帮助,网上搜索的资料也不多,可能是太简单了吧,呵呵!今天整理了一下,详细的介绍在VC开发的软件中对CHM帮助文档的调用方法以及CHM帮助文档的制作要求。
ten_search
- 文档中给出了常用的十种搜索查找资料的方法,希望能给大家一些帮助。
Lucene
- 这是有关lucene管理的文档,若想学lucene的话可一参考一下
200473133406
- java语言编的搜索引擎源代码,还有一些帮助文档-series of the search engine source code, some help documentation
200473133506
- java语言编的搜索引擎源代码,附上帮助文档-series of the search engine source code, help documentation attached
sxt_Lucene.rar
- 尚学堂的一个很不错的搜索引擎开发案例,内有详细开发文档及源码.,The school is still a very good search engine development case, which detailed the development documentation and source code.
TSE_tutorial
- 这个文件是和北大TSE搜索引擎配套的更详细的文档,希望对大家有所帮助!-This document is a search engine, and Beijing University TSE more detailed supporting documents, I hope all of you to help!
学习记录文档
- solr文档, Elasticsearch文档(solr and elasticsearch study doc)