搜索资源列表
wwsearchv
- 一个基于C++的搜索引擎代码(不包括蜘蛛代码),可用于构建小型搜索引擎以及学习使用。
ShootSearch
- 基于dotlucene的c#开源搜索引擎 基于dotlucene的c#开源搜索引擎
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word
spider2006
- 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。 -C# spider.
Clucene
- CLucene是Lucene的一个C++移植,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。-The CLucene of Lucene a C++ transplant, Lucene is a java-based high-performance full-text search engine. The CLucene because to use C++ write so theoretically than luc
spiderframework-19717
- 一个基于C#的爬虫框架,可以爬取任意网页内容,适合初学者。-a web spider based on C#
