搜索资源列表
labn
- .面向搜索引擎设计---使用Url重写技术,增加搜索引擎收录的机会。 2.界面友好,操作简便 性能进行了优化,速度快。 3.Aspx文件全部采用codebehind进行代码分离,界面修改容易。 4.系统管理员可设置默认风格,用户可自由选择系统风格。 5.可设推荐新闻和首页新闻. 6.可设置首页滚动图片,并自动生成缩略图。 7.新闻图片可以方便的在线上传。 8.新闻审核和浏览计数功能。 9.采用(类似Word)的编辑方式,可以方便的进行图文新闻混排。
spider1_2
- 一个简单的搜索引擎爬虫系统,可以通过简单的配置架设一个爬虫集群
mp3
- mp3搜索引擎, 配置文件在config.php中,修改即可
SearchEngine
- 1.这是一个简单的采用了Lucene的搜索引擎,本例子采用lucene+struts+ibatis的框架进行开发,使用的数据库是Oracle,搜索源是jpetstore的product表,大家在使用的时候请根据实际情况修改database.properties文件的配置。 2.本例子支持中文搜索,相关的源码包在cnSolution目录。
src
- 从网上找了很久,没找到合用的,就自己写了一个根据配置文件keyword.txt批量多线程下载图片的程序。比较简单,但很实用。不用一个个从image.google.com或者images.baidu.com上扒拉图片了。下次该给起个很酷的名字,叫图片吸血鬼,好像有了
spider1.20PforPwindows
- 微博爬虫连接数据库爬去新浪博客用户数据 配置数据库 1.00 测试版 正常运行 爬虫 新浪博客 3.5 或 4版本 添加图片下载通道开关 -Microblogging reptiles crawled Sina blog users connect to the database data Configuration Database 1.00 beta running reptile Sina blog version 3.5 or 4 channel switch to ad
Lucene+Nutch
- 该书首先描述了开发平台的配置, 接着详细介绍LUCENE和NUTCH开发。-The book first describes the development platform configuration, and then details the development of Lucene and NUTCH.
MySo
- 例子以拍拍网为例下载网页,最大线程1024,但是要比较好的网络条件下,机器配置比较高才不会处问题哦,在服务器上测试效果很好。-Patted network example to download page as an example, the biggest thread 1024, but relatively good network conditions, the machine configuration will not compare Gao Cai Department issue
risearch
- RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
NetBoverticalsearchengine
- 网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合; 4.最新新闻系统已增加伪静态与全站生成静态功能。 5.后台地址:htt://xxx/admin/login.aspx,后台用户名:webhww 密码:http://s.webabc.com.cn/-Net Bo vertical
NewsCollection
- 新闻采集,可配置成采集任意新闻.包括图片自动下载,过滤HTML等功能-news collection
VSSERROR
- 介绍相关VSS配置管理的相关问题,网络上搜索整理出来的,希望对大家有用-I don t know what did I SAY?
solr
- 关于solr的介绍,介绍了solr的配置、启动、索引、查询等功能。-about solr
larbin-2.6.3
- larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网
chuizhisearch
- wangbo垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合;-wangbo vertical search engine that fully open-source version of one. front with Lucene search engine capabilities, all
staticPageDemo
- 如何增强你网站中地址的可读性和让搜索引擎快速的收录到你的站点,这就需要你美化你的网页的地址,也就是我们常说的Url 重写技术,大家熟悉的可能有很多服务器都提供Url重写的技术,以前我们用的最多的就是Apache,Jboss这样一些服务器自带的一些Url重写,但是他们的配置比较麻烦,性能又不是太好,现在我们有专一的开源框架来完成Url重写任务,今天我要介绍的就是UrlRewriter-How to enhance the readability of your website address an
larbin-2.6.3
- 一个高效的网络爬虫,可以自行修改配置文件,为linux下工作环境,很具有参考意义-An efficient Web crawler that can modify configuration files for linux work environment, it is a reference value
SearchEngine
- 这是一套拿去就能用的Java毕业论文资料,内含JAVA技术实现搜索引擎的源代码、技术文档、编译JAR文件,如果你想偷懒的话,拿去就能用了。尤其是作者的文档写的很有水平,足以看出下了一番功夫,源代码也比较完整,不过环境配置比较麻烦。-This is a set of Java with the thesis will be able to take information technology to achieve search engine contains the JAVA source co
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
spider2006
- 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。 -C# spider.