资源列表
lucene.net
- lucene.net完全入门教程 很有用的东西 对初学者来说不错-Getting Started Guide lucene.net completely useful things for good for beginners
Z-emailCollector
- 1、它类似于一个蜘蛛程序,可以分析抓取到的每个网页,找出网页上面的email地址并将其提取出来; 2]kIqn*] 2、它又类似于一个人,可以选择点击什么样的链接,不点击什么样的链接,而不是每个链接都点击; V>bfNQK 3、它也可以选择自己感兴趣的邮箱地址进行提取并保存,而不是每个邮箱地址都抓取; 5n{Ap|E3 4、它可以根据您的指示忠实的完成第2步和第3步的功能。 oh1n+ Z 5、它可以根据您的指示将抓取到的邮箱地址列表保存在任何位置
sphinx-0.9.8-rc2-chinese
- 搜索引擎,和MYSQL结和搜索网站的内容,速度极快,可以达到0.00XX秒.-Search engine, and MYSQL node and search site, extremely fast, can be achieved 0.00XX seconds.
crawl-0.4
- c语言实现的html爬虫,开发网页爬虫的参考资料-c language implementation of the html reptiles, developing web crawler reference! ! !
cs
- 该论文是石光明教授发布的第一篇关于压缩感知的中文论文,简要系统的介绍了压缩感知的相关理论-Professor Shi Guangming of the thesis was first published in Chinese papers on compressed sensing, a brief introduction to the compression system, the related theories of perception
SogouLinkMini
- 搜狗实验室的网页链接关系迷你版!可用于搜索引擎的网页测试!-Sogou web link relationship lab mini version! Web search engine can be used to test!
heritrix1.14.4
- heritrix1.14.4.zip版,欢迎下载-heritrix1.14.4.zip version, welcome to download
sousuoyinqing
- 用mfc实现的一个简单的搜索引擎框架,用mfc实现的一个简单的搜索引擎框架-Mfc achieved with a simple search engine framework, with mfc to achieve a simple search engine framework
Wiley.SEO.Search.Engine.Optimization.Bible
- SEO(Search Engine Optimization),汉译为搜索引擎优化,为近年来较为流行的网络营销方式,主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会。分为站外SEO和站内SEO两种.SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。-One of the grievous mista
HZ_Freq
- java中文分词系统,可供大家学习,祝成功路上越走越远!-Java wordseg program
kfeng
- K封搜索·好东西,下载用的·很不错·····下载实验下吧-K seal search a good thing, download download experiment with the very good under the bar
MetaSeeker-4.11.2
- 主要应用领域: • 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 • 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化
