搜索资源列表
WebCrawler
- 网络爬虫,实现网页号码的抓取,功能齐全,-Web crawler, crawling achieve pages numbers, complete functions,
HttpWatchPro_cn
- 网页抓包程序,可抓取地址,发送的参数、发送的字节数以及速率-Web page capture program, you can grab the address, the parameters sent the number of bytes sent and the rate
commons-httpclient-3.0.1-src
- 一些java网络爬虫的实例,通过目标URL,抓取目标网页,通过正则解析,封装发送数据接收地,接收地可是是excel oracle等数据存贮介质-Some examples of java web crawler through the target URL, landing pages crawled through regular analysis, package sending data reception, the receive ground but is excel oracle a
BYD
- 用于网页数据的抓取,网页来源于比亚迪汽车官网-The code comes from BYD web
575645
- iPhone、iPad 网页抓取工具源码,精选ios编程学习源码,很好的参考资料。-IPhone, iPad Webpage gripping tool source code, select learning IOS programming source code, a good reference.
lucene
- 这是java 版的搜索引擎公共模块, 本人使用此模块,已经开发实现了网页的抓取。-java lucene is the public version of the search engine module, I use this module has been developed to achieve a web crawler.
pc
- 爬虫技术,html编写网页抓取内容,可以获取别人网站上的最新新闻-Crawler technology, html web crawling content writing, others can get the latest news on the site
Java
- 是用纯Java开发的,用来进行网站镜像抓取的工具,可以使用配制文件中提供的URL入口,把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地,包括网页和各种类型的文件,如:图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内,并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如:Apache)中,就可以实现完整的网站镜像。-Is pure Java development, used to crawl the site mi
crawler-on-web
- 基于JAVA技术的网页内容抓取抓取http://www.tianyabook.com/sanguo/上的三国演义的所有章节内容(要求纯文本),写入sgyy.txt中。-Web page content based on JAVA technology crawl crawl all chapters on the Three Kingdoms of http://www.tianyabook.com/sanguo/ (requires plain text), written sgyy.txt
WindowsFormsApplication2
- 根据关键字利用多线程抓取百度网页信息!代码简洁,程序完整。-According to the key words using multi-threaded crawling Baidu Webpage information! The code is simple, the integrity of the process.
grab
- 自己写的一个非常实用的网页图片抓取器,可直接运行,大家可以下载下来参考一下-Himself wrote a very practical web images crawl, can be directly run, you can download the reference
HishopAssistant_v1.6.3
- Hishop助理是一个类似淘宝助理的客户端程序,可用来方便的在本地处理商店数据,并能够在Hishop独立网上商店之间、Hishop独立网上商店和第三方平台(比如淘宝、拍拍)之间实现数据上传与下载功能的工具。 1.完全在本地计算机运行,您无需打开网页就可以管理网店,不受网速影响,速度更快,使用更方便 2.可在本地抓取、下载淘宝、拍拍商品数据,可和淘宝、拍拍网店互通数据,商品信息一次输入,多方均可使用,避免重复劳动 3.使用标准windows界面,使您的操作更加快捷、便利 4.
search
- 统一资源定位符(URL)是网站页面的地址判别方式,也是蜘蛛抓取网站网页信息的途径。那搜索引擎蜘蛛是如何通过URL链接抓取网站页面的呢?搜索引擎工作大致分为三个阶段:爬行和抓取阶段(搜索引擎蜘蛛访问页面,并获取页面html代码存入数据库):预处理(对页面文字进行提取、分词、消除噪音、去重 和建立索引);排名(根据页面的相关性和网站权重高低展示给用户)。-Uniform Resource Locator (URL) address discrimination is the way web page
Biostockdata
- 可在网页上抓取数据,给研究提供数据支持,在数据库没有更新数据的情况下及时获得所需数据-Can capture data on the Web, to provide data to support research, to obtain the required data in a timely manner in case the database does not update data
net
- 网页数据抓取,JAVA开发,简单易懂,适合新手学习-web information get
Flashyxzsdz-v2.0
- 一款可以用来对网页flash抓取的程序,效果非常不错,可以-A flash can be used for web crawling program, the effect is very good, you can try
zhuaqudongtaiwangye-manhua
- 抓取漫画网页,到本地,可以无限享受漫画了,只需要运行脚本,漫画自动跟新到本地。非常方便。-Grab comics pages, to the local, you can enjoy unlimited comics, and only need to run the scr ipt automatically updates for local comics. Very convenient.
HtmlAgilityPackDemos
- 使用开源的HtmlAgilityPack抓取和解释网页的例子Demos-Use open source HtmlAgilityPack web crawling and explain examples Demos
SNAP
- VB网页抓图精灵2源码,自带网页浏览器,打开某一网址后,点击抓图按钮,可将本网页完整抓取成图片,原理和以前的截图相似,有兴趣的Vb爱好者可参考。-VB Web Wizard 2 capture source, comes with a Web browser, open a Web site, click on the Capture button, you can crawl into a complete picture of the pages, the principle is simi
phpQuery
- 根据给出的链接地址,获取DOM树,根据树,活的每个元素,从而抓取到web网页的内容-According to the given URL, obtain the DOM tree, the tree, each element of living, which captures the web Webpage content