搜索资源列表
J2EEtools
- j2EE中用到的jar包及说明,包括上传,连接池,excel表导入导出,json串生成,xml,网页抓取等-j2EE used in the jar package and instructions, including upload, connection pooling, excel table import and export, json string generation, xml, web crawling, etc.
httpcomponents-client-4.3-bin
- 1、GET方式 第一步、创建一个客户端,类似于你用浏览器打开一个网页 HttpClient httpClient = new HttpClient() 第二步、创建一个GET方法,用来获取到你需要抓取的网页URL GetMethod getMethod = new GetMethod("http://www.baidu.com") 第三步、获得网址的响应状态码,200表示请求成功 int statusCode = httpClien
cnblogsLogin.java
- 使用httpclient模拟登陆博客网站cnblogs,抓取相关的网页-Using httpclient simulated landing blog site cnblogs, crawl relevant pages
ewrfsr
- 网页抓取、() jquery前台控制、ajax跨域() 客户端处理服务器端发送的json数据。 使用时候请在struts2环境下,其他别无要求。-Web crawling, () jquery reception control, ajax cross-domain () client processing server sends the json data. When used in struts2 circumstances, no other requirements.
commons-httpclient-3.0.1-src
- 一些java网络爬虫的实例,通过目标URL,抓取目标网页,通过正则解析,封装发送数据接收地,接收地可是是excel oracle等数据存贮介质-Some examples of java web crawler through the target URL, landing pages crawled through regular analysis, package sending data reception, the receive ground but is excel oracle a
lucene
- 这是java 版的搜索引擎公共模块, 本人使用此模块,已经开发实现了网页的抓取。-java lucene is the public version of the search engine module, I use this module has been developed to achieve a web crawler.
Java
- 是用纯Java开发的,用来进行网站镜像抓取的工具,可以使用配制文件中提供的URL入口,把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地,包括网页和各种类型的文件,如:图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内,并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如:Apache)中,就可以实现完整的网站镜像。-Is pure Java development, used to crawl the site mi
grab
- 自己写的一个非常实用的网页图片抓取器,可直接运行,大家可以下载下来参考一下-Himself wrote a very practical web images crawl, can be directly run, you can download the reference
ourCrawler
- JAVA 实现的根据主题关键词进行爬虫程序 根据用户关键词来抓取所需要的网页-JAVA be implemented according to the user keyword crawlers to crawl the web by topic keyword needs
WebSpider-v5.1
- 蓝蜘蛛网页抓取,欢迎研究 ,非常不错,可以改造实际程序-get net information, welcome you to study,verygood ,you can make it better for using
Crawler
- 一个爬虫代码,下载页面并分析网页中的url链接,可以做后续修改,做页面抓取分析功能-A reptile code, download web page and analyze the url link, you can make subsequent modifications, do crawl page analysis
webspider
- 网页爬虫程序,可以抓取大多数网页,数据库为mysql,安装文件内附-spider -good soup
JavaBrowser
- 用Java写的一个在浏览器中自动输入信息的程序,可以给需要查询大量用户信息带来便捷。同时有从网页上抓取特定信息导入到excel中的功能-Written in Java a program that automatically input information in the browser, can bring convenient to need to query a large number of user information.At the same time a web crawls
ShanKeDa
- 网页抓取,解析,封装json服务器端,供参考使用-webservice json
mailex
- 一个使用 PHP 正则截断的邮箱采集程序,支持运行在各种 PHP 环境。 使用方法: 1、网址抓取,示范网址:http://www.douban.com/event/14146775/discussion/40108760 可以利用各种搜索引擎进行搜索邮箱,例如说关键字 “ 留下邮箱 ” 就会在百度 / 谷歌等搜索引擎搜索出许许多多的网页,直接输入网址进行采集即可!-A PHP regular use of the mail collection procedure
ecshop-comment-v1.2
- 使用说明 单个商品评价 安装完插件之后,进入Ecshop后台的“商品列表”,会看到如下图: 点击上图的“生成评论”进入单个商品评论配置部分,如下图: 插件根据输入的“商品关键词”到淘宝网搜索相关的热销商品评论,也可以通过“淘宝商品URL”到对应的网页抓取评论,注意: 评论时间设置即第一条评论的开始时间-instructions Individual product uation After installing the plug-in, enter the Ecshop