搜索资源 - 网站抓取 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 网站抓取

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

ASP源码

ASPX.NET源码

PHP源码

JSP源码/Java

FlashMX源码

Perl源码

其它源码

SilverLight

搜索资源列表

WebSpider

0下载：
一个抓取程序，可以对有关的基金网站的公布的基金进行抓取显示
所属分类：JSP源码/Java
- 发布日期：2008-10-13
- 文件大小：21193025
- 提供者：wujun

DataAnalyse521

0下载：
数据分析java程序，包含了原始数据的提前，网站数据抓取，数据库存取，文件过滤列表等-dataanalyse java，gui，crawl data
所属分类：Java Develop
- 发布日期：2017-05-10
- 文件大小：2557746
- 提供者：sss

Java

0下载：
是用纯Java开发的，用来进行网站镜像抓取的工具，可以使用配制文件中提供的URL入口，把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地，包括网页和各种类型的文件，如：图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内，并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如：Apache)中，就可以实现完整的网站镜像。-Is developed in pure Java, used to crawl Web site m
所属分类：Java Develop
- 发布日期：2017-05-17
- 文件大小：4943751
- 提供者：blackieliu

spiderRss

0下载：
一个rss 搜索引擎，专门抓取各个rss 聚会网站信息用来分析。此项目的目录结构、组织相当的规范，包括单元测试、linux shell脚本等等。对于学习java来说是一个非常正规、标准的写代码案例。-A rss search engine dedicated to capture all the information to analyze site rss gathering. The project directory structure, organization fairly stan
所属分类：Java Develop
- 发布日期：2017-05-19
- 文件大小：5236571
- 提供者：truman xu

a

0下载：
企业网站抓取新闻的利器,在线新闻及时抓取系统-Web crawling tool for corporate news, online news and timely capture system
所属分类：Java Develop
- 发布日期：2017-03-31
- 文件大小：571002
- 提供者：jeff

Webpagemonitoring

0下载：
通过抓取页面并获得返回值来监控网站通过conf配置要抓取的页面。如果抓取失败，会调用IE浏览器打开再次确认。并音乐报警，具体看源码，很早的代码了，音乐报警的路径写死了，有兴趣的自己改改用。 log里有详细的失败日志，便于查询并处理。该程序采取防死锁功能，即有线程监控主线程是否死锁——如果网站一直处于等待便是死锁。那么会报警，但有时仍然会发生死锁。这还是http无状态链接的问题。很久以前的老程序，源代码没了，用java反编译工具反编译的源代码，凑合用吧。
所属分类：Java Develop
- 发布日期：2017-04-06
- 文件大小：7868
- 提供者：yuandejiong

NekoHtml

0下载：
抓取网站内容,输入指定条件下,例如网址 www.google.com.cn-Grab website content, enter the specified conditions, such as site www.google.com.cn
所属分类：Java Develop
- 发布日期：2017-04-13
- 文件大小：1730
- 提供者：ddzz

javacrewhtml

0下载：
java解析html抓取网站数据，-Download html file with java
所属分类：Java Develop
- 发布日期：2017-05-06
- 文件大小：1220880
- 提供者：陈信

www

1下载：
输入URL，可以下载指定URL的HTML文件，对于有不允许复制内容的网站有信息抓取功能-Enter the URL, you can specify a URL to download the HTML file, there may not copy the content for the website there is information capture function
所属分类：Java Develop
- 发布日期：2017-04-11
- 文件大小：911
- 提供者：杨燕翔

metastudio_Linux_gcc_gecko1.8_zh

0下载：
MetaSeeker工具包V3是GooSeeker团队自主开发的网页抓取/数据抽取/信息提取软件，经历了垂直搜索、SNS等多个互联网浪潮的实战检验，已经发展到V3版本，并且分成企业版和在线版，对于不愿支付昂贵的企业版费用的用户可以免费下载使用在线版。 MetaSeeker工具包V3版本包括如下软件工具： 1，MetaStudio，网页数据结构定义工具，通过图形界面免编程定义网站数据抓取规则 2，DataScraper，数据抽取工具，能够连续大批量抓取网页内容，不是普通的网络爬虫，而是适应力-Me
所属分类：Java Develop
- 发布日期：2017-03-29
- 文件大小：326999
- 提供者：highyun

Test

0下载：
抓取页面内容，通过HttpURLConnection对指定路径的网站内容进行抓取-Crawl the page content, to crawl through the site content HttpURLConnection for the specified path
所属分类：Java Develop
- 发布日期：2017-04-05
- 文件大小：705
- 提供者：wangyong

ip138

0下载：
实现从ip138网站抓取手机号码存入mysql数据库当中，可以随时随地查询手机号的归属地。-Ip138 web site that captures the phone number in the database, you can always mysql of the number of ownership.
所属分类：Java Develop
- 发布日期：2017-04-03
- 文件大小：30537
- 提供者：于斌

Hostel

0下载：
网站抓取信息，通过jsoup和httpclient两种抓取方式-Site' s crawl through crawl in both jsoup and httpclient
所属分类：Java Develop
- 发布日期：2017-12-08
- 文件大小：1838378
- 提供者：hani

MyCrawler

0下载：
简单网络爬虫，可以设置一些自己喜欢的网站，会自动抓取图片。-Simple web crawler, you can set some of your favorite sites, and will automatically grab the picture.
所属分类：Java Develop
- 发布日期：2017-12-03
- 文件大小：19058
- 提供者：何国泰

jsoupAPI

0下载：
Java抓取网站数据,语法类似于jquery，很简单，很容易上手，比起用httpclient抓取数据方便的多-Java crawl Website data
所属分类：Java Develop
- 发布日期：2017-11-18
- 文件大小：46525
- 提供者：luyongfa

MiddleWareTest

0下载：
一个中间件的demo，比较简单。从网页（此处是自己搭建的网站）上抓取数据之后，转换成json对象以供调用。-A middleware demo, is relatively simple. Grab data from the website (here is to build their own website), convert the json object to call.
所属分类：Jsp/Servlet
- 发布日期：2017-12-07
- 文件大小：6536933
- 提供者：keno2310

lzzSearch-0.4

0下载：
1 完全基于人工收录，每个被收录的帖子都是我们认为不错的。 2 任何人都可以加入，别人也可以分享到你加入的内容 3 收录的内容，不是简单的抓取，而是只收录里面最有用的部分，比如主题，内容，作者，发言时间等 4 由于上一个的原因，所以不是任何网站都能加入，后面有目前支持的网站列表。 5 增加新的网站支持，需要写3个正则表达式，进行帖子内容的精确匹配 6 使用Lucene进行存储和查询 7 开源，可以在自己的机器上部署一个，拥有自己的收藏和搜索工具。 8 同
所属分类：Jsp/Servlet
- 发布日期：2017-11-27
- 文件大小：7293734
- 提供者：王京

cnblogsLogin.java

0下载：
使用httpclient模拟登陆博客网站cnblogs，抓取相关的网页-Using httpclient simulated landing blog site cnblogs, crawl relevant pages
所属分类：Java Develop
- 发布日期：2017-04-13
- 文件大小：1689
- 提供者：叶子

Java

0下载：
是用纯Java开发的，用来进行网站镜像抓取的工具，可以使用配制文件中提供的URL入口，把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地，包括网页和各种类型的文件，如：图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内，并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如：Apache)中，就可以实现完整的网站镜像。-Is pure Java development, used to crawl the site mi
所属分类：Java Develop
- 发布日期：2017-05-22
- 文件大小：6236079
- 提供者：涂惠明

fudu365_src

1下载：
voa英语学习(英语听力)网站源码是一个广大英语学习爱好者喜欢的英语听力网站，网站以VOA英语（慢速英语）为听力学习材料，首创建英语复读模式，目前新版本已经推出了英语学习资料，英语学习经验，学习视频等实用功能，而且我们觉得voa英语复读网项目本身技术含量好，对于初学者或建站人员都有帮助，所以将项目代码免费共享给大家，网站项目的主要功能包括：一、j2ee架构的,ssh框架组合。二、Memcached缓存框架的使用。三、flex英语复读机。四、邮件发送实现。五、文章自动
所属分类：JavaScript
- 发布日期：2017-06-10
- 文件大小：17207890
- 提供者：苏蓉

« 12 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.