CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 WEB源码 JSP源码/Java 搜索资源 - 网站 抓取

搜索资源列表

  1. WebSpider

    0下载:
  2. 一个抓取程序,可以对有关的基金网站的公布的基金进行抓取显示
  3. 所属分类:JSP源码/Java

    • 发布日期:2008-10-13
    • 文件大小:21193025
    • 提供者:wujun
  1. DataAnalyse521

    0下载:
  2. 数据分析java程序,包含了原始数据的提前,网站数据抓取,数据库存取,文件过滤列表等-dataanalyse java,gui,crawl data
  3. 所属分类:Java Develop

    • 发布日期:2017-05-10
    • 文件大小:2557746
    • 提供者:sss
  1. Java

    0下载:
  2. 是用纯Java开发的,用来进行网站镜像抓取的工具,可以使用配制文件中提供的URL入口,把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地,包括网页和各种类型的文件,如:图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内,并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如:Apache)中,就可以实现完整的网站镜像。-Is developed in pure Java, used to crawl Web site m
  3. 所属分类:Java Develop

    • 发布日期:2017-05-17
    • 文件大小:4943751
    • 提供者:blackieliu
  1. spiderRss

    0下载:
  2. 一个rss 搜索引擎,专门抓取各个rss 聚会网站信息用来分析。 此项目的目录结构、组织相当的规范,包括单元测试、linux shell脚本等等。对于学习java来说是一个非常正规、标准的写代码案例。-A rss search engine dedicated to capture all the information to analyze site rss gathering. The project directory structure, organization fairly stan
  3. 所属分类:Java Develop

    • 发布日期:2017-05-19
    • 文件大小:5236571
    • 提供者:truman xu
  1. a

    0下载:
  2. 企业网站抓取新闻的利器,在线新闻及时抓取系统-Web crawling tool for corporate news, online news and timely capture system
  3. 所属分类:Java Develop

    • 发布日期:2017-03-31
    • 文件大小:571002
    • 提供者:jeff
  1. Webpagemonitoring

    0下载:
  2. 通过抓取页面并获得返回值来监控网站 通过conf配置要抓取的页面。 如果抓取失败,会调用IE浏览器打开再次确认。并音乐报警,具体看源码,很早的代码了,音乐报警的路径写死了,有兴趣的自己改改用。 log里有详细的失败日志,便于查询并处理。 该程序采取防死锁功能,即有线程监控主线程是否死锁——如果网站一直处于等待便是死锁。那么会报警,但有时仍然会发生死锁。这还是http无状态链接的问题。 很久以前的老程序,源代码没了,用java反编译工具反编译的源代码,凑合用吧。
  3. 所属分类:Java Develop

    • 发布日期:2017-04-06
    • 文件大小:7868
    • 提供者:yuandejiong
  1. NekoHtml

    0下载:
  2. 抓取网站内容,输入指定条件下,例如网址 www.google.com.cn-Grab website content, enter the specified conditions, such as site www.google.com.cn
  3. 所属分类:Java Develop

    • 发布日期:2017-04-13
    • 文件大小:1730
    • 提供者:ddzz
  1. javacrewhtml

    0下载:
  2. java解析html抓取网站数据,-Download html file with java
  3. 所属分类:Java Develop

    • 发布日期:2017-05-06
    • 文件大小:1220880
    • 提供者:陈信
  1. www

    1下载:
  2. 输入URL,可以下载指定URL的HTML文件,对于有不允许复制内容的网站有信息抓取功能-Enter the URL, you can specify a URL to download the HTML file, there may not copy the content for the website there is information capture function
  3. 所属分类:Java Develop

    • 发布日期:2017-04-11
    • 文件大小:911
    • 提供者:杨燕翔
  1. metastudio_Linux_gcc_gecko1.8_zh

    0下载:
  2. MetaSeeker工具包V3是GooSeeker团队自主开发的网页抓取/数据抽取/信息提取软件,经历了垂直搜索、SNS等多个互联网浪潮的实战检验,已经发展到V3版本,并且分成企业版和在线版,对于不愿支付昂贵的企业版费用的用户可以免费下载使用在线版。 MetaSeeker工具包V3版本包括如下软件工具: 1,MetaStudio,网页数据结构定义工具,通过图形界面免编程定义网站数据抓取规则 2,DataScraper,数据抽取工具,能够连续大批量抓取网页内容,不是普通的网络爬虫,而是适应力-Me
  3. 所属分类:Java Develop

    • 发布日期:2017-03-29
    • 文件大小:326999
    • 提供者:highyun
  1. Test

    0下载:
  2. 抓取页面内容,通过HttpURLConnection对指定路径的网站内容进行抓取-Crawl the page content, to crawl through the site content HttpURLConnection for the specified path
  3. 所属分类:Java Develop

    • 发布日期:2017-04-05
    • 文件大小:705
    • 提供者:wangyong
  1. ip138

    0下载:
  2. 实现从ip138网站抓取手机号码存入mysql数据库当中,可以随时随地查询手机号的归属地。-Ip138 web site that captures the phone number in the database, you can always mysql of the number of ownership.
  3. 所属分类:Java Develop

    • 发布日期:2017-04-03
    • 文件大小:30537
    • 提供者:于斌
  1. Hostel

    0下载:
  2. 网站抓取信息,通过jsoup和httpclient两种抓取方式-Site' s crawl through crawl in both jsoup and httpclient
  3. 所属分类:Java Develop

    • 发布日期:2017-12-08
    • 文件大小:1838378
    • 提供者:hani
  1. MyCrawler

    0下载:
  2. 简单网络爬虫,可以设置一些自己喜欢的网站,会自动抓取图片。-Simple web crawler, you can set some of your favorite sites, and will automatically grab the picture.
  3. 所属分类:Java Develop

    • 发布日期:2017-12-03
    • 文件大小:19058
    • 提供者:何国泰
  1. jsoupAPI

    0下载:
  2. Java抓取网站数据,语法类似于jquery,很简单,很容易上手,比起用httpclient抓取数据方便的多-Java crawl Website data
  3. 所属分类:Java Develop

    • 发布日期:2017-11-18
    • 文件大小:46525
    • 提供者:luyongfa
  1. MiddleWareTest

    0下载:
  2. 一个中间件的demo,比较简单。从网页(此处是自己搭建的网站)上抓取数据之后,转换成json对象以供调用。-A middleware demo, is relatively simple. Grab data from the website (here is to build their own website), convert the json object to call.
  3. 所属分类:Jsp/Servlet

    • 发布日期:2017-12-07
    • 文件大小:6536933
    • 提供者:keno2310
  1. lzzSearch-0.4

    0下载:
  2. 1 完全基于人工收录,每个被收录的帖子都是我们认为不错的。 2 任何人都可以加入,别人也可以分享到你加入的内容 3 收录的内容,不是简单的抓取,而是只收录里面最有用的部分,比如主题,内容,作者,发言时间等 4 由于上一个的原因,所以不是任何网站都能加入,后面有目前支持的网站列表。 5 增加新的网站支持,需要写3个正则表达式,进行帖子内容的精确匹配 6 使用Lucene进行存储和查询 7 开源,可以在自己的机器上部署一个,拥有自己的收藏和搜索工具。 8 同
  3. 所属分类:Jsp/Servlet

    • 发布日期:2017-11-27
    • 文件大小:7293734
    • 提供者:王京
  1. cnblogsLogin.java

    0下载:
  2. 使用httpclient模拟登陆博客网站cnblogs,抓取相关的网页-Using httpclient simulated landing blog site cnblogs, crawl relevant pages
  3. 所属分类:Java Develop

    • 发布日期:2017-04-13
    • 文件大小:1689
    • 提供者:叶子
  1. Java

    0下载:
  2. 是用纯Java开发的,用来进行网站镜像抓取的工具,可以使用配制文件中提供的URL入口,把这个网站所有的能用浏览器通过GET的方式获取到的资源全部抓取到本地,包括网页和各种类型的文件,如:图片、flash、mp3、zip、rar、exe等文件。可以将整个网站完整地下传至硬盘内,并能保持原有的网站结构精确不变。只需要把抓取下来的网站放到web服务器(如:Apache)中,就可以实现完整的网站镜像。-Is pure Java development, used to crawl the site mi
  3. 所属分类:Java Develop

    • 发布日期:2017-05-22
    • 文件大小:6236079
    • 提供者:涂惠明
  1. fudu365_src

    1下载:
  2. voa英语学习(英语听力)网站源码是一个广大英语学习爱好者喜欢的英语听力网站,网站以VOA英语(慢速英语)为听力学习材料,首创建英语复读模式,目前新版本已经推出了英语学习资料,英语学习经验,学习视频等实用功能,而且我们觉得voa英语复读网项目本身技术含量好,对于初学者或建站人员都有帮助,所以将项目代码免费共享给大家,网站项目的主要功能包括: 一、j2ee架构的,ssh框架组合。 二、Memcached缓存框架的使用。 三、flex英语复读机。 四、邮件发送实现。 五、文章自动
  3. 所属分类:JavaScript

    • 发布日期:2017-06-10
    • 文件大小:17207890
    • 提供者:苏蓉
« 12 »
搜珍网 www.dssz.com