搜索资源列表
SubjectSpider_ByKelvenJU
- 1、锁定某个主题抓取; 2、能够产生日志文本文件,格式为:时间戳(timestamp)、URL; 3、抓取某一URL时最多允许建立2个连接(注意:本地作网页解析的线程数则不限) 4、遵守文明蜘蛛规则:必须分析robots.txt文件和meta tag有无限制;一个线程抓完一个网页后要sleep 2秒钟; 5、能对HTML网页进行解析,提取出链接URL,能判别提取的URL是否已处理过,不重复解析已crawl过的网页; 6、能够对spider/crawler程序的一些基本参数进行
WebBrowser
- Java写的简单浏览器。 没有单独解析http协议,接受后直接用文本编辑器打开,能实现简单格式的网页显示(图片和超级链接)。 此代码是我们老师提供给我们的例子。
java
- 代理服务器打开一个端口接收浏览器发来的访问某个站点的请求,从请求的字符串中解析出用户想访问哪个网页,让后通过URL对象建立输入流读取相应的网页内容,最后按照web服务器的工作方式将网页内容发送给用户浏览器
SimpleHTMLParser
- 一个网页解析程序
webgame04
- 网页游戏白之塔,CGI环境源码,需要进行perl解析
JAVA_Browser
- Java编写的简单浏览器代码,可以浏览网页,不过对CSS解析不太好
5.3.4--URL提高(动态获取网页代码)
- 本实例介绍如何通过给定的url解析url,并获得url的信息及如何在java中获取网页源代码-examples of how this through to the url analytic url, url and receive the information and how to obtain the java website source code
HtmlParser.rar
- 实现网页文本的提取,解析网页文件。去除网页中的标记标签!,The realization of the page text extraction, analysis page document. Removal of the tag label page!
heritrixexample
- 对网页进行解析并抓取,用Java语言编写的。在heritrix中比较常用的-Analysis of web pages and crawl, using Java language. In the more commonly used heritrix
lzzSearch-1.01
- 网页采集系统 === === ===== 安装配置 --- - 1 程序我就不说了 2 配置文件 applicationContext.xml 里面有详细的注释 3 已经包含了多个论坛博客的参数,如CSDN论坛、博客园、新浪博客、百度Hi、ccidnet等的解析参数 需要的类库 --------- 1 Spring 2.5 2 common-logging 1.1 3 paoding-analysis 2.0.4-beta
html
- 解析html网页,可以抓取网页中的部分内容-Analysis of html pages, you can crawl the content of some of the page
GetWebHTMLCode
- 输入网页,可以获取网页的客户端解析htm源码。-Input page, the client can get the page source code parsing htm.
joyhtml-0.2.2
- joyHtml 解析网页内容的java类库-joyHtml parse Web page content java class library
SearchKeywords
- 在指定的网页上搜索关键字。本程序主要给出搜索指定的网页设计思路,涉及到如何取得指定网页内容、分析网页内容、在网页内容中进行检索和对HTML文本进行解析后可以分离出各种标记或元素。-Pages in the search keywords specified. This procedure gives the main search for specific web design ideas, related to how to achieve the specified page content
DOMphpQuery-0.9.5.386s
- 在php中解析网页,方便程序员解析网页内容-DOMphpQuery
ReadHTMLContents
- java读取分析、解析网页内容,提取关键词,各个块的内容,网页格式可以是html, htmls等-java read the analysis, content analysis, extract keywords, the content of each block, the page format is html, htmls etc.
downFiels
- 解析网页中的资源,并采用多线程方式下载。可以下载的文件格式为:http://*/*/*/.../.*-file download mechine
AHUTjwc
- java编写的安徽工业大学的教务管理系统客户端框架,解析网页版的教务系统,可以把课程表解析成一个课程表类并输出。可以根据学号范围批量获取学生照片。必须要有安徽工业大学的学号和密码才能登录。理论上使用正方教务管理系统的学校稍加修改均可使用。-java prepared Anhui University of Educational Management System client framework, parsing web version of the academic system, the
CompilerTest
- 这段代码使用java来进行解析网页,输入一个网址,然后通过正则表达式来匹配网页中的邮箱地址-This code uses java to parse the page, enter a URL and Web pages to match the regular expression-mail address
xiaohuabaike
- Android项目源码笑话百科源码是一个基于安卓的笑话app客户端,数据来源http://www.jokeji.cn/。直接解析网页内容填充listview。如果网页挂了就不能查看效果了。所以想学习要尽快。项目里面有几个页面乱码,自己改一下编码。-Android project source joke encyclopedia source code is a joke based on Android s app client, the data source http://www.jokej