搜索资源列表
ProxyGeter
- IE浏览器的插件,可以对抓取网页上的代理,输出为文本文件,方便其它的代理软件倒入-IE browser plug-ins, can grasp right on the agent's website, and the output of text files, Other convenience of the agent software into the
RefreshCase
- 多线程搜索网页程序,主要实现了对网页内容的抓取!
findpass
- 抓取网页密码,能够轻松的将网页上的密码抓取下来,功能比较简单实用
htmlparser1_6_20060610
- 一个网页页面分析器,用于抓取网页的内容,建立为树形层次结构。
webCatch
- 实现多线程WEB网页内容批量抓取。 代码少,一个文件搞定。
GetDonews
- 抓取别人网页的一个例子,可以把所有链接取下来
BFFetch
- C#编写的网页内容抓取工具,多线程采集,效率很高
miniSearch
- 搜索,2006年4月开发出来。开发之初,搜索就将自己的目标定位于打造专业化的搜索引擎。力争用“最”短的时间为广大搜索用户提供“最”有用的信息。 搜索目前主要提供“美容经验” “大杂烩” “旅行资讯”三个领域的网页信息。 注:我们提供各行业专业搜索引擎索引库定制服务,您只需提供需要索引的网址,我们便会为您提供强大的网页信息抓取服务,丰富您的搜索引擎数据库,抓取内容可嵌入本搜索系统中。我们按所提供的网址数量收费。欢迎广大公司、站长和个人联系!
3
- 网页密码抓取
analyzer
- 一个简单的网页分析器 系统需求: 1. 编写Socket客户端访问WEB服务器,获取网页至本地硬盘; 2. 分析第1步中抓取的网页内容,找出所有图片链接URL信息。3. 统计第1,第2步中下载文件(包括网页文件与图片文件)的大小(即字节数和); 4. 统计第1,第2步所消耗的时间和; 5. 在屏幕上打印该WEB网页的访问速度(bytes/second) = 下载文件总大小/下载总耗时。
Arachnid_src0.40
- 利用JAVA实现的网络蜘蛛,具有从网络抓取网页的功能
collectEmail
- 最近一直琢磨着写一个网络蜘蛛程序,专门负责收集一些自己感兴趣的东西。用.net写程序从网上取得网页源码比较容易实现,蜘蛛程序的难点在于两个方面,一是如何多线程的自动化处理(即从一个地址跳到另一个地址),另一个是从网页中提取指定的信息。自动化处理方面正在研究,从网页中提取信息,我觉得网上某些网友用String/StringBuilder来处理的方法不可取,用“正则表达式”无疑是最好的。尽管“正则表达式”不容易书写,但查一查资料,还是不难的。 以下是我写的一个从网页中抓取EMail的方法,可
getMIMA
- 抓取网页密码,很有意思的程序,值得下载。
PickUpURL
- 一个抓取网页中的链接的程序,并且可以把这些URL改在本地,实现离线浏览
webspider
- 用java写的一个网络蜘蛛,他可以从指定的URL开始解析抓取网页上的URL,对于抓取到的URL自动分成站内外URL,并可以设置抓取的深度。
dl
- [功能] 本源码是一个因特网下载工具。他可以扫描整个网站的页面及各种图片音频视频等资源,你可以给这些待下载的资源设定最小的大小。 程序还使用了一个剪切板钩子(HOOK),使用它监控任何拷贝到剪切板中的文字,如果你复制了一个URL网页链接或者是一个URL的图片等链接,程序会立即弹出一个对话框让你配置下载任务。 用户可以通过设置文件名和文件大小,来下载整个站点的资源,或限制下载图片等等。 本质上来说,这是一个网络蜘蛛,可以多线程抓取网站。
Sources
- 这是一个从指定网页格式分离单词的小程序,自动从链接抓取分析其它可用链接,然后对所有链接进行分析找到可用页面然后分离中英文单词,并进行分类。
EnterInfo
- delphi中用消息循环抓取网页文本,有源码,可以进行2次开发-news cycle using text crawls website, source code can be developed for 2nd
网络爬虫
- 本人自己用VC++开发的网络爬虫程序,可以实现整个网站的抓取,网页中所有的URL重新生成.-I own VC++ development with the network of reptiles procedures, can crawl the entire site, the page URL to re-generate all.
NetTrafficButton1.0.rar
- 通过抓取网页中的流量信息来实现实时网络流量监控,用于大学校园的校园网应用,Crawl through the page flow of information to achieve real-time network traffic monitor for the campus of the University Campus Network Application