搜索资源列表
SubjectSpider_ByKelvenJU
- 1、锁定某个主题抓取; 2、能够产生日志文本文件,格式为:时间戳(timestamp)、URL; 3、抓取某一URL时最多允许建立2个连接(注意:本地作网页解析的线程数则不限) 4、遵守文明蜘蛛规则:必须分析robots.txt文件和meta tag有无限制;一个线程抓完一个网页后要sleep 2秒钟; 5、能对HTML网页进行解析,提取出链接URL,能判别提取的URL是否已处理过,不重复解析已crawl过的网页; 6、能够对spider/crawler程序的一些基本参数进行
JavaBotter
- 网络机器人java编程指南一书作者编写的一个程序包,利用该程序包可以方便地实现网络机器人、网络蜘蛛等功能
phpspidercount
- 欢迎使用搜索引擎蜘蛛跟踪器,写这个小程序是因为我的服务器日志不能用了,所以才有了它。 由于水平有限,大家凑合着用吧:) 功用:跟踪搜索引擎的蜘蛛(BOT),并进行记录,提供在线察看和生成cvs格式文档下载。
spider
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。
统计系统
- 可查看蜘蛛访问记录,根据记录可查看何种蜘蛛何时来访问过你的哪些页面。 有简约记录与详细记录两种方式,请在config.asp页面中设置。 使用方法: ----插入asp页面调用,建议插入到conn.asp文件底部。 优点: 1、程序简洁易用。 2、记录爬行所有页面,简约记录可以统计同一蜘蛛爬行同一页面的次数,详细记录可设置同一蜘蛛爬行同一页面的次数。 3、可以批量删除数据。 4、可进行数据查询、排序等操作。 5、使用ASP+ACCESS
nicewords4.5中文版
- Nicewords是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)和分词技术,结合白帽SEO,利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。 NiceWords最主要是解决了自动建站的问题。以前的自动建站软件内容都还是需要自己发,有了NiceWord
exam.rar
- 本系统栏目包括了网络在线考试系统的通用功能,具体功能主要有考题题库维护、考生档案管理、随机 出题、考试计划管理、系统自动评分及成绩查询,该系统实现了考生的断线续考功能,大大减少了人工 的主观性干扰,大大增加了考试的公平性。 本系统程序由“风口浪尖”整理开发,版权所有,欢迎使用,可以修改。 可以免费商业使用! 但作为免费版本,我不对任何使用本系统所造成的不良后果负责。因为你使用的前提是自愿! 需商业使用,而在功能上有增加或修改的,或是技术上有疑问的,可以与我进行技术
puke
- 有点类似于蜘蛛牌的一个扑克程序,比较好玩-Somewhat similar to a spider card poker procedures, compared fun
14160_12384588898CMM
- Java编写的蜘蛛扑克牌游戏,写于2005年,程序要用到swing组件,因此请确保你的JDK环境安有此组件。新手可以学习的一个参考。-Spider Java poker game preparation, writing in 2005, the program components to use to swing, so please ensure you have the JDK component security environment. Green hand can be a refe
code
- 这是一个蜘蛛纸牌的原程序。可以供学习者参考,掌握一些基本知识-The source code
zhongguoxiangqi
- 用Java编写的蜘蛛纸牌程序和源代码,很好的学习资料-Prepared to use Spider Solitaire Java procedures and source code, a very good learning materials
zzzp
- Java编写的蜘蛛纸牌程序 Java编写的蜘蛛纸牌程序-Java
Spider-Solitaire
- 用java编写的实现蜘蛛纸牌的源代码和打包发布程序的jar文件,界面采用java Swing-Prepared with the realization of java source code Spider Solitaire and jar packaging procedures documents released, the interface using java Swing
JavaSpider
- Java版蜘蛛牌,是采用Java编写的蜘蛛牌程序,可以实现Windows下的蜘蛛牌类似功能-Java version spider card, is written using Java spider licensing procedures, the spiders can be achieved under a license similar to the Windows functions
978-7-302-14153-2
- 本书为Java课程设计指导用书,内容包括: Java环境的安装与配置, Java语言编程的基础知识, Java语言中最重要的类与对象网页浏览器案例,蜘蛛纸牌案例,吃豆子游戏案例,端口扫描案例,聊天程序案例,连连看游戏案例,中国象棋对弈系统案例,学生管理信息系统案例等-This book is a guide book Java curriculum, including: Java environment installation and configuration, Java programm
iis
- IIS日志分析 v1.0 asp版本 一个对IIS日志蜘蛛爬行进行分析的工具。修改程序里的路径,放任何可以执行asp的页面里就可以使用。-IIS analysis tools
zhizhus15@www.10000jt.com
- 可查看蜘蛛访问记录,根据记录可查看何种蜘蛛何时来访问过你的哪些页面。 有简约记录与详细记录两种方式,请在config.asp页面中设置。 使用方法: <!--#include file="robot.asp"--> ----插入asp页面调用,建议插入到conn.asp文件底部。 robot.asp 蜘蛛统计文件 zzsj.mdb 记录数据库文件 config.asp 系统设置 cqspb.asp 查看蜘蛛访问记录记录 优点: 1
wlpc
- 本文主要讲述如何使用Java编程来构建一个“蜘蛛”,我们会先以一个可复用的蜘蛛类包装一个基本的“蜘蛛”,并在示例程序中演示如何创建一个特定的“蜘蛛”来扫描相关网站并找出死链接。-This article describes how to use the Java programming to build a " spider" , we will first use a reusable packing a basic spider " spider" , and
uzcms
- 最新镜像程序,抓取最新蜘蛛算法,实现百度快排(The Latest Mirror Program to Realize Baidu Express Platoon)
小旋风·万能蜘蛛池站群
- redis缓存:增加redis缓存功能(开启后性能提升30%) 模板干扰标签 *:小旋风独创的新版模板干扰标签,解决站群模板相似度 文章内容自动插图 *:文章内容中自动插入图片库的图片 关键词插入 *:可设置关键词插入标题,插入概率、关键词unicode加密 禁止搜索引擎快照:可防止他人查看你的快照 仅蜘蛛缓存:增加仅蜘蛛爬行才生成缓存选项 缓存GZ压缩 new:缓存文件使用GZ压缩,大大减少硬盘占用 禁止非URL规则地址:禁止非设置的URL规则的网站地址 其他安全防御 new: