搜索资源列表
DemoURL
- 读取网页内容,抓取网站数据,通过网页或网站URL路径读取各种网页的源码和内容-Read the source and content of all pages to read web content to crawl the site data , web page or site URL path
Getleft-v1.2
- 你看到一个自己非常喜欢的网站,想把它抓下,但是有这么多页,一页一页储存太浪费时间了。这时,就用的上Getleft 了。Getleft是用 Tcl/Tk 编写的,功能与Teleport 或 GetRight类似,给它个URL,它便可以为你抓下所有连结上的网页。它非常实用,可以设定超级链接,下载网页的层数,要不要下载 JPG、GIF 等等的档,也可以设定要不要抓取 cgi等等。但是,它也有功能上的限制,例如对于 Java、JavaScripe、ASP、PHP 等等,仍是无法抓下。-You see a
WebNetCrawler
- 简单实现网络爬虫功能,抓取目标网站与关键字匹配的信息进行存储-Simple web crawler to crawl the target site with keyword matching information stored
333
- hon6 WAP爬虫小说系统程序特色 运行环境: PHP/Zend 1.内容自动抓取,让您远离繁忙的采集工作 2.抓取后自动生成静态文件,更新较快的栏目20分钟抓取一次,内容栏目600分钟抓取一次,做到了每日更新两次! 3.程序支持整合传承导航 4.排版简单,模版式排版! 程序使用 1.首先使用记事本打开程序的config.hon6文件,修改网站名称,网站域名参数,还有是否打开传承接口,打开接口后必须配置好MSSQL链接参数,目前只支持链接MSSQL不支持ACCESS
crab_news
- python 多线程抓取指定网站的信息,返回标题,摘要和地址。-python multithreading crawl designated website to return to the title, abstract and address.
1323272283473_zcool.com.cn
- SXW Flash CMS v3.0更新说明: 1.全站采用UTF-8编码,解决多种语言字符兼容问题; 2.增加自定义网页显示功能,可在菜单中链接独立的网页作为栏目显示; 3.支持视频外链功能,支持土豆、优酷、56网等网站视频链接; 4.新增RSS订阅功能,输出动态RSS;可作为网站地图方便搜索引擎收录和关键字抓取; 5.新增会员系统功能,会员等级可无限级分级;栏目可设置指定会员等级才能浏览。 6.媒体内容采用双模板展示,可选底部滚动式和列表式展示。
meilishuo
- 美丽街导购网站的源码,包括数据库,抓取的是淘宝的链接,可以上传商品,修改页面风格-Beautiful Street shopping guide website source code, including database, crawl Taobao links, you can upload the commodity, modify page style
sxw_flash_cms_4_baild20121228
- SXW Flash整站系统[SXW Flash CMS] 版本:4.0 Build20121228 更新: 1.解决了一个网站信息泄露问题; 2.修正视频、音乐上传浏览器兼容; 3.新增网站地图功能;更方便搜索引擎抓取网站页面。 SXW Flash整站系统[SXW Flash CMS] 版本:4.0更新说明: 1.全站系统结构调整。将数据存储文件集中放置,让网站可以结合服务器权限设置达到绝对安全。 2.加入智能设备访问专用界面。介于当前网络移动智能设备访问量逐渐增加
SXW-Flash3.0VIP
- SXW Flash 是在Supernova XML Website基础上开发的一套Flash网站管理系统; 酷炫的FLASH整站,后台采用ACCESS+ASP; 可完美用于:企业形象、产品展示;组织团队主页;个人主页; 主要特点; 1.网站炫彩背景自动更换(可使用JPG格式桌面壁纸); 2.全站使用二级下拉菜单(后台智能管理) 3.音视频智能播放控制(在播放视频时背景音乐自动关闭,关闭视频后背景音乐自动开启) V3.0更新说明: 1.全站采用UTF-8编码,解决多种语言字符兼容问题; 2.增加自
chaogu
- 炒股资讯小偷采集程序,404伪静态,程序自动采集最新炒股资讯,自动更新速度很快,每次访问首页内容都有更新,资讯内容非常多,可供相关站点上传使用,亦可作为asp程序爱好者共同交流之用,目标站有两个,如果其中一个偶而宕机或者其他原因无法抓取时,则自动转为抓取另一个目标站,提高你的网站稳定性!-Stock the information thief acquisition program, 404 pseudo-static, the program automatically collecting
admin73_tool_1.0
- 73站长网站长查询工具包含了: 搜索引擎收录和反向链接情况查询 中文 Alexa 网站排名查询 Google PageRank值查询 百度关键字排名查询 关键词密度查询 蜘蛛、机器人模拟抓取工具 META信息检测工具 域名 WHOIS 信息查询工具 安装说明: 服务器(虚拟主机)必须支持ASP和PHP,才能正常运行,请检查自己的服务器是否支持! 上传文件至服务器即可运行! -73 webmaster website long query to
yuzhiguobot2.0
- 该程序采用ASP编写,使用Access数据库,主要功能是记录常用搜索引擎蜘蛛最近来访时间、IP、来访次数、抓取页面地址。 经过2周的亲自测试,截至2009.8.30,本系统可统计95种蜘蛛。由于搜索引擎抓取网页不抓取JS代码,所以JS的统计方式不能统计到蜘蛛(经测试只能统计到腾讯soso),所以本系统只适合动态ASP网站使用,静态网站请飘过。 文件说明: bots.asp 统计蜘蛛访问记录文件,把这个文件插入到要统计的页面中,比如插入到conn.asp公共文件里,以达到整站统计蜘蛛的
snoo.class
- 可以抓取网站里有价值的信息,如:标题、超链接-Help to fetch webpage,get good information
WebSearch-v1.4
- python编写的网页爬虫,根据指定的关键字,从百度、google、Bing、搜库等网站上抓取视频链接并存为文件。-web crawler written in python, based on the specified keywords, grab the video link from the website of Baidu, Google, Bing, search library co-exist as a file.
crawler-on-news-topic-with-samples
- java做的抓取sohu所有的新闻;可以实现对指定站点新闻内容的获取;利用htmlparser爬虫工具抓取门户网站上新闻,代码实现了网易、搜狐、新浪网上的新闻抓取;如果不修改配置是抓取新浪科技的内容,修改配置可以抓取指定的网站;实现对指定站点新闻内容的获取-java do crawl sohu news access to the designated site news content using htmlparser reptiles tools crawl news portal, c
Tseo_v4.1
- 强大的SEO网站优化功能,快速让您的网站在搜索引擎中脱颖而出,让更多的客户找到您。 企业SEO站 V4.1 无组件生成HTML 企业SEO网站安装: 1、上传至虚拟主机[根目录]。 2、若上传至虚拟主机根目录则要修改文件(特别注意修改 网站配置中 网站地址 域名+“/” 如然后 点击生成静态化 因为本站专注优化网址是绝对路径利于搜索引擎抓取)注意:子目录下可留空 3、网站常规设置(网站名称、网站关键词、网站描述、网站地址、联系方式、备案统计等)都在"网站配置"设置。 4、
adseo
- 企业网站SEO优化:强大的SEO网站优化功能,快速让您的网站在搜索引擎中脱颖而出,让更多的客户找到您。 企业SEO网站V4.5 无组件生成HTML。 企业SEO网站安装: 1、上传至虚拟主机[根目录]。 2、若上传至虚拟主机根目录则要修改文件(特别注意修改 网站配置中 网站地址 域名+“/” 如然后 点击生成静态化 因为本站专注优化网址是绝对路径利于搜索引擎抓取)注意:子目录下可留空 3、网站常规设置(网站名称、网站关键词、网站描述、网站地址、联系方式、备案统计等)都在"网站
Tseo_v4.5
- 强大的SEO网站优化功能,快速让您的网站在搜索引擎中脱颖而出,让更多的客户找到您。 企业SEO站 V4.5 无组件生成HTML 企业SEO网站安装: 1、上传至虚拟主机[根目录]。 2、若上传至虚拟主机根目录则要修改文件(特别注意修改 网站配置中 网站地址 域名+“/” 如然后 点击生成静态化 因为本站专注优化网址是绝对路径利于搜索引擎抓取)注意:子目录下可留空 3、网站常规设置(网站名称、网站关键词、网站描述、网站地址、联系方式、备案统计等)都在"网站配置"设置。 4、
MyCrawler
- 简单网络爬虫,可以设置一些自己喜欢的网站,会自动抓取图片。-Simple web crawler, you can set some of your favorite sites, and will automatically grab the picture.
spider02
- 从某个网站上抓取相应的文字内容。可以输入参数确定抓取的章节。-Crawl text content from a website. Can enter parameters crawl chapters.