搜索资源列表
ProxyTest
- 用于查找一个合适的代理服务器。方法是从某代理网站(经作者多次测验,该网站提供的代理网址比较好用,但连接某个特定网站可能会有问题)的网页中提取出代理网址和端口,依次测试,直到找到一个可以连接的为止。免去作者每次都要手工的在IE里面测试的麻烦。纯属个人的玩具程序。-looking for a suitable proxy. Method Acting is a website (repeated tests by the author, the website provided by the Web
jocws500
- 可以帮助建立网站的搜索目录,能够高速建立目标URL数据库,提取超过70亿网页、目录及搜索引擎中的metadata(标题,关键字,描述)信息,并和用户的关键词作匹配 -can help establish a web site's search directory, a high-speed target URL database, Extraction of more than 7 billion web pages, directory and search engine
soso
- 过程序自动的读取其它网站网页显示的信息,类似于爬虫程序。比方说我们有一个系统,要提取BaiDu网站上歌曲搜索排名。分析系统在根据得到的数据进行数据分析。为业务提供参考数据。-process is automatically read the other web pages of information revealed similar to the reptile procedures. For example, we have a system, to extract songs portal
spider_demo
- C#编写的spider demo 主要实现多线程的网页抓取及网页内容中URL的提取-prepared by the spider demo main multithreaded website crawls and website content URL Extraction
PickupEmailAddress
- 从网页中提取EMAIL地址的精化函数,经本人测试非常准确,并实际使用的。-extracted from the website EMAIL address the essence of function, I test is very accurate, and actual use.
liubo77_0641
- 这是为公司产品所做的一个程序,它分析yahoo的天气网页得到天气信息,然后写入USB连接设备中。(USB设备写入的代码部分不必理会,需要指定设备才能运行)主要示例了用webbrowser访问页面,然后分析提取所需要内容。-This is the company's products have done a procedure, which analyzes yahoo weather homepage weather information, then into the USB devi
webpage_distill
- 从网页中扫描提取需要的信息,并存入数据库,这是一个监控项目中信息采集模块的部分源码。-scanning from the website extract the required information, and stored in the database, This is a project monitoring and information gathering part of the source code modules.
finger-recong
- 指纹识别源代码。思路完全是按照文件夹中网页里介绍的方法,即提取指纹中的分叉点和端点的位置作为指纹的特征值。由于今天太忙,对图像的预处理作的很失败,程序会提取出很多伪点,而指纹轮廓也没有想出办法过滤。汗,你看看能不能参考把。 三个m文件,fd.m提取指纹中的分叉点,fd2.m提取指纹中的端点,Cpoint.m则是前两个文件运行中需要调用的掩模函数。-fingerprint identification code. Thinking is entirely in accordance wi
HtmlAnylse
- 网页是组成互联网的基本数据单元,是各种面向互联网的应用系统最原始的数据源。网页内部含有大量噪音信息,如何从网页中有效地提取有价值的内容成为影响数据处理效果的关键。 网页正文提取指的是从原始网页中精确地提取出正文文本,比如提取新闻网页中的报道内容。能否高效地提取出网页的正文,是很多互联网应用系统如搜索引擎、新闻资讯系统等面临的一个重要问题。由于网页本身的无结构化的特点,通常采用的正文提取方法是针对目标网页的特点人工制定抽取模板,这类方法的优点是抽取精确,但其致命的缺点是模板建立和维护的工
WebExtract20070417
- 从htm/html格式的网页文件中提取内容。将要提取内容的网页文件用鼠标拖入窗口,按回车即可完成转换。转换后的文件是与原文件同名的文本文件。 支持文件夹批量转换!-from htm / html format of the document from the website content. Will be from the website content with the mouse into the document window, press the Enter conversion
SubjectSpider_ByKelvenJU
- 1、锁定某个主题抓取; 2、能够产生日志文本文件,格式为:时间戳(timestamp)、URL; 3、抓取某一URL时最多允许建立2个连接(注意:本地作网页解析的线程数则不限) 4、遵守文明蜘蛛规则:必须分析robots.txt文件和meta tag有无限制;一个线程抓完一个网页后要sleep 2秒钟; 5、能对HTML网页进行解析,提取出链接URL,能判别提取的URL是否已处理过,不重复解析已crawl过的网页; 6、能够对spider/crawler程序的一些基本参数进行
MobileSearch
- 国产简体中文版专业通过Baidu.COM引擎快速搜集大量目标城市和行业的公司企业客户手机号码的手机号码 搜索软件工具。Baidu.COM中收录了全世界的中文公司企业网页,输入与手机号码相关的字符即可检索到大量的手机号码,而且这些号码都是活跃的、有效的,具有极高的市场营销价值。软件通过一次性导入上千个检索关键词列表,自动搜索和提取手机号码,自动纠正错误的手机号码。它可以全天候24小时无人值守工作,是一个真正的手机号码搜索机器人,为您通过手机短讯营销方式推销或采购产品助一臂之力。搜索到的号码可以
WebPickUp
- 将网页上的文字提取下来保存在本地数据文件的工具.-website will be extracted from the text stored in the local data files tool.
webextracting
- 从一个网页中提取主要内容,如从新闻网页中提取新闻内容,是web抽取的一项工作。本程序对于有主内容的网页,提取它的主要内容。 程序用java编写,需要jdk5.0。需要用户将网页另存在上面程序所在的test目录下
nettool
- 网页快照提取保存工具
softhy811
- 社区文章采用的是平板、树形自由选择的两种展示方式,社区整体布局采用左右分帧,这样的结构更适合版面较多的网站使用! 社区支持无限级分类,左侧工具栏静态化再多的版面也不会影响速度。 大量的使用高性能缓存使得软件在高并发下对数据库的压力降到最低!支持分布式Cache! 软件经过优秀的用户体验专家和交互设计师指点注重每一个细节的设计! DIV+CSS架构页面,使得更换样式变得异常简单,让网友浏览大数据量网页没有卡住的感觉! 细心的人会发现,我们在浏览器兼容方面所做的努力,社
FindWeb
- 通过HTTP通信,对网页内容进行分析,提取企业名录,同时具有自动识别网络代理功能.
PickUpURL
- 提取本地下载的网页中链接保存于文件中
WebLinYi
- 从已获取的网址访问并提取网页相关标签源代码。(Extracting the source code of the web related label)
GSD嘉年华_使用LabVIEW实现网页数据提取与交互
- 使用labview实现网页数据提取与交互(use labview operation HTTP data get and communication)