CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - 解析

搜索资源列表

  1. tmdGOOGLE

    0下载:
  2. 深度解析GOOGLE之实用篇!!! 深度解析GOOGLE之实用篇!!1-depth analysis of pragmatic chapter! ! ! Google depth analysis of pragmatic chapter! ! 1
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:2.23kb
    • 提供者:afei
  1. PageParser

    0下载:
  2. 对网页进行解析的两个源码,结构代码比较清晰,容易上手.-pages of the two-source analysis, structural code clearer and easier to get started.
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:7.29mb
    • 提供者:何儒汉
  1. htmlparser

    0下载:
  2. HTML的解析器,是Majestic-12分布式搜索引擎的一部分。作者Alex Chudnovsky, Majestic-12 Ltd (UK)。这个是3.0版本,性能经过多次优化,文档也比较全。也可以到http://www.majestic12.co.uk下载。-HTML parser, Majestic-12 distributed search engine part. Author Alex Chudnovsky, Majestic-12 Ltd (UK). This is versio
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:315.57kb
    • 提供者:罗鹏魁
  1. a

    1下载:
  2. 关于网络爬虫的论文集,涉及到搜取网页和网页解析技术的一些重要课题。对算法和搜索引擎的理解有一定的帮助
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:13.07mb
    • 提供者:zhc
  1. webspider

    0下载:
  2. 用java写的一个网络蜘蛛,他可以从指定的URL开始解析抓取网页上的URL,对于抓取到的URL自动分成站内外URL,并可以设置抓取的深度。
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:4.81kb
    • 提供者:纯哲
  1. google

    0下载:
  2. Google Search Api轻松打造自己的Search Engine,C语言XML解析器
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:107.48kb
    • 提供者:xizao2008
  1. javaSearch

    0下载:
  2. 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:885.89kb
    • 提供者:李丽
  1. MyDTDReader

    0下载:
  2. 对DTD文档进行解析,得到一个哈希表,其中包括关键字及其编码。-DTDparser
  3. 所属分类:Search Engine

    • 发布日期:2017-04-12
    • 文件大小:1.48kb
    • 提供者:guowenqi
  1. Crawling_AJAX_SShah

    0下载:
  2. 基于时间的网络爬虫原理,能够解析javascr ipt-Reptiles based on the principle of network time, be able to resolve javascr ipt
  3. 所属分类:Search Engine

    • 发布日期:2017-03-31
    • 文件大小:116.2kb
    • 提供者:river
  1. SearchEngine

    0下载:
  2. 网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个自己的搜索引擎——新闻搜索引擎。 新闻搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。 本人在介绍搜索引擎
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:881.8kb
    • 提供者:邱浩淼
  1. htmlcxx-0.83.tar

    0下载:
  2. htmlcxx0.83著名的HTML&css解析器-htmlcxx 0.83 well-known HTML css parser
  3. 所属分类:Search Engine

    • 发布日期:2017-04-05
    • 文件大小:407.36kb
    • 提供者:enigma2222
  1. SharpICTCLAS

    0下载:
  2. ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
  3. 所属分类:Search Engine

    • 发布日期:2017-04-09
    • 文件大小:1.87mb
    • 提供者:ounata
  1. SearchEngine

    0下载:
  2. 新闻搜索引擎是从指定的Web页面中按照超连接进行解析、搜索,并把搜索到的每条新闻进行索引后加入数据库。然后通过Web服务器接受客户端请求后从索引数据库中搜索出所匹配的新闻。基于Lucene垂直搜索引擎的研究与实现-News search engine is from the specified Web page is parsed by hyperlinks, search, and the search index to be added after each news database. T
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:156.48kb
    • 提供者:xiaoyachi
  1. NetSpiderDemo

    0下载:
  2. 简单描述: 本程序是一个网络爬虫的演示程序。 程序主要涉及到:网页下载,URL解析,数据库读写。 网页下载使用Winhttp组件;数据库使用Sqlite。 使用方法: 1. 在“搜索网页”Tab页,输入关键字搜索,程序会把含关键字的网页信息,存入子目录下的Info.db。 2. 在“显示网页”Tab页,输入关键字显示,程序会把含关键字的网页信息,显示在界面上。 交流及指正,请联系QQ:270156812-This is a net
  3. 所属分类:Search Engine

    • 发布日期:2017-03-26
    • 文件大小:313.91kb
    • 提供者:zwz
  1. lucene-query

    0下载:
  2. lucene搜索请求的构建和解析,JAVA语言开发 很有用-lucene search request to build and parse, the JAVA language to develop useful
  3. 所属分类:Search Engine

    • 发布日期:2017-03-28
    • 文件大小:73.35kb
    • 提供者:刘辉
  1. spider2006

    1下载:
  2. 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。 -C# spider.
  3. 所属分类:Search Engine

    • 发布日期:2017-08-30
    • 文件大小:31kb
    • 提供者:rossuel
  1. Search.test1

    0下载:
  2. 主要是測試以asp.net下載網路上的檔案,並可以解析word,excel,pdf格式的檔案為文字檔。限制:必須安裝office 2-The test asp.net download files over the Internet, and can parse word, excel, pdf format file as a text file. Restrictions: must install office 2000
  3. 所属分类:Search Engine

    • 发布日期:2017-11-06
    • 文件大小:17.28mb
    • 提供者:horyar
  1. direct_web_spider-master

    0下载:
  2. 用ruby写的爬虫,能自定义页面解析方式等。基于配置可快速配置出自己需要的爬虫-The reptiles write with the ruby
  3. 所属分类:Search Engine

    • 发布日期:2017-11-12
    • 文件大小:63.2kb
    • 提供者:Tim
  1. ExtractorDktj131_2012

    0下载:
  2. 基于复杂网络的新闻网页解析算法,实现复杂网络构建及分词功能-Built complex network based on complex network news page parsing algorithm, and the word function
  3. 所属分类:Search Engine

    • 发布日期:2017-11-15
    • 文件大小:888.46kb
    • 提供者:xcx0617
  1. wangpandizhi

    0下载:
  2. 可以对百度等各个网盘进行下载地址的解析。-Baidu can be downloaded in various network disk address resolution.
  3. 所属分类:Search Engine

    • 发布日期:2017-03-23
    • 文件大小:13.6kb
    • 提供者:陈超哥
« 12 »
搜珍网 www.dssz.com