CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - nutch

搜索资源列表

  1. apache-nutch-2.2.1-src

    0下载:
  2. web crawl desigend by java,web crawl desigend by java
  3. 所属分类:Linux Network

    • 发布日期:2017-05-20
    • 文件大小:5664056
    • 提供者:song qing
  1. select_mfcc.tar

    0下载:
  2. Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫-Nutch is an open source Java implementation of the search engine. It provides all the tools we needed to run its own search engine for. Including full-text search and Web crawlers
  3. 所属分类:assembly language

    • 发布日期:2017-05-23
    • 文件大小:6661229
    • 提供者:楚博策
  1. WPCrawler

    0下载:
  2. 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需要爬虫程序来完成这样的任务。而且搜索引擎必不可少的组件之一也
  3. 所属分类:Search Engine

    • 发布日期:2017-05-09
    • 文件大小:1863846
    • 提供者:Francis
  1. ddh_v1.0

    0下载:
  2. DDH垂直搜索引擎商业版,是目前互联网中唯一可以商业运作的垂直搜索引擎系统,由JAVA语言开发,可以运行在大规模集群中的网络信息整合系统。DDH整合Nutch(开源搜索引擎系统),UCI(网页信息抽取系统)和SOLR(企业级搜索应用服务器)。无论从可扩展性,系统的性能方面还是稳定性方面,DDH垂直搜索引擎系统,都可以算的上顶级垂直搜索引擎系统之一。-DDH vertical search engine business edition, is currently the only commerc
  3. 所属分类:WEB(ASP,PHP,...)

    • 发布日期:2017-05-21
    • 文件大小:5697201
    • 提供者:zzpudn27
  1. Lucene+nutch搜索引擎开发

    0下载:
  2. lucene search code develop search engine
  3. 所属分类:JSP源码/Java

    • 发布日期:2018-05-04
    • 文件大小:87266165
    • 提供者:Aire
« 1 2 3 4»
搜珍网 www.dssz.com