CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - java project

搜索资源列表

  1. webharvest1-project

    1下载:
  2. Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:5.89mb
    • 提供者:lori
  1. zhizhu

    0下载:
  2. 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
  3. 所属分类:Search Engine

    • 发布日期:2016-01-27
    • 文件大小:2.55mb
    • 提供者:dutch
  1. lucene-3.0.0-src

    0下载:
  2. lucene-3.0.0-src.zip 纯java开源搜索引擎的源代码 初学者好好揣摩 apache家族的一个子项目 提供一个索引和搜索的框架,支持二次开发 Lucene的最新版本-lucene-3.0.0-src.zip pure java open source search engines try to figure out the source code for beginners a good family, an apache sub-project to provide a fr
  3. 所属分类:Search Engine

    • 发布日期:2017-06-01
    • 文件大小:13.36mb
    • 提供者:stoneseu
  1. 4pm

    0下载:
  2. 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
  3. 所属分类:Search Engine

    • 发布日期:2017-05-12
    • 文件大小:2.85mb
    • 提供者:曹志聪
搜珍网 www.dssz.com