搜索资源列表
lucene-1.4.3
- java实现的一个搜索引擎。只有检索引和查询功能,没有爬虫。是学习搜索引擎开发的好例子。-achieve a search engine. Only search and query primers, no reptiles. Learning is the development of the search engine are good examples.
jspcode(5files)
- 主要是JSP的代码 做网站时用得到 压缩包的内容:1.Jsp分页显示 2.jsp源码实例 搜索引擎 3.javajsp中 中文问题详解-开发技巧 4.JSP实现论坛树型结构的具体算法-开发实例 5.JSP调用JavaBean在网页上动态生成柱状图 共五个Java源码 txt格式 都有源代码和注释 无密码-JSP is mainly done for the code used to be compressed contents : 1.Jsp paging
Nekohtml_0.9.5(Java)
- 网页分析的源代码,用java编写!对于开发搜索引擎有一定的帮助。-website analysis of the source code, prepared with java! For the development of search engines is certainly helpful.
java_search_engineer_develop
- 用幻灯片勾勒出完整的一套开发java搜索引擎实例,让初学者快速建立工程的框架。
lucene-3.0.0
- lucene-3.0.0.zip 纯java语言的开源搜索引擎 集索引与搜索一体 支持二次开发 最新版本-lucene-3.0.0.zip pure java open source search engine, assembly language, indexing and search together to support the latest version of the secondary development of
Crawler
- 本人用c++开发的搜索引擎的网络爬虫 蜘蛛程序 欢迎参考。-I am using c++ developer' s Web crawler search engine spider welcome reference.
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
Lucene+Nutch
- 该书首先描述了开发平台的配置, 接着详细介绍LUCENE和NUTCH开发。-The book first describes the development platform configuration, and then details the development of Lucene and NUTCH.
zhizhu
- 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
NetBotJava
- 很难得的一本java spider 开发的资料书,写得很全面,有比较全的例子,开发出来的东西可以直接修改一下使用,,<网络机器人Java编程指南>-Hard to come by a java spider information on the development of the book, write a very comprehensive, more full of examples of things that can be developed to directly mo
lucene-3.0.0-src
- lucene-3.0.0-src.zip 纯java开源搜索引擎的源代码 初学者好好揣摩 apache家族的一个子项目 提供一个索引和搜索的框架,支持二次开发 Lucene的最新版本-lucene-3.0.0-src.zip pure java open source search engines try to figure out the source code for beginners a good family, an apache sub-project to provide a fr
webcrawler
- 一个java 开发的网络爬虫,采集功能比较强大-Development of a java web crawler, collecting more powerful features
lucene2
- 使用java开发的开源搜索引擎软件,内含完整源代码,适合学习搜索引擎的人不可多得的好材料。-Java development using open source search engine software that includes full source code search engine for people to learn the rare good material.
SouYuan
- java开发的分布式搜索引擎,采用x-fire webservice的结构-java development distributed search engine, using x-fire webservice structure
compass
- 搜索引擎,全文搜索基于Lucene的Java开发-compass
openwysiwyg_v1.4.7
- openWYSIWYG是一个跨浏览器,纯Javascr ipt开发,强大开源的WYSIWYG编辑器。支持多种Web编程语言:PHP,ASP,ASP.net,Perl,Java,Cold Fusion-openWYSIWYG is a cross-browser, pure Javascr ipt development, a powerful open-source WYSIWYG editor. Support a variety of Web programming languages: P
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
paoding-analysis-2.0.4
- Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
Crawler
- 基于java开发的用于爬取数据的小程序,仅代码-Java-based applet developed for crawling data, only the code
elasticsearch
- ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。-ElasticSearch is an open-source and distributed search engine which is very much scalab
