搜索资源列表
spider
- Java实现搜索引擎代码实现,采用了java编程技术,实现搜索网页链接-Java code to achieve the search engine using the java programming technology, the realization of the search page link
mySpider
- 搜索引擎~~spider 内核程序,帮助大家学习lucence -~ ~ Spider search engine core program, to help them to learn from lucence ~ ~
SearchServer
- 搜索引擎,用来搜索各种信息的,主要是用Java来开发的-Search engine used to search a variety of information, mainly using Java to develop the
LuceneinAction
- 利用Lucene制作一个java搜索引擎的例子!-The use of Lucene search engine to make a java example!
MySearch
- lucene htmlparser paoding customSpider webservice 一个完整的基于lucene工具包和庖丁分词加自定义实现爬虫分析数据的搜索引擎,少量改动即可使用-lucene htmlparser paoding customSpider webservice a complete tool kits and Paoding lucene-based word plus a custom analysis of data to achieve a search
jeecms-2.4.2-final
- JEECMS是国内Java版开源网站内容管理系统(java cms、jsp cms)的简称。 · 采用hibernate3+struts2+spring2+freemarker技术架构 · 基于java技术开发,继承其强大、稳定、安全、高效、跨平台等多方面的优点,支持mysql、oracle、sqlserver等数据库 · 懂html就能建站,提供最便利、合理的使用方式 · 强大、灵活的标签,用户自定义显示内容和显示方式 · 在设计上自身预先做了搜索引擎优化,增强对搜索引擎的
FTP
- 要构建搜索引擎,首先要收集各个FTP站点的文件信息,记录到数据库,用于提供搜索。因特 网中有许多的FTP站点,要收集某个FTP站点的信息时,从数据表中读出站点信息,然后登陆到此站点,多数FTP服务器都开辟有一个公共访问区,称为"匿 名FTP",对公众提供免费的文件信息服务,一般用户名为 Anonymous,密码为一个Email地址。数据采集程序用此用户名和密码登陆站点,然后对站点所有目录进行采集,读取每个目录下的文件信息,在收到 文件信息之后,对其进行分析,将文件信息存储到相应的数据表字段中。完
SearchEngine
- 基于java技术开发的一个搜索引擎。内有详细代码及技术文档。-A java-based search engine technology development. There are more code and technical documentation.
Google_PageRank
- google所用的网页排名算法。现在几乎被全球的搜索引擎学习者学习。-google page rank algorithm used. Now almost learners around the world search engine.
sousuoyinqing
- java技术实现的搜索引擎,里面包含了具体的技术文档-java technology search engine, which contains detailed technical documentation
lucene-core-3.0.0
- 学习Java搜索引擎,不妨看看这个,有助你的Java水平提高-Learning Java search engine, take a look at this, will help raise the level of your Java
Javasearchengine
- Java搜索引擎的代码,有兴趣走Java方向的同学必看-Java search engine code, interested students must see the direction to go Java
lucene2
- 使用java开发的开源搜索引擎软件,内含完整源代码,适合学习搜索引擎的人不可多得的好材料。-Java development using open source search engine software that includes full source code search engine for people to learn the rare good material.
Javazhizhu
- java写的网络爬虫 即网络蜘蛛源码,后台为MySQL数据库,实现简单的搜索引擎模拟功能,可作为课程设计或者毕业设计参考-java write that spider web crawler source code, the background for the MySQL database, simple search engine simulation capabilities can be used as reference graduate design course design or
bot-package-1.4
- 网络搜索引擎方面的源码,是个著名书籍上的例子,很有权威性-bot-pack
JAVA.techniques.real.source.search.engine
- JAVA技术实编程实现搜索引擎源码JAVA programming techniques real source search engine -JAVA programming techniques real source search engine
cctvSearch
- 一个简单的搜索引擎原型 java编写-A simple search engine written `` prototype java
opencms_7.5.3
- OpenCms是一个专业水平的开放源代码WEB内容管理系统,可被任何组织或企业使用,OpenCms100 开放源码,采用该技术有如下优点: 直接从WEB站点的前台编辑内容 自动在线/离线工作流 灵活的内容资源 集成全文搜索引擎 所见即所得编辑非结构化内容 结构化内容采用易于定义的基于XML的内容项目 在一个应用中管理多个站点 全文搜索支持PDF、Word、Excel文档资源 为所有的存储资源均可进行配置 基于时间的自动内容发布和过期
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
crawler
- Spider又叫WebCrawler或者Robot,是一个沿着链接漫游Web 文档集合的程序。它一般驻留在服务器上,通过给定的一些URL,利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问过的URL作为新的起点,继续进行漫游,直到没有满足条件的新URL为止。WebCrawler的主要功能是自动从Internet上的各Web 站点抓取Web文档并从该Web文档中提取一些信息来描述该Web文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据,这些数据包括标题、长度、文件建立时间