搜索资源列表
mse
- 使用java编写元搜索引擎,大家看看。肯能有所帮助
lucene
- lucene 是java 的版的搜索引擎公共模块, 本人使用此模块, 已经开发实现了网页的抓取。
search
- 搜索引擎的研究与实现(Java)(含源码),很好的
JSPxinwen
- 基于Java的新闻搜索引擎的设计与实现内容提要:作为除电视、报纸、广播之外的第四大媒体,互联网已经成为人们获取新闻信息的主要来源。快速的从众多新闻网站中找到所需新闻,是新闻搜索引擎的基本任务。有重大事件发生时,如何使客户及时得到最新消息,也是当今新闻服务所关心的问题。对于高速列车来说,开发数字高速铁路旅客信息系统,让旅客享受移动式的全新的数字化服务是改善服务软环境的措施之一。 本文结合搜索、数据库、网络等多种技术,实现了用于高速铁路旅客信息系统的新闻搜索引擎,该引擎为高速列车提供实时新闻。
JAVA.techniques.real.source.search.engine
- JAVA技术实编程实现搜索引擎源码JAVA programming techniques real source search engine -JAVA programming techniques real source search engine
cctvSearch
- 一个简单的搜索引擎原型 java编写-A simple search engine written `` prototype java
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
crawler
- Spider又叫WebCrawler或者Robot,是一个沿着链接漫游Web 文档集合的程序。它一般驻留在服务器上,通过给定的一些URL,利用HTTP等标准协议读取相应文档,然后以文档中包括的所有未访问过的URL作为新的起点,继续进行漫游,直到没有满足条件的新URL为止。WebCrawler的主要功能是自动从Internet上的各Web 站点抓取Web文档并从该Web文档中提取一些信息来描述该Web文档,为搜索引擎站点的数据库服务器追加和更新数据提供原始数据,这些数据包括标题、长度、文件建立时间
SerachEngine
- 利用Lucence,搜索引擎的基本实现,刚学习搜索引擎的鞋童可以参考,我自己的作业。-Use Lucence, search engine basically, just to learn search engine shoes children can refer to my own work.
SearchEngine
- java搜索引擎,当然这里是模拟的,利用百度实现的,有时候客户需要,为了节约成本,而做的.-java search engine, of course, here is a simulation, using Baidu to achieve, sometimes customers need, in order to save costs, and to do.
java
- 基于java的搜索引擎的设计与实现, “网络蜘蛛”或者说“网络爬虫”,是一种能访问网站并跟踪链接的程序,通过它,可快速地画出一个网站所包含的网页地图信息。本文主要讲述如何使用Java编程来构建一个“蜘蛛”-Design and implementation of java-based search engine, " spider" or " web crawler" , is able to visit the site and follow the
java-crawler
- java爬虫 网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成-java crawler
carrot2-java-api-3.12.0-SNAPSHOT
- carrot2是一款开源的聚类可视化搜索引擎,并提供了java API以供开发使用。内部包含所有用于carrot2开发的jar包和实例。-You can use Carrot2 Java API to fetch documents various sources (public search engines, Lucene, Solr), perform clustering, serialize the results to JSON or XML and many more. Below
JavaSearchEngine-java
- 搜索引擎的研究与实现(Java) 很好 很好-JavaSearchEngine used for java
Char02
- Java搜索引擎技术实战 精华版 第二章源码 Java search engine technology essence of the first chapter-Java search engine technology essence of the first chapter
Char06
- Java搜索引擎技术实战 精华版 第六章源码 Java search engine technology essence version of the sixth chapter-Java search engine technology essence version of the sixth chapter
Char10
- Java搜索引擎技术实战 精华版 第十章源码Java search engine technology essence version of the tenth chapter-Java search engine technology essence version of the tenth chapter
Char07
- Java搜索引擎技术实战 精华版 第七章源码 Java search engine technology essence version of the seventh chapter-Java search engine technology essence version of the seventh chapter
Arachnid_src0[1].40
- 网络爬虫为搜索引擎从万维网下载网页。一般分为传统爬虫和聚焦爬虫。 传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。通俗的讲,也就是通过源码解析来获得想要的内容。 聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到达到系统的某一条件时
Lucene+nutch搜索引擎开发
- lucene search code develop search engine