搜索资源 - lucene 分词 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - lucene 分词

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

xunlong0.6

0下载：
完整的.net搜索引擎采用LUCENE.net为索引核心,分布式架构.包含wordnet,分词,spider,简单webserver等-complete. Net using search engines for indexing LUCENE.net core, Distributed framework. includes WordNet, participle, spider, a simple webserver, etc.
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：5604216
- 提供者：余风

ChineseAnalyzer

1下载：
lucene.net 2.0的中文分词器，采用最大向前匹配算法，附上源代码和lucene.net.dll，希望这方面有兴趣的互相交流一下。
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：881569
- 提供者：杨秀云霁

ThesaurusAnalyzer

0下载：
lucene中文分词代码带有19万字的词典本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：1402816
- 提供者：陈锦

k50RVZDojs03

0下载：
基于IKAnalyzer分词算法的准商业化Lucene中文分词器
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：789659
- 提供者：罗晓鸣

IKAnalyzer

0下载：
IKAnalyzer是中文分词工具，基于lucene2.0版本API开发，实现了以词典分词为基础的正反向全切分算法，是Lucene Analyzer接口的实现，这个是.Net版本，含有源代码
所属分类：.net编程
- 发布日期：2008-10-13
- 文件大小：1905346
- 提供者：Jingtian Jiang

fenci

0下载：
海量分词结合lucene的分词部分源代码，不包含海量分词dll，请下载的朋友注意，希望能对大家有帮助。
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：2504463
- 提供者：长亭

mmseg-v0.3

0下载：
基于词库的中文分词组件，可以直接用于Lucene的索引建立。以及中文搜索。
所属分类：中文信息处理
- 发布日期：2010-11-16
- 文件大小：608210
- 提供者：dust

paoding-analysis-2.0.4-beta

0下载：
又一个中文分词组件，作者自称很牛，企业级的，字库很多。也可直接用于lucene索引和搜索。
所属分类：JSP源码/Java
- 发布日期：2008-10-13
- 文件大小：6109318
- 提供者：dust

IKAnalyzer2.0.2

0下载：
Java lucene开源全文搜索，中文分词组件
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：884501
- 提供者：阮正

IKAnalyzer3.2.8-bin

0下载：
IKAnalyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始，IKAnalyzer已经推出了3个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。 -IKAnalyzer is an open source, java based development o
所属分类：Java Develop
- 发布日期：2017-04-09
- 文件大小：2074366
- 提供者：wuwenyan

pangusegment-80115

0下载：
PanGuSegment 这个是盘古分词的组件包，包括 PanGu.dll 盘古分词的核心组件 DictManage.exe 字典管理工具 Demo.exe 分词演示程序 PanGu.HighLight.dll 高亮组件 PanGu4Lucene 这个是盘古分词针对Lucene.net 提供的接口 PanGu.Lucene.Analyzer.dll 盘古分词针对Lucene.net 的接口组件 PanGu.Lucene.ImportTool.exe 示例程
所属分类：Other systems
- 发布日期：2017-04-01
- 文件大小：690739
- 提供者：asdjkl

tfidf

0下载：
文本的词频计算，用到了lucene的分词工具，用java实现-Text of the word frequency calculations, the word used in the sub-lucene tools to achieve with java
所属分类：Applet
- 发布日期：2017-04-03
- 文件大小：2432
- 提供者：夏仁山

je-analysis-1.5.3

0下载：
在java环境下开发的分词源代码，本代码可以通过lucene，nutch调用，实现对中文的分词-Java development environment in the sub-etymology code, this code can be used with lucene, nutch call, the aim is to achieve the Chinese word
所属分类：Applet
- 发布日期：2017-03-28
- 文件大小：802231
- 提供者：小艺

IKAnalyzer3.2.8-source

0下载：
IKAnalyzer的源码包，实现中文分词功能，(1) 采用了特有的“正向迭代最细粒度切分算法”，具有60万字/ 秒的高速处理能力。 (2) 采用了多子处理器分析模式，支持：英文字母（ IP 地址、Email、URL ）、数字（日期，常用中文数量词，罗马数字，科学计数法），中文词汇（姓名、地名处理）等分词处理。 (3) 优化的词典存储，更小的内存占用。支持用户词典扩展定义 (4) 针对 Lucene 全文检索优化的查询分析器 IKQueryParser；采用歧义分析算法优化查询关键
所属分类：Java Develop
- 发布日期：2017-04-09
- 文件大小：1197198
- 提供者：陈雅倩

StandardTokenizer

0下载：
分词算法的测试基于lucene 的分词算法设计-segment the chinese word
所属分类：MultiLanguage
- 发布日期：2017-04-13
- 文件大小：2300
- 提供者：LIJIE

Segment

0下载：
使用lucene组件的分词例子。同时利用JE-Analysis 1.5.1 组件分词。-Use Lucene component segmentation examples. At the same time, the use of JE-Analysis 1.5.1 Segmentation components.
所属分类：MultiLanguage
- 发布日期：2017-04-02
- 文件大小：1431
- 提供者：TZH

text_category

0下载：
中文自动分类。使用spider抓取网络信息，利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.
所属分类：MultiLanguage
- 发布日期：2017-04-02
- 文件大小：8900
- 提供者：TZH

SphinxV0.9.8.1source

0下载：
SphinxV0.9.8.1source.zip VC++ 基于Lucene扩展的支持中文分词的开源搜索引擎中文用户-Sphinx V0.9.8.1 source.zip VC++ extensions to support Lucene-based Chinese word segmentation in Chinese open source search engine users
所属分类：Search Engine
- 发布日期：2017-03-24
- 文件大小：957518
- 提供者：stoneseu

PanGu4LuceneV2.1.1.0

0下载：
Lucene.net是Lucene的.net移植版本，是一个开源的全文检索引擎开发包，它不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎。开发人员可以基于Lucene.net实现全文检索的功能。本代码基于lucene.net实现中文全文检索(Chinese fulltext search based on lucene.net)
所属分类：搜索引擎
- 发布日期：2017-12-18
- 文件大小：5517312
- 提供者：mengmarry

lucene-core-2.4.1.jar je-analysis-1.5.3.jar

0下载：
import jeasy.analysis.MMAnalyzer 实现句子中文分词的jar包(import jeasy.analysis.MMAnalyzer Jar package for Chinese word segmentation in sentences)
所属分类：其他
- 发布日期：2020-04-03
- 文件大小：1647616
- 提供者：李四他爹他爹

« 1 2 34 5 6 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.