搜索资源列表
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
Miniseg
- 用java实现的一个小型分词程序,可以将词语分隔开来,但缺乏标注,如:他 喜欢 吃 苹果 。-Achieved with a small java program segmentation, words can be separated, but the lack of marking, such as: He likes to eat apples.
ictclas4j
- 本代码用java实现了分词功能,包括分词和词性标注,里面有具体的说明文档,包括数据结构的设计,分词步骤,分词系统研究等。-The code is implemented using java segmentation features, including word segmentation and POS tagging, which have specific documentation, including data structure design, word steps, such a
cut_cn
- java写的分词程序,界面很简单,很好用,内部的类封装的很好。-java program to write the sub-word, the interface is very simple, useful, well encapsulated within the class.
IKAnalyzer_V3.2.8
- IK Analyzer是一个开源的,基于java诧言开发的轻量级的中文分词工具包。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.X则发展为面吐Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。-IK Analyzer 3.X
Lucene-code-src3.0-
- Lucene3.0原理与分析java版 第一章 全文检索的原本原理 第二章 Lucene 的总体架构 第三章:Lucene 的索引文件格式 第四章:Lucene 索引过程分析 第五章:Lucene 段合并(merge)过程分析 第七章:Lucene 搜索过程解析 第八章:Lucene 的查询语法,JavaCC 及QueryParser 第十章:Lucene 的分词器Analyzer-The first chapter of the full text searc
fenci
- 前向最大分词算法,翻译软件的最基本思想。用Java语言开发的程序。-Prior to the maximum segmentation algorithm, translation software, the basic idea. Java language programs.
javaTermFreq
- java中对英文分词后,去词干后进行词频统计的代码-stastic the frequency of english words after steming and looking up stopword list
class
- 使用中科院分词系统和林智仁的libsvm进行设计的系统,主要使用java语言进行开发,其他更多的信息查看readme文件-The use of Chinese Academy of Sciences segmentation system and Lin Zhiren libsvm design system, the main use of Java language for the development of other more information, see the readme f
MyICTCLASNew
- 用java写的中文分词系统,绝对能用,欢迎下载-Chinese word segmentation :java
IKAnalyzer2012_u3
- java 分词模块,不带权重, 学习之用, 来自网络- java fenci
FastSeg
- 搜索引擎相关,中文分词算法,java编写-Search engines related, Chinese word segmentation algorithm, written in Java
WordSegmetetion
- java编写的分词小程序 能实现一定范围内的分词功能,可对词库内容进行分类-java wordsegmention
WVTool
- 很好的文本分词工具,很适合java初学者。其中有分词jar文件。-Good text segmentation tool, it is suitable for java beginners. Which took part in the word jar file.
java_participle
- java分词算法的实现的里面有demo,下载直接运行即可看到效果。-java sub-word algorithm there are demo, download and run directly can see the effect.
ansjsun-ansj_seg-fa62737
- 基于JAVA中文分词,为ITEYE开源项目,很好很强大。性能高-JAVA-based Chinese word, very very strong for ITEYE open source project. High-performance
ansj_seg-master
- 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
ansj_seg20121123
- java分词实现,可以自己定义词库-java fenci,upload user library
IKAnalyzer2012
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。-IKAnalyzer is an open source, based on the the lightweight java language development of Chinese word Kit.
Segment
- java实现的分词操作,可用于将一句话按照汉语习惯分成对应词-java achieve segmentation operation, can be divided into the corresponding word sentence in accordance with the Chinese habit