搜索资源列表
src_seg(java)
- 一个用java语言编写的中文文本分词算法
src
- 基于词典的最大分词算法 达到很好的分词准确率
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
heritrix-1.14.3-src
- 高性能分词算法,采用java实现,能自动进行最小分词,用户可以筛选分词类别-Word segmentation algorithm for high-performance, the realization of the use of java, can automatically carry out the smallest sub-word, the user can filter category segmentation
chinese_segment
- 一个中文分词算法的java语言实现,词典采用文本文件形式。-A Chinese word segmentation algorithm java language implementation
keyTermExtraction
- 实现了自动分词的功能,以及信息抽取的额功能,非常重要的算法。-Realize the function of automatic segmentation and information extraction of the amount of features, very important algorithms.
zhengdike
- (个人原创)《中文网页自动分类》 牵扯的技术有:分词,统计词频,踢出网页中一些特殊字符(用正则表达式),还有需要提取培训集等等!! 此软件禁止商业活动,版权所属“qyTT论坛--www.qyclass.org/bbs” 本文来自: qyTT论坛 http://www.qyclass.org/bbs 我们的使命:让世界认识qyTT,让qyTT认识世界! 结果分析的思想:就是把得到的词频与建立的词库里每一类进行比较,如果存在一个最大匹配程度,就去这个类作为结果,如果存
fenci
- 前向最大分词算法,翻译软件的最基本思想。用Java语言开发的程序。-Prior to the maximum segmentation algorithm, translation software, the basic idea. Java language programs.
FastSeg
- 搜索引擎相关,中文分词算法,java编写-Search engines related, Chinese word segmentation algorithm, written in Java
chinese-_segmentation
- 中文分词算法介绍,正向最大匹配。word-word for chinese segmentation algrithm
java_participle
- java分词算法的实现的里面有demo,下载直接运行即可看到效果。-java sub-word algorithm there are demo, download and run directly can see the effect.
search_engine
- 搜索引擎课程的几次作业,第一次作业实现分词算法,使用正向最大匹配原则。第二次作业实现倒排索引。第三次作业实现正排索引。第四次作业实现索引功能。实现的比较简单,但均可正常运行。-Several job search engine programs, the first job segmentation algorithm, using forward maximum matching principle. The second job inverted index. The third job t
mmsegger_src_1.0
- 最大正向匹配分词算法,用于分词和自然语言处理-Maximum forward matching word segmentation algorithm
WordRecoverTool
- 一种基于二叉树数据库模型的分词算法,很好用 -A segmentation algorithm based on binary tree database model, well used
Split
- Java实现逆向最大匹配中文分词算法,本程序可以实现较为简单的中文分词-Java implementation reverse maximum matching Chinese word segmentation algorithm, the program can be implemented relatively simple Chinese word segmentation
1661a86897bc
- 余弦相似度算法(余弦相似度(cosine similarity)是资讯检索中常用的相似度计算方式,可用来计算文件之间的相似度,也可以计算词汇之间的相似度,更可以计算查询字串与文件之间的相似度。) 这是一个基于Jcseg分词算法的余弦相似度例子,运行com.fenci.test.IKMainTest可以查看运行结果。-please do it by yourself
paoding-analysis-2.0.4-alpha2
- paoding分词算法源码及其lib,使用时需要修改paoding-analysis.jar文件中的dic目录-paoding segmentation algorithm source code and lib, we need to modify paoding-analysis.jar file dic directories use
909aae2c-4f2c-4771-83e4-6894516f14e1
- 一个中文分词算法,可以实现将分词文本切分成自定义字典中的单词-A Chinese word segmentation algorithm, you can achieve the word segmentation text into a dictionary of words
hanlp-1.2.2-sources-
- hanlp源码,包括各种分词算法的实现,比如隐马尔科夫模型,条件随机场模型,N最短模型等,还有语义分析,情感分析等-hanlp source, including a variety of sub achieve segmentation algorithm, such as hidden Markov model, conditional random, N shortest models, as well as semantic analysis, sentiment analysis, e
word
- java 实现简单的分词算法,自动匹配,代码注释详细。-Java to realize automatic word segmentation algorithm is simple, match, code notes in detail.