搜索资源 - 分词算法 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 分词算法

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

TextCategorization

0下载：
基于朴素贝叶斯算法实现的中文文本分类程序。可以对中文文本进行分类识别，使用时先对分类器进行训练，然后进行识别。该Beta版本仅支持对3类文本进行分类，使用简单的中文分词方法，本程序尚不具备实用性，用于算法研究和改进。-based on Bayesian algorithms to achieve the Chinese text classification procedure. Can the Chinese text classification identification, the us
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2008-10-13
- 文件大小：317598
- 提供者：钱磊

darts-0.2.tar

0下载：
双数组辞典生成程序。利用双数组实现trie算法，对于不定长度共同前缀查询情况，比哈希方法更为有效。经常用于分词辞典的制作。-array dictionary-generation procedures. Using two arrays to achieve Trie algorithm for the indefinite length of the inquiry common prefix than Hash methods more effective. Frequently used
所属分类：数据结构常用算法
- 发布日期：2015-06-10
- 文件大小：237927
- 提供者：姜锋

MySeg

0下载：
最短路径法分词程序。将中文句子经过原子切分后生成一个有向无环图，然后使用Dijkstra算法求出由起点到终点的最短路径以实现中文分词。-shortest path method participle procedures. Chinese Sentence will be read after splitting atoms generated a directed acyclic graph. then use the Dijkstra algorithm derived from the s
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：426496
- 提供者：周景荣

hisense

0下载：
程序的主要思想是先对数组进行处理，使其有序，处理后的结果存放在t1.txt文件中。。然后在此基础上建立索引，使在查字典时可以减少比较的次数，节省程序的时间。再利用最大匹配算法对程序进行分词，分词的结果保存在t2.txt文件中。然后再拿分好词的文件与libing_test文件进行比较匹配率，匹配结果存放在result.txt文件中。-procedures main idea is first to array processing, it orderly, After processing the
所属分类：图形图象
- 发布日期：2008-10-13
- 文件大小：185594
- 提供者：王磊

2006111

1下载：
支持英文、数字、中文（简体）混合分词常用的数量和人名的匹配超过22万词的词库整理实现正向最大匹配算法智能数字,日期,人名识别。-support English, figures, Chinese (simplified) mixed at the number of commonly used words and the names of more than 220,000 matching word thesaurus finishing achieve the greatest po
所属分类：图形/文字识别
- 发布日期：2008-10-13
- 文件大小：37291
- 提供者：王成平

myKbest_0513

0下载：
中文分词, N-最短路径算法 ICTCLAS研究学习组 http://groups.google.com/group/ictclas?msg=subscribe-Chinese word segmentation, N-shortest path algorithm ICTCLAS Studies Group http : / / groups.google.com / group / sub ictclas msg = scribe
所属分类：数据结构常用算法
- 发布日期：2008-10-13
- 文件大小：73508
- 提供者：Jian Ye

zhongqijiancha

0下载：
中文分词的基本实现功能，带有界面的处理，实现文件内容的分词，可以计算算法处理时间-Chinese word basic function and interface with the processing, and the contents of the paper, the sub-term calculation algorithm processing time
所属分类：JSP源码/Java
- 发布日期：2008-10-13
- 文件大小：1695716
- 提供者：艾乐

cutword

0下载：
用VB与数据库相连接实现中文分词的程序，采用了正向最大匹配算法。-using VB and database links, Chinese word segmentation procedures using the largest positive matching algorithm.
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：214040
- 提供者：李玉

mmseg-v0.1

0下载：
基于词典和最大匹配算法的的中文分词组件，达到很好的分词准确率-Dictionary and the largest based on the matching algorithm of the Chinese word segmentation components, to achieve good word accuracy rate
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：607478
- 提供者：binger

AutoSpliter

0下载：
用于中文分词的算法。包括逆向分词和反向分词-for Chinese word segmentation algorithm. Including reverse and reverse word segmentation
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：1187527
- 提供者：高照光

dedesplit

0下载：
中文切词，非常优秀特此推荐。是目前分词效率较高的算法-Chinese segmentation, hereby commend outstanding. Segmentation is more efficient algorithm
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：677929
- 提供者：wu guangyin

ProbWordSeg

0下载：
中文信息处理方面的一个源码。此为一个分词软件，这个分词的算法虽然简单，但是原理和其他相同，是最大概率法分次。功能强大，代码简洁易懂。
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：87434
- 提供者：robert

ChineseAnalyzer

1下载：
lucene.net 2.0的中文分词器，采用最大向前匹配算法，附上源代码和lucene.net.dll，希望这方面有兴趣的互相交流一下。
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：881569
- 提供者：杨秀云霁

ChineseSegment

0下载：
基于Hash字库算法的lucene分词完整的代码，使用创新的Hash字库，是分词效果大大提高
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：31841
- 提供者：陈锦

svm_multiClass

0下载：
svm(支持向量机)分类算法本质上是二类分类器，实现多类分类的方法一般是将多类分类看作是多个一对多的二类分类器。本程序就是基于svmlight的svm多类分类器实现。对分类感兴趣的用户请参照。配合中文分词（参见我上传的程序），可实现中文多类分本分类。
所属分类：中文信息处理
- 发布日期：2014-01-18
- 文件大小：566638
- 提供者：maming

textclustering-master

0下载：
对于大文本进行挖掘聚类，该方法不考虑文字词语出现的频率信息，考虑上下文语境，将所有的字根据预定义的特征进行词位特征学习，获得一个训练模型。然后对待分字符串的每一个字进行词位标注，最后根据词位定义获得最终的分词结果。(Digging for large text clustering, the method does not consider the text word frequency of information, considering the context, all the words
所属分类：数据挖掘
- 发布日期：2018-04-21
- 文件大小：15491072
- 提供者：富贵再三123

5953281

0下载：
最大概率分词法,这种分词算法能够较好的解决汉语分词中的歧义问题,但分词效率比最大匹配分词算法要低()
所属分类：图形图象
- 发布日期：2018-04-21
- 文件大小：67584
- 提供者：wiypmf

argkmebt

0下载：
此程序解决的问题较好的, 并适应短字符串的中文分词算法根据词库发现以换行符分隔的众多标题中的 top N 关键字并以此更()
所属分类：其他
- 发布日期：2018-04-29
- 文件大小：8192
- 提供者：capabelitg

128083

0下载：
汉语分词算法,包含最大匹配和基于概率的分词算法()
所属分类：图形图象
- 发布日期：2018-04-30
- 文件大小：43008
- 提供者：VZsxjif!5856

TFIDF算法的C#实现

3下载：
支持英文分词，无中文分词。采用Centivus.EnglishStemmer.dll库
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2018-09-24
- 文件大小：17070
- 提供者：feria@163.com

« 1 2 ... 4 5 6 7 8 910 11 12 13 14 15 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.