搜索资源列表
propsource
- 这是句法分析系统的原代码,可以用于人工智能的各各方面,比如输入法、段词分词程序的进一步补充、语音识别等各方面!-This is the syntactic analysis system source code, which can be used across a diversity of artificial intelligence, such as the input method, word of the Word of the procedures further added, vo
MySeg
- 最短路径法分词程序。将中文句子经过原子切分后生成一个有向无环图,然后使用Dijkstra算法求出由起点到终点的最短路径以实现中文分词。-shortest path method participle procedures. Chinese Sentence will be read after splitting atoms generated a directed acyclic graph. then use the Dijkstra algorithm derived from the s
findkey.c
- 此程序解决的问题:较好的, 并适应短字符串的中文分词算法.根据词库 发现以换行符分隔的众多标题中的 top N 关键字并以此更新词库.是一个分类分词算法 -this procedure to solve the problem : better, and adapt to the short string of Chinese Segmentation. According thesaurus found in the many separate newline heading the to
5271615762
- 中文分词技术 从别的网上摘的 感觉还不错 请大家-Chinese word technology from other online pick feeling quite well please try
ictclas10
- 基于中科院的ICTCLAS实现中文分词系统 开发工具是JAVA.经测试,效果很好.-ICTCLAS based on the realization of the Chinese Academy of Sciences Chinese word segmentation system is the Java development tools. Tested, good results.
Win32Cut
- 分词程序,Win32窗口界面程序,含设计文档,具有打开文档,显示分词结果,保存结果等功能,欢迎讨论。- The participle procedure, the Win32 window contact surface procedure, contains the design documents, has opens the documents, demonstrated the participle result, preserves function and so on resu
wordppl
- 本程序采用正向 逆向最大匹配才实现汉字分词-the procedures being used in reverse to get the maximum matching Chinese Word
CSW50
- 是一个很好的分词组件,里面有具体的说明文档。-is a good segmentation components, there are specific documentation.
chentian.fenci
- 实现了基于词库的nutch中文分词,这一部分是其中的dll文件-realized based on the thesaurus nutch Chinese word, this part is one of the dll file
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
PWSWNRCODE
- 最大概率法分词。这种技术的分词效率极高。大家共享了。-greatest probability method segmentation. This segmentation of the very efficient. Share of.
BiHZFreqCode
- 汉字二字组频度统计。可以统计汉字文本中二字组的频度。很好用。中文文本分词很有用的工具。-Chinese word frequency statistics group. Chinese statistics can text the word frequency group. Good use. Chinese text segmentation useful tool.
ChineseTokenizer20060426
- 分词文件,是一个比较简单词库.简单的说就是个强大的搜索-word document is a relatively simple thesaurus. Simply means that the powerful search
Demo-3GWS
- 这是我在作研究是所使用的分词系统软件,现在提交给大家,供大家研究使用.-This is my research is the use of segmentation system software, we now introduce to you, for your study.
Wordsegmentation2
- NLP技术实现,对语料库进行自动统计生成分词词典,对训练集进行分词,列出所有的分词可能并计算每种可能的概率。请使用者自行加入语料库和测试集。-NLP technology to automatically Corpus Health Statistics ingredients dictionary, the training set for segmentation, list all the sub-term may calculate the probability of each pos
hisense
- 程序的主要思想是先对数组进行处理,使其有序,处理后的结果存放在t1.txt文件中。。然后在此基础上建立索引,使在查字典时可以减少比较的次数,节省程序的时间。再利用最大匹配算法对程序进行分词,分词的结果保存在t2.txt文件中。然后再拿分好词的文件与libing_test文件进行比较匹配率,匹配结果存放在result.txt文件中。-procedures main idea is first to array processing, it orderly, After processing the
2006111
- 支持英文、数字、中文(简体)混合分词 常用的数量和人名的匹配 超过22万词的词库整理 实现正向最大匹配算法 智能数字,日期,人名识别。-support English, figures, Chinese (simplified) mixed at the number of commonly used words and the names of more than 220,000 matching word thesaurus finishing achieve the greatest po
SQLET_split
- SQLET分词算法,一个C程序,供大家参考。-SQLET segmentation algorithm, a C program, for your reference.
fencicode
- 挺不错的东西,分词库要自己去添加,我没有乱写啊。-quite good things, thesaurus minutes to add to his, ah, I do not write without basis.
CSW_CN_dll_5.0.0
- CSW中文分词组件_5.0.0 CSW中文分词组件_5-CSW Chinese word segmentation components _5.0.0 CSW Chinese word segmentation components _5