搜索资源列表
SegDemo
- 东大的一个分词程序。RuleForPn.dat,segment.dat,segrule.dat是分词动态库要使用的资源文件. userdict.dat是用户词典. CipSegSDK.dll,CipSegSDK.lib是动态库的文件. CipSegDll.h是头文件,供调用使用.-a sub-term procedures. RuleForPn.dat, segment.dat, segrule.dat Dynamic segmentation is to be used for the res
yangpengwei
- 中文分词程序,是用java语言编的.文件名为yangpengwei.zip-Chinese word segmentation procedure is the use of java language series. Documents called yangpengwei.zip
语料库
- 一份很重要的语料库,为你的分词程序是一个很好用的资料库文件-a very important corpus, as your segmentation procedure is a very good use of the database file
segment
- 基于文本文件的分词程序,可以将指定文件名的文本文档按照词典自动划分出单词.-text-based documents, the sub-term process, which would be designated the File Name text documents with automatic divided dictionary word.
SQLET_split
- 另外一个中文分词程序,采用的是可显示的字典,可供大家分析-another Chinese word segmentation procedures, the show is the dictionary for our analysis
propsource
- 这是句法分析系统的原代码,可以用于人工智能的各各方面,比如输入法、段词分词程序的进一步补充、语音识别等各方面!-This is the syntactic analysis system source code, which can be used across a diversity of artificial intelligence, such as the input method, word of the Word of the procedures further added, vo
MySeg
- 最短路径法分词程序。将中文句子经过原子切分后生成一个有向无环图,然后使用Dijkstra算法求出由起点到终点的最短路径以实现中文分词。-shortest path method participle procedures. Chinese Sentence will be read after splitting atoms generated a directed acyclic graph. then use the Dijkstra algorithm derived from the s
Win32Cut
- 分词程序,Win32窗口界面程序,含设计文档,具有打开文档,显示分词结果,保存结果等功能,欢迎讨论。- The participle procedure, the Win32 window contact surface procedure, contains the design documents, has opens the documents, demonstrated the participle result, preserves function and so on resu
guide
- 中科院的分词程序说明,缺少此文档的可以看看看。-CAS-word descr iption of the processes, the lack of this document can watch to see.
SegtoFile
- 为自然语言处理领域的中文分词程序,可将分词内容写入文件。-natural language processing area of the Chinese word segmentation procedures can be written in word document.
worldSeg
- 参考詹卫东写的分词程序,完成的一个基于C#的简易分词程序。-reference Danweidong word written procedures for the completion of a simple C# segmentation procedures.
WordClassify
- 一个分词程序,c代码,有很详细的注释,便于阅读
splitwords
- 用C#编写的一个分词程序,开放程序源码。
Word
- 对中科院分词程序的简化版本,做成了动态链接库形式
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
mySegment
- 类库程序,基于词典的简单分词,可分中英文混合的情况-Simple dictionary-based segmentation procedure
遗忘算法(词库生成、分词、词权重)演示程序
- 通过非主流的遗传算法进行关键词提取,分词的功能(Through the non mainstream genetic algorithm for keyword extraction, word segmentation function)
CorpusWordParser
- 语料分词和词性标注软件。 软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。 软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。(Word segmentation and part of speech tagging software. Software only supports files that open text format (.Txt), and other types of files need to be sav
jieba-jieba3k
- MATLAB 结巴分词的工具包,用于很多中文分词的模式识别代码程序,利用已有函数工具包提高工作效率,内有安装说明(MATLAB jieba toolkit, used for many Chinese word segmentation pattern recognition code programs, using existing function toolkits to improve work efficiency, with installation instructions)
NICTCLAS
- NICTCLAS是大名鼎鼎的中科院计算所语词法分析系统ICTCLAS免费版的.NET包装版本,在原有免费EXE源码的基础上使用C++ /CLI封装成NICTCLAS.dll,将原CResult类改写成NICTCLAS managed class,并为适应VC8编译对源码做了少许改动,当然还有N个因为strcpy之类的警告因为实在太多干脆不予理会。如有错漏请不吝指正。 NICTCLAS做了一定程度的简化,接口非常简单,普通分词应用足够了,这里提供C#执行程序调用示例。词库文件下载解压请放在对