搜索资源列表
百度分词词库
- 据说是百度以前用的中文分词词典,希望对大家有一点帮助哈,快下快下-allegedly Baidu before the Chinese word dictionaries, we hope to have a bit of help to Kazakhstan, where fast under fast!
ThesaurusAnalyzer
- lucene中文分词代码 带有19万字的词典 本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
luncene查询分析器中文词典
- 中文分词词库
windowsSocket-Overlapped
- windows网络模型之Overlapped 实现的网络词典的客户端和服务器,需要配置数据源,用的access数据库-windows network model of the network to achieve Overlapped dictionary client and server, need to configure the data source, access the database used
cServer
- 一款简单的网络词典服务器程序,用来建立网络服务器,配合客户端使用,可以进行单词查询,包含有一个数据库文件,用来存放词库-A simple dictionary of the network server, used to create web server with the client to use, you can query for a word that contains a database file, used to store Thesaurus
33753115ktdictseg_v1.0.01
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
mySegment
- 类库程序,基于词典的简单分词,可分中英文混合的情况-Simple dictionary-based segmentation procedure
youdaodict.tar
- 有道词库,这是目前最新版的有道词典库有道词库,这是目前最新版的有道词典库-Youdao thesaurus, which is the latest version of Youdao Dictionary library youdao thesaurus, which is currently the latest version of Youdao Dictionary library
through.9.13.15.tar
- 一个基于规则的机器翻译系统,采用了北大计算语言所的规则库和词典。-A rule-based machine translation system, which used the phrase rules and dictionary of Peking University.
online_dictionary
- linux下的英语在线词典!词库是从金山毒霸提取出来的-Linux under English online dictionary! A thesaurus extracted from jinshan drug gangsters............
ccred
- 词典网ccred.cn提供的汉字查询工具,词库包括汉字的基本部首笔画查询,有拼音、部首、笔画、五笔、笔顺、部件分触目等功能,有关于汉字的基本解释、详细解释、常用词组、康熙字典、说文解字等。-Network Query Tool kanji dictionary ccred.cn offer, including the basic strokes of Chinese characters thesaurus query, pinyin, radical, stroke, stroke, str
