搜索资源列表
FreeICTCLAS.zip
- 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58%(973专家组评测),未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
propsource
- 这是句法分析系统的原代码,可以用于人工智能的各各方面,比如输入法、段词分词程序的进一步补充、语音识别等各方面!-This is the syntactic analysis system source code, which can be used across a diversity of artificial intelligence, such as the input method, word of the Word of the procedures further added, vo
lz_spidetytryryr
- 这个系统是属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。 适合与于对某一指定领域里的网站进行搜索,比如仅搜索医学网站。 使用sql server 2000做数据库。 网络蜘蛛根据用户设定的入口网址自动收集网页数据 强大完备的后台管理 充分挖掘.net性能,百万数据瞬间搜索 完美的前台web页cc面媲美专业搜索 中文分词接口-The system is an automated search
Paoding
- 中文分词得小系统,基本功能已实现,但还有很多地方有待改进,没有实现自动学习,人名识别等功能。-Chinese word in the smaller system, the basic functions have been achieved, but there is much room for improvement, no automatic learning, name identification, and other functions.
HLjava
- 海量中文分词java接口,原海量分词是C/C++平台开发的,这是java版的接口,如果提示过期,修改系统时间即可试用
nicewords_2.0.0128_for_3790_4659.tar.dezend_cc_php
- Nicewords-Dzend版 Nicewords是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)、分词技术和网页萃取技术,结合白帽SEO(规避了一切风险的搜索引擎优化),利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。 您要做的仅仅是设置几个关键词
textclassification
- 基于svm的分词系统,可以对一段话中的词进行分离处理-Svm-based segmentation system, the passage can be isolated word processing
ictclas2013_release
- ICTCLAS2013 java版,中文文本分词系统-ICTCLAS2013 java
nlpir_ictclas2013_release
- 中科院发布的分词系统,能很好的进行中文分词,词性标注。-Chinese Academy of Sciences released a segmentation system that can be very good for Chinese word segmentation, POS tagging.
093031fenci
- 这是一个中文分词系统,ICTALAS,非常经典的分词源码,欢迎下载。-This is a system of Chinese segmentation,ICTALAS,and it s very classical.It s my hornor to download this resource,thank you.
use_nlpir
- 解决NLPIR-ICTCLAS2014分词系统词库过大,造成读取缓慢问题 -Solve NLPIR-ICTCLAS2014 segmentation system lexicon is too large, resulting in slow read issue
WordSegment
- 分词系统的应用尝试,将维基百科解析得到的文件进行切割分词处理-Try word application system, the resulting file is parsed Wikipedia cutting word processing
ICTCLAS
- 中科院的中文分词系统ICTCLAS,eclipse直接引入项目就可以用,已经测试过很好用的。- Chinese Academy of Sciences Chinese word breaker ICTCLAS, eclipse introduced directly into the project can be used, it has been tested very good use.
fenciledebeiyesi
- 中文文本分词系统+基于贝叶斯算法的文本分类源码,用matlab实现。-Chinese word segmentation system+ based on Bayes text classification source code, using matlab implementation.
vajabasefor
- 分词系统的补充数据库,对于不同的领域有不同的数据库,-Word segmentation system added , for different areas have different ,
百词斩
- 本程序设计了一个单词学习系统,主要功能有:1.选择词库,2.添加单词,3.删除单词,4.修改单词,5.学习计划,6.单词游戏,7.查询单词(支持模糊查询)。执行程序进入系统后,首先要选择词库,有四级单词、六级单词、托福单词和考研词汇四个词库可供选择。选择词库后显示“我爱背单词系统”主界面,共有7个功能可供选择,分别是:1.添加单词,2.删除单词,3.修改单词,4.学习计划,5.单词游戏,6.查询单词,7.退出系统。(The program design of a word study syste
61836700
- 这是一个文本标注的软件,点击它后可以对输入文本进行分词,标注(This is a text annotation software, click on it after the input text participle, labeling)
DeleteJunkFiles
- 很好的文本分类,可以二次开发或者其他的使用也是比较方便的(Very good text classification, can be secondary development or other use is also more convenient)
TextCluster-master
- 基于汉语分系统开发的聚类分析方法,可以直接运行(Clustering analysis method based on the development of the Chinese system)