搜索资源列表
汉语自动分词与词性标注软件中文分词系统
- 学习汉语自动分词与词性标注软件的组件化有助于更好的理解中文分词系统,PoS tagging HMM
40W
- 40万汉语大词库,里面包含了常用的汉语词组,可以直接用于自然语言开发分词处理-40 million Chinese large vocabulary, which contains a common Chinese phrase, can be directly used for developing natural language processing segmentation
acmfudaojiaocheng
- 问题规模化是近来信息学竞赛的一个新趋势,它意在通过扩大数据量来增加算法设计和编程实现的难度,这就向信息学竞赛的选手提出了更高层次的要求,本文试图探索一些解决此类问题的普遍性的策略。开始,本文给出了“规模化”一词的定义,并据此将其分为横向扩展和纵向扩展两种类型,分别进行论述。在探讨横向扩展问题的解决时本文是以谋划策略的“降维”思想为主要对象的;而重点讨论的是纵向扩展问题的解决,先提出了两种策略——分解法和精简法,然后结合一个具体例子研究“剪枝”在规模化问题中的应用。问题规模化是信息学竞赛向实际运用
Chinese-word-segmentation
- 基于n-gram和机器学习的汉语分词算法 理论研究-Chinese word segmentation