搜索资源列表
infomap-nlp-0.8.6.tar
- 有关自然语言理解理解方面的源码,可以实现简单的自然语言识别。-on natural language understanding understanding of the source, can achieve a simple natural language recognition.
Entropy
- 统计一篇文本文档中的熵,用于自然语言的处理
ChineseJava
- 这是我在语言界面方面的一些想法,目的是有一天我们不但可以用汉语写程序也可以用其他任何一种语言写程序,最终我们可以直接使用自然语言开发软件。
NaviveBayesClassify
- 朴素贝叶斯分类,经常出现在我们的文本分类中,该分类方法简单实用,是自然语言处理常用的方法
lingpipe-4.0.1
- 是一款自然语言处理软件包。这是lingpipe的4.0.1版本。包含源码、jar包和说明文档。-Is a natural language processing software package. This is lingpipe the 4.0.1 version. Contains source code, jar package and documentation.
fudannlp-0.9-src
- 复旦大学的自然语言处理的软件,也是一个非常好的工具软件。请试用-NLP Tools of FuDan
CRF_maxent
- 这是一个条件随机场和最大熵的实现包,可用于自然语言处理中的序列标记、分类等。-This tool is an implementation of CRFs and Maximum Entropy,which can be used for sequence labeling.
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
LTP
- 哈工大LTP自然语言处理工具的java调用实例,利用jni调用dll,实现中文的分词,词性标注,建立依存树等-HIT LTP natural language processing tool called an instance of java using jni call the dll, to achieve in Chinese word segmentation, POS tagging, the establishment of dependency trees, etc.
ChineseWordsDemo
- LingPipe(开源自然语言处理的Java开源工具包) 中文分词java程序-LingPipe (open source natural language processing toolkit in Java open source) Chinese word segmentation procedure java
crawler
- 实习时做的网络爬虫程序,爬取“金融时报”和“ftchinese”网站的双语文本语料。带源码和可执行文件,并附使用说明。做自然语言处理方面的好例子-When the network attachment procedure reptiles, climb a " Financial Times" and " ftchinese" bilingual text corpora website. With source and executable files, a
mallet-2.0.6
- 关于自然语言处理、机器学习的一个开源软件。-MALLET is an integrated collection of Java code useful for statistical natural language processing, document classification, clustering, information extraction, and other machine learning applications to text.
Thinking-In-Java-4th
- 一本关于java编程思路的问题,摆脱了自然语言对程序语言的过度干扰-Idea of a book on java programming problem, get rid of the natural language programming language, excessive interference of
WordSimilarity
- 辞典文件放置在dict目录下,由"中文自然语言处理开放平台提供。算法参数使用《基于<知网>的词汇语义相似度计算》的实验参数,具体定义在类WordSimilarity中,为私有静态常量,可根据需要自行修改。-Dictionary files are placed in the dict directory, by the " Chinese natural language processing to provide an open platform for the algorithm p
ICTCLAS2012-SDK-0101
- 这是一个分词系统,大家可以用来对文本或者一段话进行分词!具体可以访问,北京理工大学自然语言处理网www.plnir.org-This is a segmentation system, we can use the text or paragraph word! Concrete can be accessed, Beijing Institute of Technology Natural Language Processing Network www.plnir.org
Suffix
- 后缀树,自然语言处理,字符串重复匹配,这是java版的源代码-Suffix tree, natural language processing, the string matching repeat, this is the version of java source code
sentenceboundary.tar
- 句子边界,利用一定的自然语言处理的原理,讲句子进行分割,从而提取出有效的部分-the sentence boundary
mmsegger_src_1.0
- 最大正向匹配分词算法,用于分词和自然语言处理-Maximum forward matching word segmentation algorithm
1127
- 应用中科院的分词模块进行分词并把结果存在硬盘,广泛应用于自然语言处理-Application of the Chinese Academy of Sciences segmentation module segmentation, and there is a hard drive, is widely used in natural language processing
RLSI
- RLSI算法实现源代码,RLSI 是一个可以并发执行的、能够高效的应对大规模数据集的算法。用于发现document中的topic model,在web 搜索、机器学习、自然语言分析等领域都有重要意义。-RLSI algorithm source code, RLSI is one that can execute concurrently, and can efficiently deal with large data sets algorithms. For discovery docume