搜索资源列表
Threeway.tar
- Tucker, PARAFAC, GRAM, RAFA and misc. 2nd order models with a test data set (old version now covered by the N-way Toolbox)-Tucker, B6, GRAM, RAFA and misc. 2nd order models with a test's data et (old version now covered by the N-way Toolbox )
Gram_S
- classical Gram-Schmidt(unstable) (reduced QR factorization).A:m-by-n matrix. (m>=n)Q:m-by-n unitary matrix.R:n-by-n upper triangular.-classical Gram-Schmidt(unstable) (reduced QR factorization).A:m-by-n matrix. (m>=n)Q:m-by-n unitary matrix.R:
Tightly-Packed-Tries
- Tightly Packed Tries: How to Fit Large Models into Memory, and Make them Load Fast, Too We present Tightly Packed Tries (TPTs), a compact implementation of read-only, compressed trie structures with fast on-demand paging and short load times. We de
Text-Category
- 文本分类方法总结:Swap-1方法、n-gram方法、Bayes分类-Text Categorization Method summary: Swap-1 method, the n-gram method, Bayes classification, etc.
Computational-Linguistics
- 计算语言学PPT-常宝宝 北京大学计算语言学研究所 介绍的内容有n-gram和数据平滑、熵和语言模型评价、隐马尔可夫模型、有限状态技术和形态分析-PPT-often baby Computational Linguistics Institute of Computational Linguistics of Peking University introduced n-gram content and data smoothing, entropy and the language m
julius-4.3.1.tar
- Julius 是一种高性能,两通大词汇量连续语音识别(LVCSR)语音相关的研究和开发的解码器软件。基于字的N-gram和上下文相关的HMM模型,它可以进行几乎实时实时解码目前大多数电脑在60K字听写任务。完全纳入,如树的N-gram词汇,保,跨词的上下文依赖处理,包围梁搜索,高斯修剪,高斯的选择,除了搜索效率等各大搜索技术,它也是模块化小心从模型结构独立,如共享状态triphones的和并列混合模型与任意数量的混合物,州或手机,支持各种HMM的类型。采用标准格式,以配合HTK的,债务工具中央结
NGram
- java 实现基于N-gram的文本分类算法-java based N-gram-based text classification algorithm
Chinese-word-segmentation
- 基于n-gram和机器学习的汉语分词算法 理论研究-Chinese word segmentation
ngramtool-20040527-mingw32-static
- 在Windows环境下,可以对大规模语料进行n-gram统计,并且可以删除冗余子串。-In the Windows environment, you can carry out a large-scale corpus based n-gram statistics, and you can held redunction of substring.
mpiingrams
- N-Gram Hadoop Mapreduce. It has some method to calculate N-GRAm Statistics as: NGSuffixSigma, NGNaive, NGAprioriScan, NGAprioriIndex.-N-Gram Hadoop Mapreduce. It has some method to calculate N-GRAm Statistics as: NGSuffixSigma, NGNaive, NGAprioriSca
MarkovNGramm
- In the fields of computational linguistics and probability, an n-gram is a contiguous sequence of n items a given sequence of text or speech. The items can be phonemes, syllables, letters, words or base pairs according to the application. The n-grams
code
- 基于n-gram进行特征提取和分类训练的代码-N-gram based feature extration and traning code
ngram模型分词与统计算法
- N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面,N-Gram的另外一个作用是用来评估两个字符串之间的差异程度。这是模糊匹配中常用的一种手段。本文将从此开始,进而向读者展示N-Gram在自然语言处理中的各种powerful的应用。(N-Gram (sometimes referred to as N metamodel) is a very important concept
自然语言处理课程设计代码
- 一、宋词词频统计:语料库:ci.txt 要求:编程序,输入ci,自动分析统计ci.txt,统计宋词的单字词,双字词等。统计后,输出的是单字词和双字词的词典文件。文件中包括相应的词和频度(次数)。 二:宋词自动生成:语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 四、中文词法分析系统:语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最
合工大自然语言处理报告代码
- 四、中文词法分析系统 1、实验要求 语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最长匹配,或者后向最长匹配等算法,鼓励用更复杂一些的方法来进行,包括隐马尔科夫模型和条件随机场模型。 二、宋词自动生成 1、实验要求 语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 实现了隐马尔科夫模型分词