搜索资源列表
maxent-20041229[1].win32
- 文本分析中基于统计的方法中,最为常用的最大熵算法,该源码为Python版,广泛应用于词性标注,词义消岐等领域-text analysis based on statistical methods, the most commonly used of maximum entropy algorithm, the source code for Python version, widely used in tagging, Meaning Consumers divergent fields
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
SQLET_split
- 另外一个中文分词程序,采用的是可显示的字典,可供大家分析-another Chinese word segmentation procedures, the show is the dictionary for our analysis
word-findANDcount
- 这是一个原创的文章信息自动标引和分类小程序。可以用于文本分析。功能还在不断完善中:)-This is an original article automatic indexing and classification of small programs. Text analysis can be used. Capabilities are also constantly perfected :)
词法分析程序
- 词法分析程序,可以在visualc++中运行-lexical analysis procedure can be run in visualc
SharpICTCLAS
- Sharp ICTCLAS分词系统,对ICTCLAS分词系统进行了详尽的分析,并将代码移植到C#。-Sharp ICTCLAS segmentation system, right ICTCLAS segmentation system for a detailed analysis, and code to C# transplantation.
ICTCLAS_Source_Analysis
- 对ICTCLAS源码进行了详尽的分析,对系统的理解相当有帮助。-right ICTCLAS source for a detailed analysis to understand the system very helpful.
xml
- xml层次分析,完成对xml的层次分析,此源码为在网上找到的,版权为他人的
Burg
- 用burg算法实现功率谱的估计,可以改变信噪比SNR,阶次P,可以分析分辨率
PcfgParser
- 1. 先打开规则库,读入规则集 (可比较两个规则文件rule1.txt 和 rule2.txt的差异) 2. 选择经过分词和词性标注的文件,进行句法分析 3. 分析结果文件与测试文件在同一个目录下,文件后缀名为 .pcfg 4. 分析结束后,同时产生一个新的规则文件,后缀名为.new, 可以观察规则概率值和期望次数的变化 5. 分析结果逐个以树形图方式显示,如果一个句子有多个结果,在显示框中同时显示。
BottomUpParser
- 中文信息处理方面的一个源码,此为自底向上的句法分析程序。功能比较完善,代码简洁易懂。
TestMDB
- 中文信息处理方面的一个源码。此为一个拼音分析和生成软件功能强大,代码简洁易懂。 1 可执行程序TestLexicon.exe必须与数据库文件在同一个目录下 2 数据库文件名为: lexicon.mdb,可以是access 97版格式的数据库, 也可以是access 2000版格式的数据库 3 双击TestLexicon.exe启动程序 4 选择“词典数据库”下“词库查询1”等进行查询,状态栏显示每个查询的 区别。程序反馈消息框响应用户的查询。
12131822509
- 中科院开源的ictprop源码,使用方法: 1、修改源码中的InputComboBox.cpp文件 InvokeAction里面的txt文件路径换成你的本地路径; 2、入口在帮助里面,先G_A,再G_B,然后P;结果就出来了,那几个子窗口不要关了,就可以看到句子的分析结果; 注:InvokeAction里面的txt文件都在压缩包里面;
SocietyInforDistill
- gis,使用c#,arcobject(ae)实现空间分析的列子(geoproceor使用),根据面积淹没,实现灾评信息的统计.
54
- 《高阶谱分析》例题5.4,根据零极点分布建立传递函数,求解冲击响应和系统输出,求解高阶矩或累计量,计算倒谱参数。
clustBoost
- 聚类分析程序 k-means 编译环境 gcc/stl
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅
src
- 单词还原工具,自顶向下的分析 器和基于图的自底向上句法分析器。重点是基于图的自底向上句法分析器(chart parser)。-The word Restore tool, top-down parser, and graph-based bottom-up parser. Focused on graph-based bottom-up parser (chart parser).
parsing
- 句法分析(syntactic parsing)的任务就是识别句子的句法结构(syntactic structure)。在自然语言处理领域,句法分析的目标是实现高正确率、高鲁棒性、高速度的自动句法分析过程。 但是该问题的困难在于自然语言中存在大量的结构歧义(structural ambuguity)。例如:I saw a boy in the park.这句话有两种可能的句法分析方法:1、[I saw a boy] in the park.2、I saw a [boy in the park].语
aclImdb_v1.tar
- 英文影评语料库,用于英文情感分析。包含训练集和测试集,均为标注数据。(English movie reviews corpus)
