搜索资源列表
mlct_public
- 这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语言-This is a Java-based segmentation, N-gram statistics, the sub-clause of the function procedures, multilingual support
Maxmin
- 一个简单的数字计算和数字统计的VB小程序,可以用来参考做一些复杂程序的方法-a simple calculation of the figures and statistics on the VB small program can be used to do some reference to the complex procedures
xdgf
- 字符处理这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语-characters to deal with this is a Java-based segmentation, N-gram to statistics, subparagraph Clauses function procedures, multiple language support
TestCorpusyuliaoguanli
- 1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2. They can add and delete corpu
wenben.txt
- 在一个文件中找到给定单词出现的位置并统计出现次数-documents in a given word to find the location and frequency statistics
text2idngram
- 最注明的cmu语言模型工具箱中的将文本转化为trigram统计的工具。在linux下可用。用法可使用-help命令。-most of the annotated cmu language model kit of text into trigram statistics tool. Linux can be used in the next. Usage may use-help orders.
BiHZFreqCode
- 汉字二字组频度统计。可以统计汉字文本中二字组的频度。很好用。中文文本分词很有用的工具。-Chinese word frequency statistics group. Chinese statistics can text the word frequency group. Good use. Chinese text segmentation useful tool.
ProbWordSeg1
- 基于最大概率的分词,首先读入.mdb数据库(字典与其统计词频),然后读入你要分词的.txt-based on the maximum probability of the word, first read into. Mdb database (with dictionary word frequency statistics). Then you should read into the word. txt
TS300Src
- 从唐诗300首中统计作者和发表的诗篇,用perl语言实现-from the Tang Dynasty 300 Statistics published by the author and poetry, using perl language
Sohu.ZIP
- 统计http://www.sohu.cn/页面中有多少个静态的超链接,用perl语言实现-statistics http://www.sohu.cn/ pages static number of hyperlinks using perl language
count_char
- 输入一篇文章,统计各个字出现的次数,希望大家能优化这个程序-importation of an article in the various statistics the number of occurrences of the word, I hope you will optimize this process
distinguishword
- 文字识别,输入一段文字可以统计和识别段落和字母。-character recognition, text can be imported for some statistics and identification paragraphs and letters.
HanziSearch
- 以2000年的人民日报为检索对象,查找所有包含所要检索汉字字串的内容,并输出到searchresult文本文件,并统计条目数-2000 to the People's Daily to retrieve objects that you have to include all search strings of Chinese characters, searchresult and exported to text files, and several statistics entry
zryy1
- 字字之间的转移概率算法,需要一个大文本来统计。-multiplicity of transfer probability algorithm, the text needs to a large statistics.
IM
- 控制台程序。要求:输入一个UNICODE的中文文本。结果,统计字符之间的的频率和多元互信息。-console procedures. Requirements : a UNICODE importation of Chinese text. The results, statistics between characters in the frequency and diversified mutual information.
HZ_Freq
- 文本中汉字频率统计的程序-Chinese text frequency statistics procedures
ChineseSplit
- 一个基于VB.NET开发的中文分词及关键词提取系统,采用双向最大匹配、词频统计、快速排序等算法实现。-VB.NET developed based on Chinese word segmentation and Key Extraction System, the largest two-way matching, word frequency statistics, such as quick sort algorithm.
nlp
- 中文自然語言處理相關程式,包括中文字頻統計及Jensen-Shannon Divergence計算程式,並包含古典文獻範例-This rar file include natural language processing related programs, includeing Chinese term frequency statistics, Jensen-Shannon Divergence program and text examples.
HMM
- 基于统计的分词,采用隐马尔可夫模型,并有实验报告-Based on statistics segmentation using hidden Markov models, and there is experimental report
chengji
- 系统功能 1.学生基本情况录入。 2.允许对已经录入的数据进行显示。 3允许进行数据的插入。 4.删除基本数据的相关信息。 5.基于姓名的查询。如:姓张的所有同学。 6.基于各种基本数据的统计计算。如: ①统计每个学生各门功课的平均成绩,并按平均成绩从高到低的次序排名输出每个学生各门功课的综合成绩和平均成绩(名次、学号、姓名、平均成绩、各门功课的考试成绩)。 ②列出90分以上(包括90)、80分以上(包括80)、70分以上(包括70)、60分以上(包括60)、不及