搜索资源列表
maxent-20041229[1].win32
- 文本分析中基于统计的方法中,最为常用的最大熵算法,该源码为Python版,广泛应用于词性标注,词义消岐等领域-text analysis based on statistical methods, the most commonly used of maximum entropy algorithm, the source code for Python version, widely used in tagging, Meaning Consumers divergent fields
HMM_code
- 经典的HMM算法的代码!以在文本中的应用为例,给出HMM的源码。使用C语言。-classic HMM algorithm code! In the text to the application as an example, HMM source. The use of C language.
zryy1
- 字字之间的转移概率算法,需要一个大文本来统计。-multiplicity of transfer probability algorithm, the text needs to a large statistics.
tf-idf(chinese)
- ti-idf算法,实现对中文文档的检索,把多篇文档中的词,按照权值从小到大进行排列(词语以文本中的词库为准)
word_vc
- vc++实现的基于字典的中文分词算法,基于贝耶斯网络的概率中文分词算法,以及文本相似程度比较的算法。
libsvm-2.82
- svm(支持向量机)是著名的文本分类算法。libsvm是其中的一种实现的最新版本,完全开源。linux环境。
TextClassify
- 文本分类算法,含有三个分类算法,朴素贝叶斯,KNN,VSM
textcategoraization
- svm算法的中文文本分类 找的很辛苦啊
bogofilter-0.93.4.tar
- 开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词
lindatanetwork1.rar
- 主要是数据挖掘中的文本挖掘算法及其分析,其中包括层次聚类,空间向量模型等,处理对象有对于网页的也有针对纯文本的。,Mainly in data mining and analysis of text mining algorithms, including hierarchical clustering, vector space model to deal with subjects of the pages are for plain text.
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
FileProgress1
- 文本结构化技术的初步实现及其中文信息处理的算法, 主要以论述为主!-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!
FileProgress2
- 文本结构化技术的初步实现及其中文信息处理的算法, 主要以论述为主!-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!
segthewords
- 它是文本分词程序代码的核心算法,可以为语言学者提供强大的分词功能。-Is a code word the text of the core algorithm
webcat
- 这是一个100 %纯Java库,您可以使用适用于N元 分析技术的过程分为文本文件。 该计划包括几个不同的分类算法, namelly 支持向量机,贝叶斯Logistic回归,神经网络分类和文本压缩 算法。如支持向量机和贝叶斯Logistic回归,一个 “一对一” 用于多类分类。更详细的说明这些学习算法和可用的选项,请提供的javadocs 。-It is a 100 pure Java library that you can use to apply N-Gr
EasySeg
- 实现中文分词的最大正向匹配算法,提前输入好文本。-Achieve maximum positive Chinese word matching algorithms, a good text input in advance
backforwardSegmentationjava
- 后向分词算法对中文文本进行简单分词,有Swing界面,适合初学者.-Backforward propergation chinese segmentation. with the visible interface by Swing. It s useful for the new guy.
WordStem_20121024
- 采用Porter Stemming算法对英文文本进行分词-Preprocessing English text based on Porter Stemming algorithm
LuckyDraw
- 持文字抽奖、图片抽奖,灵活易用、界面美观、功能完备。 适用场合:适用于年会抽奖、晚会抽奖等场合。 抽奖模式:支持文字抽奖模式(如名字、手机号等)、图片抽奖模式(照片抽奖)。 界面美观:自定义背景图、字体、边距等,智能的字体选择、多列显示算法。 按键方便:按回车开始滚动,按空格停止滚动,按Tab播放颁奖音乐。 名单导入:导入文本文件,或导入图片文件夹,最多可导入高达2万条。 抽奖结果:自动保存抽奖结果(不惧死机断电),支持缺席等的作废处理。 重复中奖:采用禁止重复中奖算法,自动滤除已