搜索资源列表
vsm
- 用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成
vsm
- 向量空间模型生成算法 文本挖掘的关键步骤就是对所给文档生成向量空间模型,然后对进行段落聚类-vsm generation algorithm text mining is a key step to the right documents generated by the vector space model, then right for paragraphs Clustering
支持向量机算法及其代码实现
- 支持向量机(SVM),起初由vapnik提出时,是作为寻求最优(在一定程度上)二分类器的一种技术。後来它又被拓展到回归和聚类应用。SVM是一种基于核函数的方法,它通过某些核函数把特征向量映射到高维空间,然後建立一个线性判别函数(或者说是一个高维空间中的能够区分训练数据的最优超平面,参考异或那个经典例子)。假如SVM没有明确定义核函数,高维空间中任意两点距离就需要定义。
高等数学公式
- 高等数学中所有的算法公式,包括积分,微分,向量空间,级数,微分方程等
java-cluster.zip
- 用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等,Implementation using java language text clustering, including clustering of the data pre-processing before: segmentation, dimensionality reduction, set up, such as Vector Space Model
m10_9
- 一维自组织特征映射网络对输入向量空间进行识别分类-One-dimensional self-organizing feature map network input vector space to identify categories
3DDraw
- 这是一个项目时使用到的“三维空间向量/点”类及相关函数,使用它们可以定义一个空间向量/点,实现向量的平移,缩放和旋转等,使用相关函数还可以实现两向量的叉乘,得到一个向量的绝对长度,将一个向量单位化,得到一个三点决定的平面的垂直向量(经过单位化),得到空间中两点的距离,得到两向量的点积,得到两向量的夹角等操作,为方便用户的使用,每个函数都有详细的注释,希望对大家有所用处. -This is a project to use to the " three-dimensional space
spacevectorgraphics
- 可以实现空间向量的绘图,平移,旋转,缩放等操作-Can achieve space vector graphics, translation, rotation, scaling and other operations
AStatisticalMethodForRobust3DSurfaceReconstruction
- 在三维表面特征识别中,利用向量空间表示法来进行迷失的顶点坐标推断。-We present a technique that uses a vector space representation of shape to infer missing vertex coordinates.
ImageThemeFilter
- 对图像进行分主题过滤。 根据给定的图像样本集,进行样本训练,提取多个颜色空间中的多种方式(颜色矩,纹理谱,直方图,肤色模型等)的得到图像特征集;对待过滤图像进行特征提取,向量匹配,进而实现图像分主题分类功能。-Sub-theme of the image filter. According to a given set of image samples to conduct the training samples to extract more color space in multipl
Vector3D
- 空间向量类,此类可以进行空间物体的研究做一个好的基础。-Space vector class, such a space object can be a good basis for research.
svm_predic.m
- 应用支持向量机回归和相空间重构对时间序列进行预测-Support vector machine regression and time series phase space reconstruction on forecast
Simplex_method
- 单纯形法,求解线性规划问题的通用方法。单纯形是美国数学家G.B.丹齐克于1947年首先提出来的。它的理论根据是:线性规划问题的可行域是 n维向量空间Rn中的多面凸集,其最优值如果存在必在该凸集的某顶点处达到。顶点所对应的可行解称为基本可行解。单纯形法的基本思想是:先找出一个基本可行解,对它进行鉴别,看是否是最优解;若不是,则按照一定法则转换到另一改进的基本可行解,再鉴别;若仍不是,则再转换,按此重复进行。因基本可行解的个数有限,故经有限次转换必能得出问题的最优解。如果问题无最优解也可用此法判别。
w
- 计算机和简单多边形的算法,基于向量空间实现很完美-a intrestinged procesure,you will like it from my thought
4ca3c067bd5e
- VSM.rar - 向量空间模型 c源码实现利用向量空间模型的概念,这个可以用在crawer中。-Vector Space Model c source code to achieve the use of the concept of vector space model, this can be used in in crawer.
danchunxingfa
- 单纯形法,求解线性规划问题的通用方法。单纯形是美国数学家G.B.丹齐克于1947年首先提出来的。它的理论根据是:线性规划问题的可行域是 n维向量空间Rn中的多面凸集,其最优值如果存在必在该凸集的某顶点处达到。顶点所对应的可行解称为基本可行解。单纯形法的基本思想是:先找出一个基本可行解,对它进行鉴别,看是否是最优解;若不是,则按照一定法则转换到另一改进的基本可行解,再鉴别;若仍不是,则再转换,按此重复进行。因基本可行解的个数有限,故经有限次转换必能得出问题的最优解。如果问题无最优解也可用此法判别。
realization-of-the-text
- 本文主要探讨了文本分类系统的实现和关键技术,第一部分为引言,第二部分描述了文本分类解决的问题并对其性能评估方法进行了介绍,第三部分探讨了文本分类系统的关键技术,第四部分给出了我们实现的基于向量空间模型的文本分类系统的结构框架,第五部分是该系统的测试数据和实验结果,第六部分是对将来工作的设想,第七部分是结束语-This paper discusses the realization of the text classification system and key technologies, th
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
VSM
- 向量空间模型的源码,可以用于衡量本文之间的相似度-Vector space model of the source, can be used to measure the similarity between this article
vsm-and-cluster-kmeans
- 对文本聚类的向量空间模型机制VSM以及Kmeans等讲解比较详细,是研究文本聚类的好书籍-Clustering of text vector space model to explain the mechanism of VSM and Kmeans and other more detailed, study of text clustering is a good book