搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3 functions,cosine,euclidean and
countTexture
- 统计图像子区域的相似度,但图像像素信息要先存到一个文本文件中。
072832
- 本文介绍了在向量空间模型下, 使用一和一两种不同的相似度评测方法, 来评测查询与文本之间的相关性。
simalar
- 基于Python的单词相似度分析,通过分析一些大文本来判断测试文件中给出的单词相似度判断的准确率-Python-based word similarity analysis, by analyzing a number of large text files to determine the test given to determine the accuracy of word similarity
knn
- 文本分类,用KNN方法,通过计算其相似度,找出与它靠近的K个文档。-text classify
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
pLSA_EM
- PLSA EM演算法,用於文本與字詞之間的矩陣工具,測量其相似度-PLSA EM algorithm for the matrix between the text and words tool to measure the similarity
Text-Retrieval
- 信息检索系统从最初的纯手工检索系统业已发展到现在的以信息技术为支撑的检索系统,在这一过程中,适应新的信息资源、信息技术这些检索环境,提高信息检索系统的查全率、查准率和系统响应时间是不变的主题,在众多文本中掌握最有效的信息始终是信息处理的一大目标。围绕向量空间模型设计了一个文本检索系统,介绍向量空间模型的基础上给出了基于它的信息检索系统的一般结构框架和各部分的功能,探讨了系统中所涉及到的关键技术。用向量空间模型进行特征表达,用TF-IDF(Term-Frequency Inverse-Docume
Text-Similarity-0.08.tar
- 计算两段文本之间相似度的java工具,需结合该共享工具的源网络地址查看-the tools to compute the similarity of texts
CBR-filtering-algorithm
- 智能信息推荐系统能够通过用户偏好,利用信息过滤算法主动剔除无关信息。该文提出了一个基于案例推 理的职能信息推荐系统的架构,主要包含数据层、过滤层和结果展示层3个功能层次。设计了一个基于案例推理的 过滤算法,将用户对文本的评价定义为案例 采用归一化的Euclidean距离,计算用户之间的相似度。在一个公共数 据集上进行了不同过滤算法的recall值对比实验。结果表明,采用案例推理技术,对协同过滤的准确度有一定程度 的改善。 -CBR filtering algorithm an
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
cpp
- 文章查重源码 应用了最短编辑距离算法以及相似度算法原理,用两个待比较的文本框输入要比较的的文本文字,然后求解,最后输出两篇文章的相似度的百分比 -The article source application rechecking the shortest edit distance algorithm and the similarity principle, comparing two stay text box input to compare the text of the text,
English-sentence-sim
- 英文文本的相似度计算,分别从词形、词序、词义等进行权重计算,得到相似度结果-English text similarity calculation were re-calculated from the word form, word order, meaning, etc. right, the similarity results
src
- 基于文本内容相似度查询的软件代码,Java开发语言。-Similarity-based software code text queries, Java development language.
qucf
- 根据相似度去文本重复 c++语言 根据文本的相似程度去除重复的-According to the degree of similarity of the text to remove duplicate text according to the similarity to repeat c++ language
EnglishChuLi
- 利用python编写的文本预处理的程序,包含了每一步的实现代码,分为删除标点符号、删除停用词、相似度计算、PCA降维、聚类以及可视化等,运行环境为pytharm,python3开发环境(The text preprocessing program written by Python contains every step of implementation code, which is divided into delete punctuation marks, delete stop word
文本相似度计算方法研究综述.pdf
- Text similarity; semantic similarity; ontology; word bag model; neural network ; thesis review
analyze
- 实现比较文本的差异,和得到两个文本的最大相似度(Implementing the comparison text and getting the maximum similarity)
Python中文文本预处理
- 包括删除标点、分词、删除停用词、计算相似度、文本聚类等功能