搜索资源列表
pLSA_EM
- PLSA EM演算法,用於文本與字詞之間的矩陣工具,測量其相似度-PLSA EM algorithm for the matrix between the text and words tool to measure the similarity
Text-Similarity-0.08.tar
- 计算两段文本之间相似度的java工具,需结合该共享工具的源网络地址查看-the tools to compute the similarity of texts
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
wordsimilar
- 词汇分类 相似度计算 文本语料分析 归类 知网数据分类-Word text corpus classification Similarity analysis of data classified Text Classification
cpp
- 文章查重源码 应用了最短编辑距离算法以及相似度算法原理,用两个待比较的文本框输入要比较的的文本文字,然后求解,最后输出两篇文章的相似度的百分比 -The article source application rechecking the shortest edit distance algorithm and the similarity principle, comparing two stay text box input to compare the text of the text,
qucf
- 根据相似度去文本重复 c++语言 根据文本的相似程度去除重复的-According to the degree of similarity of the text to remove duplicate text according to the similarity to repeat c++ language
simhash_sourcecode
- 文本文件,网页内容相似度匹配hash算法源代码,用于生成文件指纹,并根据文件指纹生成文件相似度。有windows和linux2个系统的源代码。-the sourcecode is about fies and web pages similarity match algrithm.
StringCom
- 基于B/S架构完成两个字符串的比较,分为文本比较以及字符串比较两种。VS2010下的工程文件,基于WEB页的文本比较源码,不仅能够完成相似度的计算而且可以给出两个文本的对比差异并用不同颜色区分。-a kind of source code for based on B/S arch to compare two strings , give the degree of similarity and show the difference between two strings with diff
image-retrieval
- 最新的几篇图像检索方面的论文。在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:一方面对用户需求的分析和转化,形成可以检索索引数据库的提问;另一方面,收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;最后一方面是根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作为结果,按照相似度降序的方式输出。-The latest image retri several papers. On a retri principle,
RKRGST
- 用于字符串文本的匹配算法,融入了kr算法,hash函数映射的方法,缩短了计算时间成本。多用于抄袭相似度比对等领域(The matching algorithm for string texts incorporates the kr algorithm and the hash function mapping method, which reduces the computation time cost.)
协同过滤算法
- 文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。(Text clustering document clustering is based on the well-known clustering assum
mn
- 对文本的情感分析的划分和测试,相似度进行判断(The classification and test of text sentiment analysis, and the judgement of similarity.)