搜索资源列表
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3 functions,cosine,euclidean and
tfidf---c
- 用c#写的tf/idf代码,用来进行文本相似度计算的
072832
- 本文介绍了在向量空间模型下, 使用一和一两种不同的相似度评测方法, 来评测查询与文本之间的相关性。
RepeatedForms
- 根据相似度去重,把文本很相似的删除掉,基于VSM的算法的实现。-According to the similarity to heavy, very similar to the text removed, the algorithm based on VSM realize.
CheckText
- 实现文本相似度检查的文本层次聚类算法和划分算法的C#源码-Text to check the text similarity hierarchical clustering algorithm and classification algorithm C# source code
edit
- 文本相似度计算,包含编辑距离,和最长公共子序列算法的结合。-xiangsudu jisuan
knn
- 文本分类,用KNN方法,通过计算其相似度,找出与它靠近的K个文档。-text classify
pLSA_EM
- PLSA EM演算法,用於文本與字詞之間的矩陣工具,測量其相似度-PLSA EM algorithm for the matrix between the text and words tool to measure the similarity
CompareText
- 比对两文本/字符串的相似度,利用LD矩阵算法-Compare two text/string similarity matrix algorithm using LD ..
ImproveStringSimilarity_src
- 通过对两段文本相似度计算,避免出现重复信息。-Compute the similarity between two text.
cpp
- 文章查重源码 应用了最短编辑距离算法以及相似度算法原理,用两个待比较的文本框输入要比较的的文本文字,然后求解,最后输出两篇文章的相似度的百分比 -The article source application rechecking the shortest edit distance algorithm and the similarity principle, comparing two stay text box input to compare the text of the text,
simhash_sourcecode
- 文本文件,网页内容相似度匹配hash算法源代码,用于生成文件指纹,并根据文件指纹生成文件相似度。有windows和linux2个系统的源代码。-the sourcecode is about fies and web pages similarity match algrithm.
Kl
- 计算文本相似度,输出文本间KL距离,JS距离-Calculate the text similarity, the KL distance and JS distancetext of text。
WIP3
- Kaggle竞赛“Can your AI smarter than a 8th grade student?”的代码。 使用文本相似度计算的方法,对美国八年级学生的科学考试卷(4选1选择题)进行自动回答。-Kaggle contest Can your AI smarter than a 8th grade student? Code. The method of using text similarity calculation, the US eighth-grade stude
DocDistance
- java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。-Java text similarity system, using the vector space model and the cosine similarity distance formula, the measured results can be achieved two similarity of text and have some effect.
相似度检测
- 可以计算文本相似度,任何语言!!!!!!!!!!!!!!!(Can calculate text similarity, any language!!!!!!!!!!!!!!!!!)
RKRGST
- 用于字符串文本的匹配算法,融入了kr算法,hash函数映射的方法,缩短了计算时间成本。多用于抄袭相似度比对等领域(The matching algorithm for string texts incorporates the kr algorithm and the hash function mapping method, which reduces the computation time cost.)
mn
- 对文本的情感分析的划分和测试,相似度进行判断(The classification and test of text sentiment analysis, and the judgement of similarity.)
python_s
- 计算两个文本间的相似度,并且返回相速度值,用于确定两个文本将的距离(Compute the similarity between two short txts)