搜索资源列表
TFIDF
- 用c#写的计算文本向量的TFIDF算法源码,同时包括用cosine距离计算文本相似度的算法源码-Calculation using c# to write the text of the TFIDF vector algorithm source code, while including the use of cosine similarity distance calculation algorithm for source text
k-means_Program
- k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 -k-means algorithm to accept input k then n-k of data objects into a cluster in order to make the cluster available to meet: t
DesktopApplication_yichao
- java 图形界面实现ld算法 比较文本相似度-ld algorithm
Measuring-the-SemanticSimilarity
- 本文提出了一个以知识为本 文本的语义相似性测量方法。虽然是一个大 以前的工作机构,专注于寻找概念的语义相似度 也就是说,这些字为导向的方法应用到文本相似不 尚未探讨。在本文中,我们介绍一种方法,组合成一个文本到文本度量字,字的相似性度量,我们表明,这种方法 优于传统的文本相似度 基于词法匹配的指标。-Thispaper presents a knowledge-based method for measuring the semantic-similarity oft
ImproveStringSimilarity_src
- 通过对两段文本相似度计算,避免出现重复信息。-Compute the similarity between two text.
CMDiff
- C#实现的Diff工具,能够比较两个文本文件的差异,并计算文本相似度。-A diff tool implemented in C#,which can get differences between two text files, and
ComputerDecision
- 计算文本的余弦相似度,进行文本分类 。两文本相似度越接近1,越有可能被分为1类-Calculated text cosine similarity for text classification
wenbenxiangsidujisuan
- 文本相似度计算工具代码,这是在做搜索引擎非常需要的一个算法,对于想从事开发这方面的应用,具有不错的参考价值。-Text similarity calculation tool code, which is doing a great need for an algorithm of the search engine, and want to engage in the development of this aspect of the application, has a good refer
The-LCS-algorithm
- LCS算法实现简单中文文本相似度分析-最大公共子串-The LCS algorithm to implement a simple text similarity analysis- the largest public substring
similarity
- 文本相似度计算余弦相似度代码,计算文本相似度,用于搜索引擎-Cosine similarity of text similarity computation code, the text of the similarity calculation for the search engine
wenbenleiju
- 基于文本相似度计算的文本聚类算法研究与实现,这是中文信息处理的重要分支。-The text clustering algorithm based on text similarity computing research and implementation, this is an important branch of Chinese information processing.
xsimilarity-master
- 一些文本相似度的方法总结,仅供大家参考 希望对大家有帮助-Some similarity Methods
TextSimilarity
- 文本相似度计算程序,有图形界面,基于向量-text similarity
Kl
- 计算文本相似度,输出文本间KL距离,JS距离-Calculate the text similarity, the KL distance and JS distancetext of text。
CosineSimilarAlgorithmzf
- 这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。-Here will use the TF/IDF weight, with cosine angle calculation of text similarity, with the variance of the two data between the data of the European distance, with K-means data cluste
WIP3
- Kaggle竞赛“Can your AI smarter than a 8th grade student?”的代码。 使用文本相似度计算的方法,对美国八年级学生的科学考试卷(4选1选择题)进行自动回答。-Kaggle contest Can your AI smarter than a 8th grade student? Code. The method of using text similarity calculation, the US eighth-grade stude
DocDistance
- java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。-Java text similarity system, using the vector space model and the cosine similarity distance formula, the measured results can be achieved two similarity of text and have some effect.
xsd
- 易语言快速计算文本相似度源码例程程序演示了文本相似度的对比计算方法。 -Easy language to quickly calculate the similarity of the text source routine procedures to demonstrate the text similarity calculation method.
English
- 包括了原始英文文档、删除特殊符号、分词、词干化、计算相似度等文本预处理后产生的文档,总的数量是500个英文文档(Including the original English document, delete special symbols, such as text segmentation, a preprocessed documents produced, the total number of 500 English document)
Chinese
- 是做文本预处理时候利用爬虫收集的500个中文文档,包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and the final similarity calculatio