搜索资源列表
Relateword
- 珍藏论文:词语语义相似度的计算是一篇关于中文文字处理的论文
duote
- 基于多特征融合的句子相似度计算是一篇讲解中文相似度的论文
similarity
- 这是一个识别两句话之间的相似度的程序,输入是两句中文文字,输出是得分(满分100)
相似度计算
- 中文相似度计算
41695031sim
- 余选公式比较相似度,主要处理的是英文,但是自己改动下可以处理中文-Comparison of similarity more than the election formula, mainly dealing with the English, but their changes can be dealt with under the Chinese
File22
- 基于关键词的Web文档自动分类算法研究,文档关键词,语义相似度,聚类算法,知网,拓扑网络图,中文分词-Keyword-based Web Document Classification Algorithm, document keywords, semantic similarity, clustering algorithm, HowNet, topological network diagrams, Chinese word segmentation
IDFCal
- tf-idf程序,朋友写的,很好。对中文句子进行相似度计算,有计算句子权值、排序、两两句子之间的相似度计算。有语料,可以直接运行-tf-idf program, friends wrote, very good. Similarity calculation for Chinese sentences, the sentence weights are calculated, sort, twenty-two similarity between sub-calculation. A corpu
MiniHowNet
- 语义网方面中文相似度计算的一个实例hownet计算-Aspects of Chinese Semantic Web instance hownet similarity calculation calculation
WordSimilarity
- 辞典文件放置在dict目录下,由"中文自然语言处理开放平台提供。算法参数使用《基于<知网>的词汇语义相似度计算》的实验参数,具体定义在类WordSimilarity中,为私有静态常量,可根据需要自行修改。-Dictionary files are placed in the dict directory, by the " Chinese natural language processing to provide an open platform for the algorithm p
WordSimilarity
- 基于HowNet对中文单词进行相似度计算,实现的是《基于<知网>的词汇语义相似度计算》论文中的算法。-Based on HowNet for Chinese words for similarity computation, to achieve the " based on < Text> vocabulary semantic similarity calculation," the paper' s algorithm.
Text-Retrieval
- 信息检索系统从最初的纯手工检索系统业已发展到现在的以信息技术为支撑的检索系统,在这一过程中,适应新的信息资源、信息技术这些检索环境,提高信息检索系统的查全率、查准率和系统响应时间是不变的主题,在众多文本中掌握最有效的信息始终是信息处理的一大目标。围绕向量空间模型设计了一个文本检索系统,介绍向量空间模型的基础上给出了基于它的信息检索系统的一般结构框架和各部分的功能,探讨了系统中所涉及到的关键技术。用向量空间模型进行特征表达,用TF-IDF(Term-Frequency Inverse-Docume
iamxiatian-xsimilarity-9da04e9
- 利用hownet和其他多种方法的中文词汇相似度计算集成包,参见夏天的书-The Chinese word similarity the use of hownet and other variety of methods to calculate the integrated package, refer to the summer book
The-LCS-algorithm
- LCS算法实现简单中文文本相似度分析-最大公共子串-The LCS algorithm to implement a simple text similarity analysis- the largest public substring
src
- 中文文档相似度比较,使用的是c#语言写的-Chinese document similarity comparison using c# language written
SimilarityTest
- 利用两种动态链接库计算英文词汇之间、中文词汇之间的相似度,并将结果保存到csv文件中-Calculated using two dynamic link library between English words, the similarity between the Chinese vocabulary and save the results to a csv file
WordSimilarity
- 基于知网的中文词汇相似度计算方法的工具,共享给大家,谢谢。-Word similarity calculation
HowNet
- 利用“知网”进行中文自然语言处理,计算词语之间的相似度。-Use "HowNet" for Chinese natural language processing, compute the similarity between the words.
wenbenleiju
- 基于文本相似度计算的文本聚类算法研究与实现,这是中文信息处理的重要分支。-The text clustering algorithm based on text similarity computing research and implementation, this is an important branch of Chinese information processing.
Chinese
- 是做文本预处理时候利用爬虫收集的500个中文文档,包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and the final similarity calculatio
Python中文文本预处理
- 包括删除标点、分词、删除停用词、计算相似度、文本聚类等功能