搜索资源列表
P
- 随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来 源。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具。近年来针 对文本数据的文本挖掘已逐渐成为人们研究的新课题。其中,对于文本聚类的研 究己经引起了广泛的重视,并取得了良好的成果。 本文首先对数据挖掘流程以及数据挖掘分类和各自的研究现状及发展进行了 概括的介绍;然后结合汉语自身的相关特点详细的分析了中文文本自动聚类中所 涉及到的关键问题及其技术;接着介绍了人工神经网络技术的发展的现状和特点
master_thesis
- 音乐领域中文实体关系抽取研究 实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义 好的语义关系。本文将实体关系抽取定义为一个分类问题,主要研究内容是 中文音乐领域的实体关系抽取。针对这一问题,本文首先构建了中文音乐实 体关系语料库,然后分别采用了基于序列模式挖掘的无指导的方法和基于特 征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Engineering urgently needed to de
paper3
- 一种基于节点密度分割和标签传播的Web页面挖掘方法-A mining based on node density segmentation and labeling dissemination of Web pages
jitizhihuibaincheng
- 集体智慧编程中文版,本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和 资源。本书包含协作过滤技术,集群数据分析,搜索引擎核心技术,贝叶斯过滤技术等。-Collective intelligence programming Chinese edition, the book in machine learning and statistics are calculated as the theme, specifically on how to mine and anal
网页相似度计算
- 基于最长公共序列计算网页相似度,计算网页相似度用于网页数据挖掘等(Computing web similarity based on the longest common sequence)