CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 WEB源码 JSP源码/Java 搜索资源 - data segmentation



  2. 用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等,Implementation using java language text clustering, including clustering of the data pre-processing before: segmentation, dimensionality reduction, set up, such as Vector Space Model
  3. 所属分类:Java Develop

    • 发布日期:2017-03-23
    • 文件大小:17173
    • 提供者:优优
  1. JavaWebGIS

  2. 目前空间数据的传输效率低下已成为制约WebGIS发展的主要瓶颈之一。多线程技术以及多点连接在提高系统吞吐率、有效利用系统资源、改善用户任务之间的通信效率等方面有着显著作用。本文采用地图分层和图面分割的方法以及Java多线程和多点连接技术实现了WebGIS空间数据的高效传输。-Transmission of the current inefficient spatial data has become a major bottleneck restricting the development o
  3. 所属分类:Java Develop

    • 发布日期:2017-04-16
    • 文件大小:121358
    • 提供者:王君
  1. ictclas4j

  2. 本代码用java实现了分词功能,包括分词和词性标注,里面有具体的说明文档,包括数据结构的设计,分词步骤,分词系统研究等。-The code is implemented using java segmentation features, including word segmentation and POS tagging, which have specific documentation, including data structure design, word steps, such a
  3. 所属分类:Java Develop

    • 发布日期:2017-05-22
    • 文件大小:6775135
    • 提供者:胡胜先
  1. IR

  2. 索引词的选择 1、 切词及词频统计:利用已选择的分词软件对文档进行切词处理,并进行词频统计,形成DocIndex文件,结构为:文档号、频率、词。注意保留中间结果,建立合理的数据结构来存储。 2、 分配词权重: 采用词频标准化(tfi = tfi/Max(tf))和tf*idf两种方式分配词的权重。由DocIndex文件生成DocIndex(tf) 和DocIndex(tf*idf)文件。注意阈值的确定,词的取舍。 3、 形成倒置文档:将DocIndex(tf) 和DocInde
  3. 所属分类:JavaScript

    • 发布日期:2017-11-17
    • 文件大小:3813177
    • 提供者:
  1. ansj_seg-master

  2. 这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化 内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字 准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
  3. 所属分类:Java Develop

    • 发布日期:2017-10-30
    • 文件大小:16801760
    • 提供者:王海
  1. ICTCLAS_Demo

  2. 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system input SMS, then use a Bayesian al
  3. 所属分类:Java Develop

    • 发布日期:2017-12-03
    • 文件大小:3007046
    • 提供者:罗翊濠
  1. Fenci

  2. python数据的解析与分词分析 并根据词频进行排序-python data analysis and segmentation based on word frequency analysis and sorting
  3. 所属分类:JavaScript

    • 发布日期:2017-05-12
    • 文件大小:2734054
    • 提供者:huweifeng
  1. Project

  2. 对从Openhub上获取的项目代码行数据进行切词分析,获取项目代码行时序数据-Lines of code to the project data were obtained the Openhub segmentation analysis, time series data to obtain the item line of code
  3. 所属分类:Java Develop

    • 发布日期:2017-04-13
    • 文件大小:2232
    • 提供者:huangpudn
  1. ClipBoardTool

  2. java clipBoard 工具,在粘贴板中对数据进行处理,例如拷贝多个都好分割的电话号码,根据选项,每个电话号码增加单引号-java clipBoard tool, clipboard data processing, for example, multiple copies are good segmentation phone numbers, depending on the options, each telephone number to increase single quote
  3. 所属分类:Java Develop

    • 发布日期:2017-04-13
    • 文件大小:1782
    • 提供者:lirong
  1. K-Means

  2. 本人上传的源代码用于实现数据挖掘领域中中的分内算法,K-means算法,算法的分割结果比较准确,是你的绝佳选择-I upload source code for implementing data mining in the field since the beginning of the algorithm, the segmentation result K-means algorithm, the algorithm is more accurate, you are a great ch
  3. 所属分类:Applet

    • 发布日期:2017-05-04
    • 文件大小:15790
    • 提供者:张熙繁
  1. lucene-unit

  2. 可以反射自定义索引类型,自定义索引路径-默认类路为上两级下的indexWrite目录,中文分词,自定义搜索Query,分页搜索并缓存一部分数据-Can reflect the custom index type, the index of the custom path- the default class on the road to indexWrite directory, under the two levels of Chinese word segmentation, custom
  3. 所属分类:Jsp/Servlet

    • 发布日期:2017-12-11
    • 文件大小:1205377
    • 提供者:伽蓝古风