CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 搜索资源 - 分词系统

搜索资源列表

  1. totsearchc

    0下载:
  2. 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。-Amoy Special Site search engine from the Amoy Te JSP search engine, developed from, sys
  3. 所属分类:Windows Develop

    • 发布日期:2017-04-02
    • 文件大小:373503
    • 提供者:miao
  1. segChnWord

    0下载:
  2. 中文分词评测系统,用于评测中文分词的质量,给出准确率等-Chinese word segmentation evaluation system for evaluating the quality of Chinese word segmentation, given the accuracy of such
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-04-08
    • 文件大小:3452
    • 提供者:miaoer
  1. totsearch

    0下载:
  2. 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。 -Amoy Special Site search engine from the Amoy special JSP search engine developed fr
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-02
    • 文件大小:743011
    • 提供者:豆豆
  1. src

    0下载:
  2. 农业本体原型系统,完全展现了本体的分词推理情况-Agricultural Ontology prototype system, fully demonstrates the word ontology reasoning situation
  3. 所属分类:Java Develop

    • 发布日期:2017-04-08
    • 文件大小:20237
    • 提供者:王强
  1. windows_c_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45 ,API不超过2
  3. 所属分类:Compiler program

    • 发布日期:2017-05-27
    • 文件大小:10333913
    • 提供者:陈蓉
  1. ICTCLASchinesewordsegmentation

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键,中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS主要功能包括中文分词-Chinese lexical analysis is the basis for Chinese information processing and key, Chinese Academy of Sciences Institute of Computing Technology, the accumulation of years of
  3. 所属分类:Compiler program

    • 发布日期:2017-05-24
    • 文件大小:7716510
    • 提供者:
  1. MU_BLOG-src

    0下载:
  2. ASP.NET多用户博客系统源码 基于XML+XSLT+AJAX技术构建的多用户博客门户系统,服务器端采用当前最流行的动态网页开发语言ASP.NET(C#) 2.0编写,支持多种数据库,包括SQLSERVER2000\SQLSERVER2005\ORACLE\MYSQL\DB2\ACCESS等,默认使用SQLSERVER2000。DIV+CSS布局,交互方式采用当前最流行的AJAX技术,所有操所在一个页面完成,简洁的主题与皮肤开发技术,更合理的模块化设计,大大减轻了后续开发的难度,使模板开发
  3. 所属分类:WEB(ASP,PHP,...)

    • 发布日期:2017-05-16
    • 文件大小:4108658
    • 提供者:cannttellyou
  1. ICTCLAS

    0下载:
  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
  3. 所属分类:Other windows programs

    • 发布日期:2017-05-16
    • 文件大小:4450642
    • 提供者:huyunfei
  1. 66

    0下载:
  2. 自动翻译系统 分词技术 做很智能的,不错真的不错-Automatic translation system word segmentation in a very intelligent, good really good
  3. 所属分类:Java Develop

    • 发布日期:2017-05-21
    • 文件大小:6234908
    • 提供者:llw
  1. ICTCLAS50_Windows_32_C

    0下载:
  2. 中科院分析系统 ICTCLAS的主要功能有:中文分词;词性标注;命名实体识别;新闻识别;用户词典-ICTCLAS segementword
  3. 所属分类:Search Engine

    • 发布日期:2017-05-26
    • 文件大小:9088625
    • 提供者:yaling
  1. video

    0下载:
  2. 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
  3. 所属分类:Search Engine

    • 发布日期:2017-06-21
    • 文件大小:39238656
    • 提供者:韩超
  1. Rkeyword-choue

    0下载:
  2. 基于逆向最大匹配算法的分词及基于HMM模型的词性标注系统,包括了未登登录词的识别、数据库的添加等内容。(需要手动修改数据库的路径才可以运行) -Based on the segmentation of the reverse maximum matching algorithm and the HMM-based POS tagging system, including unadvertised login word recognition, and add the database co
  3. 所属分类:Windows Develop

    • 发布日期:2017-05-04
    • 文件大小:1262197
    • 提供者:geli
  1. luceneCode

    0下载:
  2. lucene3.4.0的源代码,一个检索系统的开源包,本人已用myeclipse建立好工程,里面实现了中科院的中文分词接口,简单的建立索引,检索等一个比较完整的中文信息检索系统,便于初学者学习。-the source code of lucene3.4.0 a retrieval system open source package, I have created works myeclipse inside the Chinese Academy of Sciences word interf
  3. 所属分类:Other systems

    • 发布日期:2017-11-10
    • 文件大小:5348953
    • 提供者:刘强
  1. ICTCLAS50_Windows_32_C

    0下载:
  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
  3. 所属分类:Other systems

    • 发布日期:2017-11-11
    • 文件大小:10638336
    • 提供者:徐颖
  1. Stemmer

    0下载:
  2. 在英语中,一个单词常常是另一个单词的“变种”,如:happy=>happiness,这里happy叫做happiness的词干(stem)。在信息检索系统中,我们常常做的一件事,就是在Term规范化过程中,提取词干(stemming),即除去英文单词分词变换形式的结尾。 应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法,也叫波特词干器(Porter Stemmer)。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-11-25
    • 文件大小:3944
    • 提供者:rongzunhe
  1. HLSeg_JAVA_Example

    0下载:
  2. 中文分词 支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。 关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。 海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
  3. 所属分类:Java Develop

    • 发布日期:2017-11-21
    • 文件大小:407072
    • 提供者:李子瑞
  1. Jzu_File_so

    0下载:
  2. 详细介绍 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎,适用于 Windows 平台下的各种网站系统。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,无处不体现着她的强大与魅力。-The detail commander search is one based on the Microsoft NET 2.0 development of vertical s
  3. 所属分类:.net

    • 发布日期:2017-11-20
    • 文件大小:429959
    • 提供者:sfasfwqeqp
  1. windows_JNI_32

    0下载:
  2. 中国科学院计算 所的 ICTCLAS系统分词正确率高达 97. ...印刷体汉字识别软件主要由中科院自动化所等研 制 ,能够支持多种硬件-Institute of Computing ICTCLAS word accuracy rate of up to 97 .... printed Chinese character recognition software, developed by the Chinese Academy of Sciences Institute of Automat
  3. 所属分类:Windows Develop

    • 发布日期:2017-11-28
    • 文件大小:6475994
    • 提供者:reamon
  1. interest-profile-anonymization

    0下载:
  2. 本系统通技术运用主要采用Servlet实现,前台页面使用jsp技术,首先接受所要处理的数据集以及参数设置,对用户的搜索内容进行分词、去除停用词,形成用户的兴趣模型;进行用户兴趣模型匿名化:从用户兴趣模型集中选取模型,计算该模型与所有等价组模型的相似性以及计算该模型与其他所有模型的相似性,根据相似性的大小进行聚合成等价组,然后再计算各自兴趣模型的权值,以达到用户兴趣模型的匿名化以及权值的平衡,然后提交到后台进行匿名化操作,最后返回匿名化结果。-The system through the use
  3. 所属分类:File Formats

    • 发布日期:2017-12-06
    • 文件大小:277899
    • 提供者:Edward
  1. nlu_project

    0下载:
  2. 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写-Using machine learning methods for natural language processing, carried out on the Chinese word segmentation and POS tagging. Segmentation using crf model, tagging with
  3. 所属分类:AI-NN-PR

    • 发布日期:2017-04-09
    • 文件大小:2006356
    • 提供者:lipeng
« 1 2 ... 5 6 7 8 9 1011 12 »
搜珍网 www.dssz.com