搜索资源 - 分词 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 分词

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

IKTEST3.2

0下载：
调用开源接口IKSegmentation、Lexeme实现的，分词功能。-Call open source interface, word.
所属分类：AI-NN-PR
- 发布日期：2017-11-09
- 文件大小：2336126
- 提供者：maidlun

ansj_seg-master

0下载：
这是一个ictclas的java实现.基本上重写了所有的数据结构和算法.词典是用的开源版的ictclas所提供的.并且进行了部分的人工优化内存中中文分词每秒钟大约100万字(速度上已经超越ictclas) 文件读取分词每秒钟大约30万字准确率能达到96 以上-This is a ictclas of java. Basically rewrite all the data structures and algorithms. Dictionary is prov
所属分类：Java Develop
- 发布日期：2017-10-30
- 文件大小：16801760
- 提供者：王海

shootseg-4235

0下载：
基于统计的分词算法以/为分隔符分词 C# -Statistics-based segmentation algorithm/word delimiter
所属分类：CSharp
- 发布日期：2017-11-30
- 文件大小：1014530
- 提供者：source

Activity_05(2)

0下载：
垃圾短信过滤软件源代码，将未知短信分词和词库中进行对比是否是垃圾短信-SMS spam filtering software source code
所属分类：SMS
- 发布日期：2017-11-17
- 文件大小：13021636
- 提供者：candice

csw

0下载：
一款多功能分词组件，可用于VC，vc#等开发环境-A versatile word components, VC, vc# development environment can be used to
所属分类：ActiveX-DCOM-ATL
- 发布日期：2016-01-26
- 文件大小：3781632
- 提供者：wht

Stemmer

0下载：
在英语中，一个单词常常是另一个单词的“变种”，如：happy=>happiness，这里happy叫做happiness的词干（stem）。在信息检索系统中，我们常常做的一件事，就是在Term规范化过程中，提取词干（stemming），即除去英文单词分词变换形式的结尾。应用最为广泛的、中等复杂程度的、基于后缀剥离的词干提取算法是波特词干算法，也叫波特词干器（Porter Stemmer）。详见官方网站。比较热门的检索系统包括Lucene、Whoosh等中的词干过滤器就是采用的波
所属分类：AI-NN-PR
- 发布日期：2017-11-25
- 文件大小：3944
- 提供者：rongzunhe

splitewords

0下载：
在对话框中，调用第三方分词工具（ICTCLAS中文分词免费版），实现对中文的分词示例程序，可以对想实现全文搜索算法的中文分词问题提供解决方案。-In the dialog box, call the third-party segmentation tools (word ICTCLAS Chinese free version), the sample program to achieve the segmentation of Chinese text search algorithms C
所属分类：File Operate
- 发布日期：2017-11-28
- 文件大小：4402678
- 提供者：李明宇

WordSequence

0下载：
正向最大匹配法实现中文分词，并计算其正确率（P）、召回率（R）和F测度-Positive maximum matching method to realize the Chinese word segmentation
所属分类：JavaScript
- 发布日期：2017-11-28
- 文件大小：852
- 提供者：董磊

ansj

0下载：
ictclass的java版本开源实现，用于实现中文分词功能。-the java version that the open source implementation of ictclass
所属分类：Search Engine
- 发布日期：2017-10-31
- 文件大小：11143886
- 提供者：Aeolus

mmsegger_src_1.0

0下载：
最大正向匹配分词算法，用于分词和自然语言处理-Maximum forward matching word segmentation algorithm
所属分类：Java Develop
- 发布日期：2017-11-13
- 文件大小：341274
- 提供者：subgke

CTB

0下载：
中文分词和词性分析通用的训练集，含POS。-Chinese word segmentation and part of speech analysis of generic training set.
所属分类：MultiLanguage
- 发布日期：2017-11-05
- 文件大小：79735
- 提供者：liliudan

segok

0下载：
自然语言处理中的分词程序，绝对可用，自己写的。-Segmentation in natural language processing program to write their own.
所属分类：.net
- 发布日期：2017-11-30
- 文件大小：5888640
- 提供者：jiang

HMM

0下载：
HMM的初步学习资料。HMM对于自然语言的研究尤其是中文分词有非常重要的意义。-HMM preliminary learning materials. HMM is the Chinese word for the study of natural language has a very important significance.
所属分类：Project Manage
- 发布日期：2017-11-16
- 文件大小：7143605
- 提供者：liliudan

ansj_seg20121123

0下载：
java分词实现，可以自己定义词库-java fenci，upload user library
所属分类：Java Develop
- 发布日期：2017-11-22
- 文件大小：4876660
- 提供者：俩轮

WordStem_20121024

0下载：
采用Porter Stemming算法对英文文本进行分词-Preprocessing English text based on Porter Stemming algorithm
所属分类：MultiLanguage
- 发布日期：2017-11-19
- 文件大小：14987
- 提供者：RekingQin

ChineseStemming

0下载：
采用中科院ICTCLAS分词系统对中文文本进行分词-Preprocessing Chinese text based on ICTCLAS
所属分类：MultiLanguage
- 发布日期：2017-11-12
- 文件大小：3004381
- 提供者：RekingQin

ikTest

0下载：
该程序主要功能：使用ik分词器对文本进行分词-segmention with ik Analyzer
所属分类：Applet
- 发布日期：2017-11-21
- 文件大小：3701140
- 提供者：liangyanmin

HLSeg_JAVA_Example

0下载：
中文分词支持对输出颗粒的控制，可以输出普通颗粒与用于检索的小颗粒；同时输出词串所在句号、段号、词号、词性等信息。关于分词输出颗粒，我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域,
所属分类：Java Develop
- 发布日期：2017-11-21
- 文件大小：407072
- 提供者：李子瑞

Segment

0下载：
中文分词程序，用前缀发分词，并输出到文本中来-Chinese word segmentation program, sent word with the prefix, and output to a text
所属分类：Console
- 发布日期：2017-11-23
- 文件大小：1328715
- 提供者：杨梦伦

ICTCLAS-V3.0

0下载：
本程序是是汉语文本的分词系统，进行了改进，是最新的版本，准确率达到99 以上。-This procedure is the Chinese text segmentation system has been improved, is the latest version, the accuracy rate of more than 99 .
所属分类：Internet-Socket-Network
- 发布日期：2017-11-20
- 文件大小：51390464
- 提供者：baiyang

« 1 2 ... 44 45 46 47 48 4950 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.