搜索资源 - 分词程序 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 分词程序

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

Windows编程

Internet/网络编程

系统编程

通讯/手机编程

游戏

多媒体

嵌入式/单片机编程

图形图象

数值算法/人工智能

行业应用软件

数据库系统

其它

搜索资源列表

hisense

0下载：
程序的主要思想是先对数组进行处理，使其有序，处理后的结果存放在t1.txt文件中。。然后在此基础上建立索引，使在查字典时可以减少比较的次数，节省程序的时间。再利用最大匹配算法对程序进行分词，分词的结果保存在t2.txt文件中。然后再拿分好词的文件与libing_test文件进行比较匹配率，匹配结果存放在result.txt文件中。-procedures main idea is first to array processing, it orderly, After processing the
所属分类：图形图象
- 发布日期：2008-10-13
- 文件大小：185594
- 提供者：王磊

SQLET_split

0下载：
SQLET分词算法，一个C程序，供大家参考。-SQLET segmentation algorithm, a C program, for your reference.
所属分类：其它
- 发布日期：2008-10-13
- 文件大小：779251
- 提供者：白乔

clucene_src_for_chinese

0下载：
汉化CLucene今天，把CLucene的程序改了一下，可以支持汉字了。1.在vc 6编译 2.还不支持分词，但支持汉字，要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下，见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese characters. 1. In vc 6 2 comp
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：385552
- 提供者：lucence12

NewWord

0下载：
新词自动登录该程序完成在中文自动分词过程中对词典中没有的词条进行自动的登录功能-new words automatically logged the procedures are completed in the Chinese automatic segmentation of the process not in the dictionary entries for automatic Teng recorded function
所属分类：.net编程
- 发布日期：2008-10-13
- 文件大小：4341550
- 提供者：缪炜

cutword

0下载：
用VB与数据库相连接实现中文分词的程序，采用了正向最大匹配算法。-using VB and database links, Chinese word segmentation procedures using the largest positive matching algorithm.
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：214040
- 提供者：李玉

WordSeg

1下载：
中文分词C++程序,使用前先导入词典Lexicon_full.mdb
所属分类：其它
- 发布日期：2014-01-16
- 文件大小：3480573
- 提供者：顾超武

ThesaurusAnalyzer

0下载：
lucene中文分词代码带有19万字的词典本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：1402816
- 提供者：陈锦

svm_multiClass

0下载：
svm(支持向量机)分类算法本质上是二类分类器，实现多类分类的方法一般是将多类分类看作是多个一对多的二类分类器。本程序就是基于svmlight的svm多类分类器实现。对分类感兴趣的用户请参照。配合中文分词（参见我上传的程序），可实现中文多类分本分类。
所属分类：中文信息处理
- 发布日期：2014-01-18
- 文件大小：566638
- 提供者：maming

Uindex.Src

1下载：
　　 Uindex是一个开放源代码的搜索引擎，网页搜索量定位在千万量级，目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序，FTP搜索提供基于文件名的检索，支持常见的FTP服务器。
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：2766846
- 提供者：weir

CSharpFenCi

0下载：
用CSharp编写的一个分词小程序，可以用来中文分次，比较好用
所属分类：C#编程
- 发布日期：2008-10-13
- 文件大小：2154859
- 提供者：肖宪

soso

0下载：
分词的源码。自己弄的一个小程序源码。大家一块学习。
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：4475
- 提供者：xuhua1125

compiler

0下载：
编译原理--词法分析器，实现读入一端程序，进行分词，并存入符号表中
所属分类：编译器/词法分析
- 发布日期：2008-10-13
- 文件大小：19144
- 提供者：zhaoyan

dartsplitter

2下载：
这是关于中文分词的有关程序，有正在做中文分词的朋友可以拿去参考一下
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：3457813
- 提供者：蔡报忠

splittertest

0下载：
这是有关中文分词的程序、若有需要的话可以参考一下，很有参考价值的哦
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：2666523
- 提供者：蔡报忠

EasyXSpider

2下载：
EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了，索引制作，检索，分词（英文及中文二元法切词），以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。
所属分类：搜索引擎
- 发布日期：2009-06-12
- 文件大小：4149505
- 提供者：shootsoft

segtag.rar

3下载：
基于隐马尔科夫模型的分词标注程序，使用PASCAL语言编写,Hidden Markov Model-based sub-word tagging procedures, using the PASCAL language
所属分类：MultiLanguage
- 发布日期：2017-03-30
- 文件大小：32831
- 提供者：carry

chinese-word-segment.rar

0下载：
一个的文本分割程序，采用了改变的最大长度切分结合统计分词方法。,this is a project about chines-word segment, it propose a method conmbining the max-seg and the statistic method.
所属分类：MultiLanguage
- 发布日期：2017-05-14
- 文件大小：3626609
- 提供者：何鹏

pangusegment-80115

0下载：
PanGuSegment 这个是盘古分词的组件包，包括 PanGu.dll 盘古分词的核心组件 DictManage.exe 字典管理工具 Demo.exe 分词演示程序 PanGu.HighLight.dll 高亮组件 PanGu4Lucene 这个是盘古分词针对Lucene.net 提供的接口 PanGu.Lucene.Analyzer.dll 盘古分词针对Lucene.net 的接口组件 PanGu.Lucene.ImportTool.exe 示例程
所属分类：Other systems
- 发布日期：2017-04-01
- 文件大小：690739
- 提供者：asdjkl

Chinese-Word-Segment-And-POS-Tagger

1下载：
实现了中文分词和词性标注程序。分词方法采用“三词正向最长匹配”。词性标注使用HMM方法，用Viterbi算法实现。“三词正向最长匹配”保持了“正向最长匹配算法”快速的特点，同时提高了分词的准确性。-Chinese word segmentation and implemented procedures for POS tagging. Segmentation Methods, " the longest three-match positive words." POS tag
所属分类：Speech/Voice recognition/combine
- 发布日期：2017-05-14
- 文件大小：4034615
- 提供者：paul

JJCK_Tools

0下载：
拼音加加词库处理工具 Ver1.02 作者：张文焕本软件用以辅助制作拼音加加格式的词库。它共包括“整理”、“注音”、“排序”、“筛选”、“固顶”5个小程序，具体功能参阅各程序相关说明。另外，dfc、jjgx两个文件夹分别是“大分词”、“加加词库更新”工具，未予集成，请单独选用。-Phonetic processing tools Ver1.02 of Gaga Thesaurus: Zhang Wenhuan the software used to assist production
所属分类：IME Develop
- 发布日期：2017-03-22
- 文件大小：502594
- 提供者：尹冰

« 1 2 3 4 5 6 7 89 10 11 12 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.