搜索资源 - 分词程序 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

Internet/网络编程

搜索资源 - 分词程序

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

搜索资源列表

clucene_src_for_chinese

0下载：
汉化CLucene今天，把CLucene的程序改了一下，可以支持汉字了。1.在vc 6编译 2.还不支持分词，但支持汉字，要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下，见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese characters. 1. In vc 6 2 comp
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：385552
- 提供者：lucence12

ThesaurusAnalyzer

0下载：
lucene中文分词代码带有19万字的词典本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：1402816
- 提供者：陈锦

Uindex.Src

1下载：
　　 Uindex是一个开放源代码的搜索引擎，网页搜索量定位在千万量级，目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序，FTP搜索提供基于文件名的检索，支持常见的FTP服务器。
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：2766846
- 提供者：weir

fenci

0下载：
一个简单的分词程序，里面有代码和词库，编译连接后在命令行里运行
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：210502
- 提供者：张正

soso

0下载：
分词的源码。自己弄的一个小程序源码。大家一块学习。
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：4475
- 提供者：xuhua1125

EasyXSpider

2下载：
EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了，索引制作，检索，分词（英文及中文二元法切词），以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。
所属分类：搜索引擎
- 发布日期：2009-06-12
- 文件大小：4149505
- 提供者：shootsoft

庖丁分词工具

0下载：
一个流行的java分词程序。
所属分类：搜索引擎
- 发布日期：2010-11-10
- 文件大小：6109005
- 提供者：gjf_matt

本程序可以实现对已有网页的信息提取和分词

0下载：
本程序可以实现对已有网页的信息提取和分词，结果会导入叫做res.txt的文件中。本程序是开发搜索引擎的前期工作。-This procedure can be achieved on existing Web information extraction and segmentation, the results into a file called res.txt. This program is the development of the preliminary work the searc
所属分类：搜索引擎
- 发布日期：2017-03-23
- 文件大小：1004275
- 提供者：风云漂泊

File_Search

1下载：
中英文分词程序，在文本检索中要使用到得一个小程序哦-In English and Chinese word segmentation procedure, text retrieval, we should use to get a small program oh
所属分类：WinSock-NDIS
- 发布日期：2017-03-28
- 文件大小：207278
- 提供者：shawn

Auto_WordSeg

0下载：
自动分词程序演示。包括最大、最小，正向、逆向等分词算法。-Automatic word segmentation procedure demonstrates. Including the largest, smallest, positive, reverse algorithm.
所属分类：Search Engine
- 发布日期：2017-05-12
- 文件大小：2822236
- 提供者：Li

TDHCursorFactory

0下载：
是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术，如文本聚类、分词、索引，搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, indexing, search engines, dicti
所属分类：Search Engine
- 发布日期：2017-03-31
- 文件大小：395241
- 提供者：wy

CutwordShort

0下载：
用于搜索引擎上的切词程序，可以获得比较好的分词结果。运行速度可以达到约500k词/s（笔记本上)-For the search engine on the segmentation procedure can be the result of a better word. Running speed of about 800k words/s (notebook)
所属分类：Search Engine
- 发布日期：2017-04-08
- 文件大小：877736
- 提供者：梁国欢

KWICcase

0下载：
实现关键词检索的一个程序，中文分词，自动检索-To achieve keyword search of a program, Chinese word segmentation, automatic search
所属分类：WinSock-NDIS
- 发布日期：2017-03-30
- 文件大小：4928
- 提供者：shawn

fenci

0下载：
一个简单的基于词典分词的程序，lucene的分词程序不少，但有时候并不需要复杂的功能，只是需要简单的根据指定的词典分词。代码简单，可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
所属分类：Search Engine
- 发布日期：2017-03-25
- 文件大小：56112
- 提供者：strayly

luceneCH2

0下载：
亲自测试成功的《开发自己的搜索引擎》第二章，以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
所属分类：Search Engine
- 发布日期：2017-04-09
- 文件大小：1278705
- 提供者：dea

ICTCLAS2010CSharpDemo

0下载：
中文分词源程序，　中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上，研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)，主要功能包括中文分词；词性标注；命名实体识别；新词识别；同时支持用户词典。我们先后精心打造五年，内核升级6次，目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s，分词精度98.45
所属分类：Search Engine
- 发布日期：2017-03-30
- 文件大小：93050
- 提供者：Liuying

fenci

0下载：
帮组我们实现中文分词，程序较为粗糙，请见谅，-Help us to achieve Chinese word group, the program is more rough, please forgive me,
所属分类：Search Engine
- 发布日期：2017-05-11
- 文件大小：2598345
- 提供者：罗成

mySegment

0下载：
类库程序，基于词典的简单分词，可分中英文混合的情况-Simple dictionary-based segmentation procedure
所属分类：Search Engine
- 发布日期：2017-03-31
- 文件大小：655921
- 提供者：shy

splitword

0下载：
基于VC++6.0的中文分词程序。内含词典。-VC++6.0 based Chinese word segmentation procedure. Embedded dictionary.
所属分类：Search Engine
- 发布日期：2017-05-10
- 文件大小：2136223
- 提供者：yang

TokenizerTest2011

0下载：
C# 分词演示程序 TokenizerTest2011.rar
所属分类：Search Engine
- 发布日期：2017-04-10
- 文件大小：1010
- 提供者：henry

« 12 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.