CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - 分词程序

搜索资源列表

  1. clucene_src_for_chinese

    0下载:
  2. 汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了。1.在vc 6编译 2.还不支持分词,但支持汉字,要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下,见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese characters. 1. In vc 6 2 comp
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:385552
    • 提供者:lucence12
  1. ThesaurusAnalyzer

    0下载:
  2. lucene中文分词代码 带有19万字的词典 本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:1402816
    • 提供者:陈锦
  1. Uindex.Src

    1下载:
  2.    Uindex是一个开放源代码的搜索引擎,网页搜索量定位在千万量级,目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序,FTP搜索提供基于文件名的检索,支持常见的FTP服务器。
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:2766846
    • 提供者:weir
  1. fenci

    0下载:
  2. 一个简单的分词程序,里面有代码和词库,编译连接后在命令行里运行
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:210502
    • 提供者:张正
  1. soso

    0下载:
  2. 分词的源码。自己弄的一个小程序源码。大家一块学习。
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:4475
    • 提供者:xuhua1125
  1. EasyXSpider

    2下载:
  2. EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了,索引制作,检索,分词(英文及中文二元法切词),以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。
  3. 所属分类:搜索引擎

    • 发布日期:2009-06-12
    • 文件大小:4149505
    • 提供者:shootsoft
  1. 庖丁分词工具

    0下载:
  2. 一个流行的java分词程序。
  3. 所属分类:搜索引擎

    • 发布日期:2010-11-10
    • 文件大小:6109005
    • 提供者:gjf_matt
  1. 本程序可以实现对已有网页的信息提取和分词

    0下载:
  2. 本程序可以实现对已有网页的信息提取和分词,结果会导入叫做res.txt的文件中。本程序是开发搜索引擎的前期工作。-This procedure can be achieved on existing Web information extraction and segmentation, the results into a file called res.txt. This program is the development of the preliminary work the searc
  3. 所属分类:搜索引擎

    • 发布日期:2017-03-23
    • 文件大小:1004275
    • 提供者:风云漂泊
  1. Auto_WordSeg

    0下载:
  2. 自动分词程序演示。包括最大、最小,正向、逆向等分词算法。-Automatic word segmentation procedure demonstrates. Including the largest, smallest, positive, reverse algorithm.
  3. 所属分类:Search Engine

    • 发布日期:2017-05-12
    • 文件大小:2822236
    • 提供者:Li
  1. TDHCursorFactory

    0下载:
  2. 是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术,如文本聚类、分词、索引,搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, indexing, search engines, dicti
  3. 所属分类:Search Engine

    • 发布日期:2017-03-31
    • 文件大小:395241
    • 提供者:wy
  1. CutwordShort

    0下载:
  2. 用于搜索引擎上的切词程序,可以获得比较好的分词结果。运行速度可以达到约500k词/s(笔记本上)-For the search engine on the segmentation procedure can be the result of a better word. Running speed of about 800k words/s (notebook)
  3. 所属分类:Search Engine

    • 发布日期:2017-04-08
    • 文件大小:877736
    • 提供者:梁国欢
  1. fenci

    0下载:
  2. 一个简单的基于词典分词的程序,lucene的分词程序不少,但有时候并不需要复杂的功能,只是需要简单的根据指定的词典分词。代码简单,可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
  3. 所属分类:Search Engine

    • 发布日期:2017-03-25
    • 文件大小:56112
    • 提供者:strayly
  1. luceneCH2

    0下载:
  2. 亲自测试成功的《开发自己的搜索引擎》第二章,以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
  3. 所属分类:Search Engine

    • 发布日期:2017-04-09
    • 文件大小:1278705
    • 提供者:dea
  1. ICTCLAS2010CSharpDemo

    0下载:
  2. 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:93050
    • 提供者:Liuying
  1. fenci

    0下载:
  2. 帮组我们实现中文分词,程序较为粗糙,请见谅,-Help us to achieve Chinese word group, the program is more rough, please forgive me,
  3. 所属分类:Search Engine

    • 发布日期:2017-05-11
    • 文件大小:2598345
    • 提供者:罗成
  1. mySegment

    0下载:
  2. 类库程序,基于词典的简单分词,可分中英文混合的情况-Simple dictionary-based segmentation procedure
  3. 所属分类:Search Engine

    • 发布日期:2017-03-31
    • 文件大小:655921
    • 提供者:shy
  1. splitword

    0下载:
  2. 基于VC++6.0的中文分词程序。内含词典。-VC++6.0 based Chinese word segmentation procedure. Embedded dictionary.
  3. 所属分类:Search Engine

    • 发布日期:2017-05-10
    • 文件大小:2136223
    • 提供者:yang
  1. TokenizerTest2011

    0下载:
  2. C# 分词演示程序 TokenizerTest2011.rar
  3. 所属分类:Search Engine

    • 发布日期:2017-04-10
    • 文件大小:1010
    • 提供者:henry
  1. video

    0下载:
  2. 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
  3. 所属分类:Search Engine

    • 发布日期:2017-06-21
    • 文件大小:39238656
    • 提供者:韩超
  1. TokenTest

    0下载:
  2. 电信行业,此代码是地址搜索程序的一部分,该代码的功能是分词的测试程序。-Telecommunications industry, address search program, the function of this code is written in the sub-word test.
  3. 所属分类:Search Engine

    • 发布日期:2017-11-19
    • 文件大小:568
    • 提供者:xingyun
« 12 »
搜珍网 www.dssz.com