搜索资源列表
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
mmseg
- MMSEG 中文分词算法 内有说明及例子,源代码-failed to translate
VSM
- 向量空间模型算法,给定一个经过分词的文档集,可以输出向量空间模型、特征词典、倒排索引表等功能,很经典的VSM算法源代码-Vector space model algorithm, given a segmentation of the document set, you can output vector space model, the characteristics of dictionaries, inverted index table functions, it is the clas
StandardTokenizer
- 分词算法的测试 基于lucene 的分词算法设计-segment the chinese word
phpanalysis
- 以前写的一个php无组件分词算法,这类算法比较少见,可用于SEO,搜索前端分词等用途-I used to write a php no component segmentation algorithm, such algorithms are relatively rare, can be used for SEO, search front-end applications such as word segmentation
c++ 小知识
- c++的一本好书.里面有算法.he xiaojiqiao -c of a good book. Inside algorithm. He xiaojiqiao
fenci
- 用C写的简单的分词算法,请查看具体代码.-Using C to write the simple segmentation algorithm, please see the specific code.
heritrix-1.14.3-src
- 高性能分词算法,采用java实现,能自动进行最小分词,用户可以筛选分词类别-Word segmentation algorithm for high-performance, the realization of the use of java, can automatically carry out the smallest sub-word, the user can filter category segmentation
fen
- 基于后缀数组无词典分词算法,利用散列表获得汉字结合模式,通过置信度进行赛选。-Suffix array-based non-dictionary word segmentation algorithm, the use of hash table model was combined with Chinese characters, through the confidence to carry out the election race.
rmmseg-cpp-0.2.7
- 一种分词算法的源码,需要在linux下命令执行-Of a word segmentation algorithm source code, under the command needs to linux
Segmenter
- 正向匹配正向最大分词算法,仅仅是个很初级的算法-Being the largest positive word matching algorithms
totsearchc
- 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。-Amoy Special Site search engine from the Amoy Te JSP search engine, developed from, sys
totsearch
- 淘特站内搜索引擎是由淘特JSP搜索引擎发展而来,系统基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案。 -Amoy Special Site search engine from the Amoy special JSP search engine developed fr
maxfenci
- 基于词典的最大正向/反向分词,C++的,最简单的学习分词算法的代码-Dictionary-based maximum forward/reverse word, C++, the most simple method of learning the code word
Solution1
- 利用lucen.net和盘古分词算法,在使用时利用索引将定点spider定制的网页,然后搜寻相应的点放到服务器索引库-use lucen.net technology and pagu
fenci
- 用C++写的一个分词算法,有需要的可以下来-Written in C++, a segmentation algorithm, we need to look down
baidu
- 百度(baidu)分词算法分析 有关百度搜索的数据分析-baidu
php_programming_smallest_compound_word_segmentatio
- php编程最小切分的复合分词算法代码php programming smallest compound word segmentation algorithm code-php programming smallest compound word segmentation algorithm code
24190808280
- KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法-KTDictSeg KaiToo search by the development of a simple dictionary-based word segmentation algorithm for Chinese and English
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word