搜索资源列表
clucene_src_for_chinese
- 汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了。1.在vc 6编译 2.还不支持分词,但支持汉字,要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下,见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese characters. 1. In vc 6 2 comp
ICTCLAS(C++)
- 中科院分词,可供直接使用,源于中科院中文分词网-CAS segmentation for direct use, and from the Chinese Academy of the Chinese word segmentation Network
hhgghso
- 网络蜘蛛根据用户设定的入口网址自动收集网页数据 强大完备的后台管理 充分挖掘.net性能,百万数据瞬间搜索 完美的前台web页面媲美专业搜索 中文分词接口 -network users set the entrance web site automatically collect data powerful comprehensive management background fully tap . net performance, and millions of instan
lz_spidetytryryr
- 这个系统是属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。 适合与于对某一指定领域里的网站进行搜索,比如仅搜索医学网站。 使用sql server 2000做数据库。 网络蜘蛛根据用户设定的入口网址自动收集网页数据 强大完备的后台管理 充分挖掘.net性能,百万数据瞬间搜索 完美的前台web页cc面媲美专业搜索 中文分词接口-The system is an automated search
xunlong0.6
- 完整的.net搜索引擎采用LUCENE.net为索引核心,分布式架构.包含wordnet,分词,spider,简单webserver等-complete. Net using search engines for indexing LUCENE.net core, Distributed framework. includes WordNet, participle, spider, a simple webserver, etc.
200090681
- 一种网页分类中使用的中文分词方法,很有借鉴性,大家可以-a website classification of Chinese word segmentation method, a very useful reference, we can s
zwfcxt
- 中文分词系统最完整库,有志向做搜索的朋友可以参考一下,非常有价值的资料-Chinese word segmentation system for the most complete and aspirations so friends can search reference. Very valuable information
ont_language
- 分词算法的基础,事做搜索引擎的关键,好东西啊
FreeICTCLAS
- 中科院ICTCLAS最新free开放源代码,里面有中文分词算法,大家一起共同学习和研究,对搜索引擎中文分词方面有很大用处哦!
xiangliangmoxing
- 实现中文分词的向量模型统计,是实现搜索引擎的一项基本技术
KTDictSeg_v1.2.02
- KTDictSeg 一种简单快速准确的中文分词方法
world_slip
- 分词系统
ThesaurusAnalyzer
- lucene中文分词代码 带有19万字的词典 本分词程序的效果取决与词库.您可以用自己的词库替换程序自带的词库.词库是一个文本文件,名称为word.txt. 每一行一个词语,以#开头表示跳过改行.最后保存为UTF-8的文本.
ChineseSegment
- 基于Hash字库算法的lucene分词 完整的代码,使用创新的Hash字库,是分词效果大大提高
Uindex.Src
- Uindex是一个开放源代码的搜索引擎,网页搜索量定位在千万量级,目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序,FTP搜索提供基于文件名的检索,支持常见的FTP服务器。
fc_src
- 中文分词?形姆执手 形姆执蔶ava版
MMSeg
- 分词算法描述,用于中文分词,供大家参考,互相学习
sharpictclas
- sharpictclas分词系统_1.0,一个用CSHARP编写的分词系统
k50RVZDojs03
- 基于IKAnalyzer分词算法的准商业化Lucene中文分词器
ACWPS_55824
- 中文分词系统,有兴趣的,可以下载,研究下,