搜索资源列表
fenci_ICTCLAS
- 基于中科院计算所的ICTCLAS系统开发的分词工具,只有一个类,上手最快,功能强大
SegExample
- 对一个文件可以分词的系统,挺有用的哦-right can be a Word document system, quite the oh
FreeICTCLAS
- 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
网趣网上购物系统时尚版 V9.0
- 网趣网上购物系统的部分特点与精华: 一、支持商品批量增加、批量修改功能,所有商品可一次修改完成,特别方便! 二、支持7种在线支付:北京网银、NPS、快钱、贝宝、云网、支付宝、财付通接口。 三、率先支持Excel批量导入商品功能,下载Excel模板批量添加商品一次完成! 四、删除商品的同时,可以自动删除商品图片,大大节约空间! 五、率先支持商品图片水印设置,彰显网站的独特风格! 六、支持商品三级分类设置,分类划分更明细:大类->小类->子类-
网页搜索引擎
- K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。 网络蜘蛛 K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描; 自动识别GB2312、BIG5、UTF-8、Unic
nicewords4.5中文版
- Nicewords是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)和分词技术,结合白帽SEO,利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。 NiceWords最主要是解决了自动建站的问题。以前的自动建站软件内容都还是需要自己发,有了NiceWord
仿百度搜索引擎NET 2.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。
ICTCLAS50_Windows_64_C
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB/s,分词精度98.45 ,API不超过100kb,各种词典
ChineseSplit
- 一个基于VB.NET开发的中文分词及关键词提取系统,采用双向最大匹配、词频统计、快速排序等算法实现。-VB.NET developed based on Chinese word segmentation and Key Extraction System, the largest two-way matching, word frequency statistics, such as quick sort algorithm.
PatTermExtraction
- 使用无监督的机器学习方法进行术语抽取的系统,具有预处理、分词、抽取术语等功能。-Unsupervised machine learning methods for term extraction system with preprocessing, segmentation, extracted terms, and so on.
Free-Software
- 计算所汉语词法分析系统之免费版本ICTCLAS.非收费之源代码。 分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。--Calculate the Chinese Lexical Analysis System ICTCLAS. Segmentation correc
SearchEngine
- 搜索引擎模块是一个很主要且常见的功能。一个好的搜索引擎能给用户使用带来方便。在“站内”选项卡下的搜索框中输入欲查询的关键词,如“PHP 字符串,处理技术!”,单击“极速搜索”按钮,系统会首先过滤欲查询关键词的标点符号,然后对过滤标点符号的关键词进行分词操作,接下来在数据库中检索与之匹配的信息资源。同时实现搜索计时及查询结果汇总功能,并在结果集中高亮显示查询关键词,最后以分页形式输出匹配结果给用户。-Search engine module is one of the main and commo
biwebcorp_v5.8.1_SC_UTF8_Build090829
- BIWEB商务智能网站系统是依托在ArthurXF企业应用级PHP开发框架上的大型网站系统,是由上海网务网络信息有限公司经历了5年不断的在各种大型项目中实践、总结、开发设计出来的一个快速开发、简单易用的面向对象的企业应用级PHPMVC建站系统。现由上海网务公司开源发布,共同促进行业发展。BIWEB的设计初衷就是为了简化企业级各种基于WEB应用程序的开发,针对各种大中型企业应用级web项目,有着各种优化手段,能让服务器硬件性能提升到最大化应用。BIWEB建站系统集合了网站SEO、链接优化、数据分流
libstemmer_java
- linux系统下的分词软件,由java编写,我刚开始在windows下使用,折腾了两天,才发现在linux下-stemmer
DTWspeech
- 本 文 首先 介绍了语音识别的研究和发展状况,然后循着语音识别系统的 处理过程,介绍了语音识别的各个步骤,并对每个步骤可用的几种方法在实 验基础上进行了分析对比。研究了语音信号的预处理和特征参数提取,包括 语音信号的数字化、分帧加窗、预加重滤波、端点检测及时域特征向量和变 换域特征向量.其中端点检测采用双门限法.通过实验比对特征参数的选取, 采用12阶线性预测倒谱系数作为识别参数。详细分析了特定人孤立词识别算 法,选定动态时间弯折为识别算法,并重点介绍其设计实现。 在
NiceWords
- Nicewords是由工作在顶级门户网站的几名资深高级工程师利用爬虫技术(蜘蛛机器人,spider)、分词技术和网页萃取技术,利用URL重写技术、缓存技术,使用PHP语言开发的一套能根据设置的关键词自动抓取互联网上的相关信息、自动更新的WEB智能建站系统。利用NiceWords智能建站系统,只需要在配置页面上设置几个关键词,NiceWords就能全自动的生成一套能自动更新的网站了。 您要做的仅仅是设置几个关键词,其他的一切交给NiceWords来完成! -Nicewords is the top
ICTCLAS_2009_API_DOC
- 计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。这是最新版的API接口文档,有详细的示例。-Calculation of the Chinese lexical analysis system ICTCLAS. Segmentati
YH_zhizhu_1.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。 产品适用范围: 行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站
windows_csharp_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,支持C/C++/C#/Delphi/Java等主流的开发语言
dict-chs-utf8.tar
- 海量mysql的另一个分词词典 是Linux系统上的 具体的安装方法我还在摸索-Another massive mysql word dictionary is the Linux system specific installation method I' m still groping