搜索资源列表
biwebcorp_v5.8.1_SC_UTF8_Build090829
- BIWEB商务智能网站系统是依托在ArthurXF企业应用级PHP开发框架上的大型网站系统,是由上海网务网络信息有限公司经历了5年不断的在各种大型项目中实践、总结、开发设计出来的一个快速开发、简单易用的面向对象的企业应用级PHPMVC建站系统。现由上海网务公司开源发布,共同促进行业发展。BIWEB的设计初衷就是为了简化企业级各种基于WEB应用程序的开发,针对各种大中型企业应用级web项目,有着各种优化手段,能让服务器硬件性能提升到最大化应用。BIWEB建站系统集合了网站SEO、链接优化、数据分流
SegmentationDLLSourceCode
- 根据字典来对中文进行分词的程序,最终可以编译成为dll文件来使用。-According to the dictionary to be conducted in Chinese word segmentation procedure could eventually become a dll file to the compiler to use.
lucene
- 汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了·1·在vc6编译2·还不支持分词,但支持汉字,-汉化CLucene Today, the procedures put CLucene changed a bit, you can support the Chinese characters one at vc6 compiler 2 do not support sub-word, but will support the Chinese characters,
fenci
- 自己下载一个语料库,根据程序,计算权重,然后对语料库进行分词-Download a corpus itself, according to the procedures for calculating the weights, and then carried out on sub-word corpus
TDHCursorFactory
- 是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术,如文本聚类、分词、索引,搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, indexing, search engines, dicti
CutwordShort
- 用于搜索引擎上的切词程序,可以获得比较好的分词结果。运行速度可以达到约500k词/s(笔记本上)-For the search engine on the segmentation procedure can be the result of a better word. Running speed of about 800k words/s (notebook)
F2_6764
- 端点检测是指用数字处理技术来找出语音信号中的各种段落(如音素、音节、词素、词等)的始点和终点的位置。语音段起止端点检测是语音分析、语音合成和语音识别中的一个必要环节。传统的端点检测方法是从wav文件中获取语音采样,将其分帧并计算短时能量和过零率参数,然后进行端点检测。这种工作方式被称为离线处理方法 ,无法实现语音信号的实时处理,对于语音信号分析具有一定的局限性。本文通过开发ActiveX控件,在MATLAB环境下将其嵌入到figure窗口中,以GUI程序的方式使用,实现语音信号端点检测的实时处
Test Class By SVM
- 支持向量机实现的文本分类程序,过程如下,首先使用分词工具分词,这里使用的是计算所的分词工具,从而保证分词是最优秀的,接下来使用国际效率最高的文本IFIDF向量生成工具生成文本相量,最后使用台湾林智恒的效率最高的SVM实现软件包libsvm实现训练和分类,可以这么说,该文本分类是同类中效率最高最准确的-text classfication source code use 3 technology.words sementation,vector gerneration,and libsvm too
luceneCH2
- 亲自测试成功的《开发自己的搜索引擎》第二章,以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
u2.0
- 演示:http://u2.71116.com/ 下载:http://u2.71116.com/u2.0.rar 2.0更新 1.程序模板分离 2.网站自动截图 3.关键字分词加强 4.网站百度:收录 快照 谷歌:收录 PR每天更新缓存 5.站长工具 6.统计方式改进 7.部分数据缓存处理 安装说明: 配置好 /config.inc.php 建好相关数据库后 执行 /install.php 安装数据库 后台:admin.php
11111111
- 从一段文章中分词,标注词出现的次数,程序短小精练,有利于学习使用,谢谢!-Carved from a piece of writing words, mark the number of times the word appears, the program short and concise, is conducive to learning to use, thank you!
fenci
- 帮组我们实现中文分词,程序较为粗糙,请见谅,-Help us to achieve Chinese word group, the program is more rough, please forgive me,
TokenizerTest2011
- C# 分词演示程序 TokenizerTest2011.rar
ngrams
- 自然语言处理相关程序,有关分词的和词频统计-Natural language processing procedures, the statistical segmentation and word frequency
memrial
- 用java实现的一个类似于记事本的小程序。 实现功能添加记录、查询记录、修改记录、删除记录。无按钮,全由快捷键操作,这是根据本人的需求设置的。包含的技术,IK分词技术,lucence搜索技术,文件操作(容易修改为扩展为BDB轻量级数据库)-Use Java a similar to realize the notepad small programs.Functions added records, inquires the record, modify records, deleting
Chinese_wordspliter
- 使用正向最大匹配法的中文分词器 分别读入待分词文本文件及字典文件后,将经处理后的结果输出至另一文件予以保存。所用待分词文件样例约有字符184万个,处理时间在11s左右。程序使用C++语言编写。-Using the forward maximum matching device of Chinese words segmentation, respectively, to be read into the text file and dictionary file, the result will
svmcls
- 基于KNN+SVM算法的文本分类器,附带权威的分词词库及算法,有界面,程序可正常使用-KNN+ SVM-based text classification algorithm, with the authority of the sub-word thesaurus and algorithm, a interface, the program can be used normally
boosting_src
- Boosting中的AdaBoost.M1算法在文本分类中的应用实现。使用ICTCLAS用于中文分词,弱分类器使用Naive Bayes。程序参数使用配置文件的格式。-Application of text classification using AdaBoost.M1. Use ICTCLAS tool in Chinese segment, and use Naive Bayes as the weak classifier. use the config file as the para
quanqiefen_fenci
- C#编写的程序,用于实现中文分词中的全切分获取连续单字符串功能。-Programs written in C# for the realization of the full Chinese word segmentation to obtain a continuous function of a single string.
fenci
- 基于VC++的中文分词代码。程序编码基本正确,实现了程序设计中提到的两种分词策略,分词结果就在预料之中。-Chinese word segmentation based on VC++ code