搜索资源列表
Filter3
- 英文分词过滤程序,先分词,然后用停用词处理过滤,完成预处理, 很好,很强大-stemming and filtering adaf ad aasdf asf adftgh gadgf aff
ChineseSeg_CSharp
- 该程序实现简单的中文分词,也可以直接使用。但不建议。做为开发中文分词的参考,相信还是有一定价值的。 项目基于.net(C#)平台下开发。-Chinese word segmentation is the Chinese word segmentation procedure based on matching the pattern of development, but also can be used directly. But is not recommended. Because t
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
Tdartsplitterh
- 这是关于中文分词的有关程序,有正在做中文分词的朋朋友可以拿去参考一下 , -This is the Chinese word program, are doing the Chinese word Peng friends can take reference
hanseg
- 1.该程序为基于词典的中文自动分词. 2.程序的运行编译环境是:VC6 3.详细信息请参见本目录下面的中文自动分词文档。-1 The procedure for dictionary-based Chinese automatic word segmentation program run the compiler environment: VC6 For more information please see the catalog below the automatic Chine
adarrts-02tarr
- 双数组辞典生成程序源码。运用双数组实现trie算法,对于不定长度共同前前缀查询情况,比哈希方法更为有效。经常用于分词辞典的制作。 可直接使用。 -The dual array thesaurus program source code is generated. The use of double-array trie algorithm for indefinite length common prefix query before, Bi Haxi method is more effe
TokenTest
- 电信行业,此代码是地址搜索程序的一部分,该代码的功能是分词的测试程序。-Telecommunications industry, address search program, the function of this code is written in the sub-word test.
splitewords
- 在对话框中,调用第三方分词工具(ICTCLAS中文分词免费版),实现对中文的分词示例程序,可以对想实现全文搜索算法的中文分词问题提供解决方案。-In the dialog box, call the third-party segmentation tools (word ICTCLAS Chinese free version), the sample program to achieve the segmentation of Chinese text search algorithms C
ICTCLAS-V3.0
- 本程序是是汉语文本的分词系统,进行了改进,是最新的版本,准确率达到99 以上。-This procedure is the Chinese text segmentation system has been improved, is the latest version, the accuracy rate of more than 99 .
fencisuanfa
- 正逆向的分词算法 已经测试通过了 里面有完整的源码 和测试程序-Forward and reverse segmentation algorithm has been tested by the complete source code and testing procedures
fencivc6
- 自己写的一个分词小程序,vc6下运行通过。-I write a word of small procedures, VC6 running through.
zidong
- 用c++实现自动文摘功能,包括自动分词,计算句子权重,摘录等功能,整个的程序代码都有-With c++ automatic summarization, including automatic word calculated weights sentence, extract features such as the entire program code
bianli
- VS2010编写的遍历目录小程序,dos界面,数字内容安全的“分词”中可能会用到-VS2010 directory traversal written procedures, dos interface, digital content security " word" may be used
RMM
- 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th
NBclassfier
- 贝叶斯情感分类器,基于五倍交叉法来验证。程序可以直接运行,改程序是在基于已经分词的情况下实施的。-Bayesian classifier, emotion to verify five times based on the crossover. Program can be run directly, the program is based on the segmentation of the case.
MapTest
- 倒排索引,此程序,运用ICTClas分词工具实现的中文分词,并建立倒排索引输出到指定文件。-Inverted index, this procedure, use ICTClas segmentation tool to achieve the Chinese word segmentation and indexing inverted output to the specified file.
fenci_v1.0_utf8
- 本程序利用数学算法简单实现了文章分词的功能,页面清洁、简单。-the program use math to
devide
- 用于分词的c语言小程序,对大量的文档分词,可能会在数据挖掘用到-C language word for a small program, a large number of documents word may be used in data mining
TextAnalysis
- TextAnalysis系统及算法设计 输入为ICTCLAS分词后的词语结构信息,对每个词语的词性进行判断。 1. 如果不存在词性,则跳过这次循环。用来跳过一些语气助词等无意义的信息。 2. 由于每个句子都有几个子句,而每个子句都是一个独立的主谓宾结构,所以系统将子句通过标点符号来分隔。最后将所以子句的总情感权值相加得到总句的情感权值。 3. 在对字典的预处理阶段,系统对不同程度的词语赋予了不同的权值。为了提高处理程序的效率,系统只分析对体现语言情感有较大作用的词性(包括形容词、
word_counting
- 利用C#编写的一个小程序,可以对一个文档按照空格和逗号等分隔符进行分词并且计数-Use C# to write a small program, you can follow a document, such as space and comma separators for segmentation and counting