搜索资源列表
文本信息提取技术
- 文本信息提取技术- Text information extraction technology
合并多个UNICODE编码的文本
- 把多个UNICODE编码的文本合成一个文本,需要建立MFC工作区,添加一个按钮即可。-UNICODE from multiple text encoding a synthetic version of the need to establish MFC work area, add a button.
文本拆分程序
- 这个perl程序可以很灵活地按照指定的行数把单个文本文件拆分成多个文本文件。
stopWord.是关于中文文本切词的资料
- 是关于中文文本切词的资料,排除了部分无意义的词,Chinese text on the segmentation of information, rule out the possibility of some meaningless words
在WINDOWS把文本文件转化成二进制文件
- 在WINDOWS把文本文件转化成二进制文件,然后根据ID号码查找内容 ,The text file in the WINDOWS into binary file, and then under the ID number to find the content of
lucene.rar
- java中lucene的源代码,用于文本分类的一个很好的工具,是由一个著名的语言研究者编写的,lucene code for java
MKFON.为特定文本文件中的汉字生成小汉字库
- 为特定文本文件中的汉字生成小汉字库。目前,GBK取字模程序段有问题,请高手指正。,Generates a small hz lib for Chinese characters in a given text file. At present, GBK font data getting is problematic, please correct me master.
svm.rar
- 中文文本分类,应用SVM对中文文本进行分类,具有高性能,Chinese text classification, applications to the Chinese version of SVM for classification, with high-performance
lindatanetwork1.rar
- 主要是数据挖掘中的文本挖掘算法及其分析,其中包括层次聚类,空间向量模型等,处理对象有对于网页的也有针对纯文本的。,Mainly in data mining and analysis of text mining algorithms, including hierarchical clustering, vector space model to deal with subjects of the pages are for plain text.
text_tfidf
- 文本相似度计算(tfidf),可用文本分类以及文本信息处理-Text Similarity Computing (tfidf), available for text classification and text information processing
chinese-text
- 文本分类语料库,经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档-Text classification corpus, edited manually compiled and classification of news corpus and the corresponding classification information. Their classification system includes dozens of classi
PLSA
- PLSA 的Java实现,可以用于图像处理,文本分类,文本聚类等-code of PLSA in JAVA
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
CRF1-2
- CRF1.2,条件随机场软件包,很好用很流行的一个文本分类软件,可以用于自然 语言的处理,标签,分类,词性发现,用户只需要着重构造特征函数既可以,实验结果和应用表明crf要优于隐马尔科夫模型。实现环境为java语言。-CRF1.2, conditions package with the airport, very good very popular with a text classification software, can be used in natural language proc
supportvector
- 完成支持向量机方法的文本分类 用C++语言编写-The completion of support vector machine method of text categorization with C++ Languages
bow-20020213
- 卡内基梅隆大学MaCallum开发的文本分类系统,可方便在其中嵌入自己的模块-text categorization system developed by maccallum of cmu
tztqjsydm
- 贝叶斯公式,文本分类,中文分词,VC++开发,方便实用和开发-beyes,text classify
Test Class By SVM
- 支持向量机实现的文本分类程序,过程如下,首先使用分词工具分词,这里使用的是计算所的分词工具,从而保证分词是最优秀的,接下来使用国际效率最高的文本IFIDF向量生成工具生成文本相量,最后使用台湾林智恒的效率最高的SVM实现软件包libsvm实现训练和分类,可以这么说,该文本分类是同类中效率最高最准确的-text classfication source code use 3 technology.words sementation,vector gerneration,and libsvm too
TestICTCLAS
- 文本挖掘,文本分类源代码.包括贝叶斯分类,信息抽取以及抽取之后的关联规则挖掘等功能-source code of text mining and text classification
wenben
- 文本分类文本的选择似乎是根据内容来的, 而非一般所采用的语体分类-Text classification is based on the text of the choice seems to be content, rather than the general language used in Classification