搜索资源 - 文本预处理 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 文本预处理

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

Windows编程

Internet/网络编程

系统编程

通讯/手机编程

游戏

多媒体

嵌入式/单片机编程

图形图象

数值算法/人工智能

行业应用软件

数据库系统

其它

搜索资源列表

v.206(预处理)

0下载：
lex语法分析，对BNC语料库进行文本标注前的预处理，将与SGML标注与文本词性标注无关的删除掉-this is lex syntax analyzing,annotate with BNC syntax LIB.
所属分类：编译器/词法分析
- 发布日期：2008-10-13
- 文件大小：239542
- 提供者：周果果

中文分词函数库CipSegSDKV1.03

1下载：
东大做中文分词的源代码,主要是用于搜索引擎的中文文本预处理-Tung Chinese-made version of the source code is mainly for the Chinese search engine Hypertext
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：661149
- 提供者：刘斌

ful2hlf

0下载：
将文本中的全角转变为半角，供后续使用。主要可以用于对网页内容的预处理。-text of the entire half-angle of the angle changes for the use of follow-up. The main website can be used as pretreatment.
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：915
- 提供者：YangLin

speakerrecognition

0下载：
语音识别中的两种特征提取方法lpcc和mfcc，还有一个是文本无关的识别算法dtw，另外还有一个是预处理消噪部分的。共享一下，这些都是我调试过的，好用。-Speech Recognition two feature extraction methods and mfcc lpcc. There is a text-independent recognition algorithm dtw, in addition to a pretreatment is part of the noise so
所属分类：语音合成与识别
- 发布日期：2008-10-13
- 文件大小：1741
- 提供者：杨洁

bmptoascii1593195282003

0下载：
BMP到ASCIIl转换程序,将图像转换成使用字母和符号的ASCII艺术文本,也可以创建相应的彩色ASCII图像. 程序中提供有图像预处理操作改变图像大小及增强图像的灰度级对比度.
所属分类：图形图像处理(光照,映射..)
- 发布日期：2008-10-13
- 文件大小：10714
- 提供者：胡一刀

php-5.2.5

0下载：
PHP，一个嵌套的缩写名称，是英文超级文本预处理语言（PHP:Hypertext Preprocessor）的缩写。PHP 是一种 HTML 内嵌式的语言，PHP与微软的ASP颇有几分相似，都是一种在服务器端执行的嵌入HTML文档的脚本语言，语言的风格有类似于C语言，现在被很多的网站编程人员广泛的运用。
所属分类：Windows编程
- 发布日期：2008-10-13
- 文件大小：7773024
- 提供者：许庭洲

log_pretreatment

0下载：
数据预处理，完成由数据库数据向TEXT文本的转化
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：3761950
- 提供者：石娟

stop.rar

0下载：
本代码用c语言编写，用于在文本分类预处理过程中停用词的去除。
所属分类：源码下载
- 发布日期：2010-11-09
- 文件大小：219320
- 提供者：chenjianhuahua

c

0下载：
实现源程序输入串中注释、续行符的删除，换行符和Tab的替换，大写字母变换，得到预处理后的文本串，为单词识别做好准备。-Realization of input strings in the source notes, continued at the deleted line, newlines, and Tab replacement, capital letters transform, obtained after pretreatment of the text string, read
所属分类：Compiler program
- 发布日期：2017-04-08
- 文件大小：1163
- 提供者：陈斌

work

0下载：
本文的处理手段是对输入的汽车图像进行预处理,运用车牌定位,字符分割，字符识别的方法提取车牌上的数字字符串,并以文本的形式输出。-This treatment method is to enter the vehicle image preprocessing, the use of license plate location, character segmentation, character recognition to extract license plate numbers on th
所属分类：matlab
- 发布日期：2017-03-30
- 文件大小：489507
- 提供者：金振涛

1

0下载：
基于WEKA平台的文本聚类研究与实现文本聚类是文本挖掘领域的一个重要研究分支，是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结，利用文本语料库，基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程，回顾了文本聚类领域的已有成果，列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外，本文回顾了现有的文本聚类算法，以及常用的文本聚类效果评价指标。在研究了已有成果的基础上，本文利用20 Newsgroup文本语料库，
所属分类：Windows Develop
- 发布日期：2017-03-30
- 文件大小：1023117
- 提供者：yueyue

V3.0

0下载：
文本分类，包括：文本预处理，去除停用词，学习和训练，最后实现分类。-Text classification, including: text pre-processing, removal of stop words, learning and training, and finally achieve the classification.
所属分类：Windows Kernel
- 发布日期：2017-11-15
- 文件大小：3456956
- 提供者：朱山

java_stopword_code

0下载：
Java 数据挖掘进行文本预处理的一步，除去文本中包含的停用词-Java Data Mining for text preprocessing step to remove the text contains the word disabled
所属分类：AI-NN-PR
- 发布日期：2017-04-01
- 文件大小：12831
- 提供者：kou

English

0下载：
包括了原始英文文档、删除特殊符号、分词、词干化、计算相似度等文本预处理后产生的文档，总的数量是500个英文文档(Including the original English document, delete special symbols, such as text segmentation, a preprocessed documents produced, the total number of 500 English document)
所属分类：其他
- 发布日期：2018-04-19
- 文件大小：2597888
- 提供者：hello_spring

Chinese

0下载：
是做文本预处理时候利用爬虫收集的500个中文文档，包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and the final similarity calculatio
所属分类：其他
- 发布日期：2018-04-19
- 文件大小：12314624
- 提供者：hello_spring

EnglishChuLi

4下载：
利用python编写的文本预处理的程序，包含了每一步的实现代码，分为删除标点符号、删除停用词、相似度计算、PCA降维、聚类以及可视化等，运行环境为pytharm，python3开发环境(The text preprocessing program written by Python contains every step of implementation code, which is divided into delete punctuation marks, delete stop word
所属分类：Windows编程
- 发布日期：2018-04-19
- 文件大小：8192
- 提供者：hello_spring

ChineseChuLi

5下载：
中文文本处理的python程序，包括分词、删除特殊字符、删除停用词、爬虫程序、PCA降维、Kmean聚类、可视化等(Python programs for Chinese text processing, including participle, deleting special characters, deleting disuse words, crawler programs, PCA dimensionality reduction, Kmean clustering, visuali
所属分类：Windows编程
- 发布日期：2018-04-19
- 文件大小：12288
- 提供者：hello_spring

关于垃圾邮件过滤器的演示

0下载：
垃圾邮件过滤 1.分析垃圾邮件存在的技术原因，设计基于内容的垃圾邮件过滤实现方案。 2.分析基于内容的垃圾邮件检测流程，设计邮件文本预处理、特征降维和文本分类模块。 3.搭建垃圾邮件过滤实验和测试平台，验证垃圾邮件过滤方案实用性。 4.解决垃圾邮件过滤效率不高、(Analysis of the technical reasons for the existence of spam and the design of a content based spam filtering schem
所属分类：其他
- 发布日期：2018-04-28
- 文件大小：976896
- 提供者：23hacker

sentiwordnet

2下载：
python3.6下英文文本预处理和情感分析(English text preprocessing and emotional analysis under python3.6)
所属分类：人工智能/神经网络/深度学习
- 发布日期：2018-05-01
- 文件大小：4467712
- 提供者：andyporter

Python中文文本预处理

0下载：
包括删除标点、分词、删除停用词、计算相似度、文本聚类等功能
所属分类：Python
- 发布日期：2022-06-16
- 文件大小：5177
- 提供者：QQLogin_6A216132E9CF891A

« 12 3 4 5 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.