搜索资源列表
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
GRE_ciping(mimace)
- GRE词频(密码册),一部介绍密码册GRE词频的书籍-GRE word frequency (password booklet), a password list introduced frequency GRE books
parallel
- 并行计算实验代码,分别有计算pi,并行求卷积的两种方法和mapreduce的统计词频-Parallel computing experiment code, respectively, calculated pi, parallel convolution of two methods of statistical, frequency and mapreduce
php_chinese
- php中文分词词库,用php纯代码书写的,支持敏感词,关键词过滤,还可以给词添加自定义属性(词频、权重、高亮显示)入口操作简单易于整合。-php Chinese word thesaurus, written in pure code with php support sensitive word, keyword filtering, you can also add custom attributes to the word (word frequency, weight, highligh
spammailfliter
- 使用贝叶斯算法写的垃圾邮件过滤,基于词频信息,比较适合新手。-Using Bayesian spam filtering algorithm written, based on word frequency information, more suitable for beginners.
SearsScraper
- 利用java的html分析包jsoup,编的网络爬虫,自动从sear网站上搜寻产品信息并归类,统计词频等。-Java using the html analysis package jsoup, compiled web crawler to automatically search for products on the website from the sear and classified information, statistical, frequency and so on.
wordCount
- python代码,利用hadoop分布式框架处理文本内容重的统计词频问题 -python code, use hadoop distributed framework for handling text heavy question word frequency statistics
567657
- SCWS是Simple Chinese Word Segmentation的首字母缩写(即:简易中文分词系统)。 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。 -SCWS initials Simple Chinese Word Segmentation abbreviations (ie: Simple Chinese
wwwsqldesigner-2.7
- 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。-This is a dictionary-based word frequency mechanical Chinese word segmentation engine, it will be a whole section of the Chinese text of the basic r
wordcount-project
- 用JAVA语言编写的词频统计以及根据词的共现确定文章关键词的程序-JAVA language word frequency statistics and procedures in accordance with article keyword co-occurrence of the word is determined
新建 Microsoft Word 文档
- 用c语言实现查找文章中词频并排序(http://www.docin.com/p-1154334506.html)
