搜索资源列表
TextFreq
- 自己编写的统计词频的代码.已经调试为可用.
wvtool-1.1
- 一个很不错的词频统计程序,目前只支持英文,中文的本人正在修改中.改好后上传给大家分享
App7
- 词频统计程序。具体功能是在当前目录下读取文本文件,然后统计词频。
seg_delphi
- delphi版的基于词频字典的分词算法,其中dict目录下为词频字典。对于未注册词也有一定的识别能力。
wordcount
- 实现页面的词频统计,把页面里出现的每一个词进行次数统计,最后输出到文本文件中
freq_tagdic
- 中科院带词性词频的扩展词典免费开放资源喜欢的请下载
1234
- 一个词频统计的 小程序 自己编的 希望大家用用给点评论
unispim6wordlib
- 将紫光拼音输入法v6的用户词库文件导出为txt后可用本程序根据指定的词频去除使用频度太低的词
wordfreq
- 按照linux下使用shell编程统计单词词频的方法,使用vc实现文章中英文单词词频统计
ictclas4j_0[1].9.1
- 基于java语言的分词系统,可以标注词性、词频等信息,可用于二次开发
wf1-2
- 可进行词频计算,自然语言处理或语音识别。N-gram待续
wordstat_java
- 简单的词频统计,利用java 实现,使用hash表
wordcount
- 利用将词表存入BST树然后对词频进行统计,统计词表中词语出现次数。
tfidfshiyan
- tfidf算法源码,实现、验证,附试验报告文档。这是web数据挖掘课程的大作业。我们实现了对文档中出现的每个词统计,有计算词频,权值,排序功能。
Chinese
- 用VB6.0开发的中文词频统计软件,可在word文档中自动找出所有的词语,并从按照词频高低排序。附测试文档。
English
- 英文词频统计,可统计英文word文档中的词频,并从高到低排序。
中文分词技术及最新发展
- 搜索引擎通常由信息收集和信息检索两部分组成。对于英文,由于英文中词 与词之间是用空格隔开,检索起来很方便,故计算机采用了词处理的方式,大大 减轻了用户与计算机的工作量:相对来讲,中文的情形就复杂得多。中文的词与 词之间是没有分隔符的,因此若想建立基于词的索引,就需要专门的技术,这种 技术被称之为“汉语词语切分技术”。根据是否采用词语切分技术,中文搜索引 擎又可分为基于字的搜索引擎和基于词的搜索引擎。由于中文信息处理的特殊 性,开发中文搜索引擎决不像西文软件的汉化那样简单。在实
MFC编程,功能是查词典(用户可自己导入文本),分词,统计词频
- AppWizard has created this RMM application for you. This application not only demonstrates the basics of using the Microsoft Foundation classes but is also a starting point for writing your application. This file contains a summary of what you
TF/IDF 算法
- 统计词频,和对文档进行分词处理,计算tf-idf值,JAVA实现
main
- 文本分类的前期处理,关于文本的预处理和字频统计,词频统计,猜词,搜索功能-Text classification in the early period of the processing, about text pretreatment and word frequency statistics, obtaining statistics, guess the word, the search function