搜索资源列表
filtergame
- 过滤无用词汇程序。规则如下: 1. 能接受的字符是:字母 数字 标点符号 , . " 还有无用的符号 @#¥ 2. 对于敏感信息的词语是不分大小写的。 3. 要注意滤去可能在敏感词汇的中间出现的一些空格(比如要滤去lv, 输入l v时要辨认出来并滤去)。 4. 若有用信息(字母,数字)中间夹这无用信息(非字母,数字,标点符号),也要辨认出并滤去。假如敏感词汇是mz, 那么输入 m z也要滤去,但是输入 m1,z不用滤去。 现在要过滤的信息有L4和 Fd和D26这3
Windows_32_C_Demo
- ICTCLAS 汉语分词系统 pku_test.txt 未经过分词的文档文件 调用ICTCLAS程序对其中的文档进行分词 -ICTCLAS Chinese word segmentation system pku_test.txt word document file without calling undue ICTCLAS program on which the document word
matching-Chinese-word-by-HMM-and-MM
- 该程序为在MFC下开发的正向和反向两种中文分词系统。-The program was developed in MFC under both positive and negative Chinese word segmentation system.
ConvertPinYin
- 汉字转拼音程序,可对文件进行转换,不包括标点符号,而且使用了一个分词的库-Chinese characters to Pinyin program can convert the file, not including punctuation, and the use of a word in the library
IKAnalyzer
- JAVA实现简单客服的机器人系统,分词用系统用IK分词,机器人语言用AIML。程序已经实现java socket服务的建立。实现了中文分词,同义词输出,答案匹配。用到的库有IK、program-ab。搞了一个月的小成果,希望大家能用到。-JAVA simple customer service robotic systems, word by word IK systems, robot language with AIML. Procedures have been implemented t
word
- 一个用C语言写的分词小程序,值得细细研究-A C language written word applet
MFC-Look-it-up-in-the-dictionary
- 查词典、分词、词频统计程序,非常实用读者,建议下载。-Look it up in the dictionary, word segmentation, word frequency statistics program, very practical readers, it is recommended to download.
Sina-weibo
- 运行环境为C#+MYSQL,并融合了ICTCLAS分词和TF*PDF算法,能够对采集到的信息,做趋势分析和热点发现等分析;此外,您可以通过调整程序中的正则表达式,以匹配相关代码区域的数据。-Runtime environment for C#+ MYSQL, and the integration of ICTCLAS word and TF* PDF algorithm, able to collect information, analyze trends and hot spots dis
201411149222244
- 随便下载一篇中文的文本文档,通过这个程序可以将文档进行分词处理,还能够统计词语出现的次数-To download a Chinese text documents, through this program can be word processing document, will also be able to statistics the number of occurrences of words and phrases
Project2
- 分词实验程序,通过读取txt中的中文词典,根据词典中的词语对文本进行中文分词-Word segmentation experiments, by reading the Chinese dictionary in txt, according to the words in the dictionary to Chinese word segmentation
kms3
- 任意聚合成员搜索引擎、分类搜索快速建立行业网站群组搜索引擎、缓存技术静态化搜索、中文智能分词技术、广告管理、WAP移动搜索;后台程序采用多线程调用成员引擎,大大提高搜索速度、性能和系统负载能力。 -Any aggregation member search engine, category search quickly establish industry group of websites search engine, caching static search, Chinese intell
kms_v3.1
- 元搜索引擎(MetaSearch)的特点是把多个独立搜索引擎的搜索结果整合、控制、优化,再把搜索结果输出到客户端。元搜索引擎不需要庞大的网页数据库,而能够搜索到更加丰富、准确的内容。K-MetaSearch是由Kwindsoft自主研发的元搜索引擎产品。主要功能特点:任意聚合成员搜索引擎、分类搜索快速建立行业网站群组搜索引擎、缓存技术静态化搜索、中文智能分词技术、广告管理、WAP移动搜索;后台程序采用多线程调用成员引擎,大大提高搜索速度、性能和系统负载能力。-Meta search engine
CreateIndex
- Lucene.Net+盘古分词做的定时建索引程序,自己网站用的。-A program which create index Sql server byLucene.Net+pangu.dll
kmeansClassifier
- 该程序实现了keans分类,使用IK分词技术实现分词。-The program implements the k means classification, the use of IK word segmentation technology to achieve word segmentation.
123
- 分词处理算法 自己写的一点小程序 仅供参考-Word segmentation algorithm to write their own small procedures for reference only
百词斩
- 本程序设计了一个单词学习系统,主要功能有:1.选择词库,2.添加单词,3.删除单词,4.修改单词,5.学习计划,6.单词游戏,7.查询单词(支持模糊查询)。执行程序进入系统后,首先要选择词库,有四级单词、六级单词、托福单词和考研词汇四个词库可供选择。选择词库后显示“我爱背单词系统”主界面,共有7个功能可供选择,分别是:1.添加单词,2.删除单词,3.修改单词,4.学习计划,5.单词游戏,6.查询单词,7.退出系统。(The program design of a word study syste
4925660
- 此程序解决的问题 较好的, 并适应短字符串的中文分词算法 根据词库 发现以换行符分隔的众多标题中的 top N 关键字并以此更()
ChineseChuLi
- 中文文本处理的python程序,包括分词、删除特殊字符、删除停用词、爬虫程序、PCA降维、Kmean聚类、可视化等(Python programs for Chinese text processing, including participle, deleting special characters, deleting disuse words, crawler programs, PCA dimensionality reduction, Kmean clustering, visuali
argkmebt
- 此程序解决的问题 较好的, 并适应短字符串的中文分词算法 根据词库 发现以换行符分隔的众多标题中的 top N 关键字并以此更()
chinese_wordseg_keras-master
- 这个程序是用来做中文分词的程序,用Python写的(This program is used to do Chinese word segmentation program, written in Python)