搜索资源列表
scala-shell-code_09.scala
- 基于spark做的文本分类,有分词、提取TFIFDF关键词特征,贝叶斯分类次,word2vector-Make text classification based spark, partakers word feature extraction TFIFDF keyword, Bayesian classification times, word2vector
emotionalPjar
- 利用IKanalyzer进行分词1.可自定义词表,2.读取本地文件3.将词表与本地文件分词后进行中文词匹配- 1. use IKanalyzer be customizable word vocabulary, 2. 3. After reading the local papers and local papers vocabulary word were Chinese words Match
syzlsearch_v3.1
- 基于Lucene开发的站内搜索解决方案,其集成专为站内搜索设计的细粒度中文分词,有效兼顾搜准和搜全率,无缝支持多种数据库数据汇入索引,支持全站,资讯,博客等多类型同时搜索,支持按相关度/时间检索,支持按时间过滤搜索,同时还有智能提示,相关搜索,搜索历史记录等实用功能。-Based on the development of the station within the Lucene search solutions, integrated site search designed specifi
2011
- 分词,将htm内容区分为tag和text-Word, the htm and text content is divided into tag
WebPage
- 网页分析提取文本信息,网页分词,利用Trie树实现算法-Web analytics extract text, page segmentation, use of Trie tree algorithm
LogAnlanlyze
- 基于Hadoop的日志分析系统,流量分析、用户区域分析、使用数据仓库Hive存储查询,Hbase存储,分词等-Hadoop-based log analysis system, traffic analysis, user-regional analysis, data warehouse storage Hive queries, Hbase storage, word, etc.
ltp_code
- 哈工大语言云LTP的C++集成代码,能够实现自然语言的处理。能够进行分词、词性标注、 命名实体识别、依存句法分析、语义角色标注 语义依存分析等功能。注:读者需要自己到哈工大官网注册KEYS使用。-Harbin Institute of technology language cloud LTP C integrated code, can realize natural language processing. Segmentation, part of speech tagging,
Preprocessing-Java
- 自然语言处理,对于分词后的结果预处理,提取分词结果中的中心词和短语-Word and phrase extraction and segmentation results
kms3
- 任意聚合成员搜索引擎、分类搜索快速建立行业网站群组搜索引擎、缓存技术静态化搜索、中文智能分词技术、广告管理、WAP移动搜索;后台程序采用多线程调用成员引擎,大大提高搜索速度、性能和系统负载能力。 -Any aggregation member search engine, category search quickly establish industry group of websites search engine, caching static search, Chinese intell
rJava_0.9-8
- R-language的分词辅助工具,配套Rwordseg包使用-R-language segmentation aids, supporting the package uses Rwordseg
tm_0.6-2
- R语言分词包,可以建立文档词条矩阵,对应Windows操作系统-R Language word package, you can create a document term matrix corresponding Windows operating system
kms_v3.1
- 元搜索引擎(MetaSearch)的特点是把多个独立搜索引擎的搜索结果整合、控制、优化,再把搜索结果输出到客户端。元搜索引擎不需要庞大的网页数据库,而能够搜索到更加丰富、准确的内容。K-MetaSearch是由Kwindsoft自主研发的元搜索引擎产品。主要功能特点:任意聚合成员搜索引擎、分类搜索快速建立行业网站群组搜索引擎、缓存技术静态化搜索、中文智能分词技术、广告管理、WAP移动搜索;后台程序采用多线程调用成员引擎,大大提高搜索速度、性能和系统负载能力。-Meta search engine
wwwsqldesigner-2.7
- 这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点。-This is a dictionary-based word frequency mechanical Chinese word segmentation engine, it will be a whole section of the Chinese text of the basic r
TSE1.0
- 基于ICTCLAS分词工具的本地全文搜索器。GTK+编写的图形界面。-An original text search engine based on ICTCLAS lib. GUI written by GTK+.
chinesespliter
- 中文分词源码C++,分词效果不是特别的好,但是实现了。-Chinese word source C++, segmentation results are not particularly good, but true.
JnaTest_V1
- 分词工具IKAnalyzer的简单使用教程,计算TF-IDF值-Tutorial segmentation tool to calculate TF-IDF value
WordSegment
- 分词系统的应用尝试,将维基百科解析得到的文件进行切割分词处理-Try word application system, the resulting file is parsed Wikipedia cutting word processing
HanLP-1.2.8
- 汉语言文学包,比较好的自然语言处理源码,可以进行中文分词,主题模型提取,关键字提取,自动摘要的生成等-Chinese language and literature package, relatively good Natural Language Processing source code, you can carry out the Chinese word segmentation, keyword model extraction, keyword extraction, automa
SiteSearchPub3.5
- 搜易站内搜索引擎(SearchEasy Site Search Engine)是面向互联网网站的站内搜索解决方案,其针对网站使用数据库搜索性能差,体验差等问题,将搜索引擎技术应用于站内搜索;本系统具备中文分词,智能摘要,关键词高亮等技术,可与数据库无缝集成,目前支持MS SQL 2000/2005,My SQL数据库。-Search within easy to search site search engine for the Internet site station solutions,
CWS_LSTM-master
- 一款基于LSTM的中文分词工具包!很支持!-A LSTM based Chinese word Kit! Very supportive!