搜索资源列表
segmenter
- 一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。
WordSeg--JAVA
- 本程序采用正向 逆向最大匹配才实现汉字分词。-This procedure being used to achieve reverse maximum matching segmentation of Chinese characters.
PERL
- perl采用正向匹配算法,使用词库构建哈希结构,匹配分词-perl matching algorithm being used, use the thesaurus to build hash structure, matching word segmentation
Lucene
- Lucene的基于正向最大匹配分析器,用于中文分词,可将查准率提高-Lucene chinese analyzer based by FMM algorithm
java
- java最大正向匹配算法 帮助大家了解分词原理-java maximum matching algorithm to help you understand the positive word principle
AIWordSplit
- 直接运行compile.bat和run.bat即可 使用了3种分词方法: 1.正向最大匹配(ForwardMatch.java) 2.逆向最大匹配(ForwardMatch.java) 3.最大频率匹配(FrequencyMatch.java)(默认) 取频率最高的词,然后两端递归,构建二杈树存储句子中的词语,显示的时候使用中序遍历二杈树 由于极有可能单个字的使用频率比整个词还高,筛选的时候进行了处理 若单个字不处于当前句子开头,先忽略,
zhengdike
- (个人原创)《中文网页自动分类》 牵扯的技术有:分词,统计词频,踢出网页中一些特殊字符(用正则表达式),还有需要提取培训集等等!! 此软件禁止商业活动,版权所属“qyTT论坛--www.qyclass.org/bbs” 本文来自: qyTT论坛 http://www.qyclass.org/bbs 我们的使命:让世界认识qyTT,让qyTT认识世界! 结果分析的思想:就是把得到的词频与建立的词库里每一类进行比较,如果存在一个最大匹配程度,就去这个类作为结果,如果存
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
chinese-_segmentation
- 中文分词算法介绍,正向最大匹配。word-word for chinese segmentation algrithm
search_engine
- 搜索引擎课程的几次作业,第一次作业实现分词算法,使用正向最大匹配原则。第二次作业实现倒排索引。第三次作业实现正排索引。第四次作业实现索引功能。实现的比较简单,但均可正常运行。-Several job search engine programs, the first job segmentation algorithm, using forward maximum matching principle. The second job inverted index. The third job t
WordSequence
- 正向最大匹配法实现中文分词,并计算其正确率(P)、召回率(R)和F测度-Positive maximum matching method to realize the Chinese word segmentation
mmsegger_src_1.0
- 最大正向匹配分词算法,用于分词和自然语言处理-Maximum forward matching word segmentation algorithm
CutWords
- 正向最大匹配实现的分词程序,有注释,清晰易懂-Positive maximum matching realize word segmentation procedure, have comments, transparent
CnFenci(0)
- 基于字典的分词,采用正向最大匹配和反向最小匹配相结合。-Forward maximum matching and reverse the minimum matching combination of dictionary-based segmentation.
maxmatch
- 通过对词库进行降序排序,提出窗口的思想,按正向最大匹配的方式进行分词,实现了长词优先。-By thesaurus descending order, proposed the idea of the window, according to the way forward maximum matching word, to achieve a long-term priority.
FMM_RMM
- 中文分词 以及词性标注,在awt界面上将中文分词,用的是最大正向匹配以及反向最大匹配-Chinese word segmentation and tagging, the interface will be in awt Chinese word segmentation, matching with the maximum forward and reverse maximum matching
CnFenci
- 基于字典的分词,采用正向最大匹配和反向最小匹配相结合。-Based on a dictionary word, using the forward and reverse maximum matching minimum matching combined.
CnFenci
- 基于字典的分词,采用正向最大匹配和反向最小匹配相结合。-Based on a dictionary word, using the forward and reverse maximum matching minimum matching combined.
CnFenci
- 基于字典的分词,采用正向最大匹配和反向最小匹配相结合。-Based on a dictionary word, using the forward and reverse maximum matching minimum matching combined.
Chinese Word Segementation
- 根据所给中文词典,对中文文本进行正向最大匹配分词,其中包括读取文本,并对其分词(According to the Chinese dictionary, the Chinese text is given a positive maximum matching word, which includes the reading of the text and the participle of the Chinese text.)