搜索资源列表
experimentoftextclassification
- 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在DataSet目录。 数据表“WordsTable”:保存DataSet中所有文本的倒排文档。 其中“目录
experiment3
- 基于语言模型的音字转换说明 给定拼音串:jinjitizhigaige 可能的汉字串:紧济体质改革 经 济体制改革 使用 2-gram计算: p(CString1) =p(紧)×p(济|紧)×p(体质|济)×p(改革|体质) p(CString2) =p(经济)×p(体质|经济)×p(改革|体质) p(CString3) =p(经济)×p(体制|经济)×p(改革|体制) 比较p(CString1),p(CString2),p(CString3)
