期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于半CRF模型的百科全书文本段落划分 被引量:2
1
作者 许勇 宋柔 《北京工业大学学报》 CAS CSCD 北大核心 2008年第2期204-210,共7页
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语... 介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语义本体知识库的段落开始特征以及针对特定段落类型的提示性特征来进一步适应目标文本的特点.实验结果表明,该划分方法可以综合利用各种不同类型的信息,比较适合百科全书文本的段落结构,可以取得比单纯的HMM模型和CRF模型更好的性能. 展开更多
关键词 自然语言处理 机器学习 隐马尔科夫模型 文本段落划分 半条件随机域模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部