期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于层叠CRF的古文断句与句读标记方法 被引量:9
1
作者 张合 王晓东 +1 位作者 杨建宇 周卫东 《计算机应用研究》 CSCD 北大核心 2009年第9期3326-3329,共4页
针对利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题,设计了一种六字位标记集,提出了一种基于层叠式CRF模型的古文断句与句读标记方法。基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察... 针对利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题,设计了一种六字位标记集,提出了一种基于层叠式CRF模型的古文断句与句读标记方法。基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记。实验在5M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%。 展开更多
关键词 古汉语 层叠条件随机场 数据稀疏 句读标注
下载PDF
古汉语句子切分与句读标记方法研究 被引量:2
2
作者 王川 张小红 韩采华 《河南大学学报(自然科学版)》 CAS 北大核心 2009年第5期525-529,共5页
利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题.为了解决这一难题,设计了一种六字位标记集,提出了一种基于层叠式条件随机场模型的古文断句与句读标记方法.基于六字位标集,低层模型用观察序列确定句子边界,高... 利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题.为了解决这一难题,设计了一种六字位标记集,提出了一种基于层叠式条件随机场模型的古文断句与句读标记方法.基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记.实验在5 M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%. 展开更多
关键词 古汉语 层叠条件随机场 数据稀疏 子切分 句读标注
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部