期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
统计与规则相结合的藏文句子自动断句方法 被引量:7
1
作者 徐涛 加羊吉 于洪志 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第6期653-657,663,共6页
藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点符号功能的歧义问题,实验结果表明该方法具有比较好的效果,F1... 藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点符号功能的歧义问题,实验结果表明该方法具有比较好的效果,F1值达到98%以上.在规则中首先使用经验的方法,识别出不确定的藏文句子作为候选句子,然后采用基于关联词的复句分析方法进行分句合并形成二次候选句子;最后使用最大熵的方法对二次候选句子进行断句.经验方法和复句分析有效解决了最大熵算法无法触及的语料稀疏和分句问题. 展开更多
关键词 藏文句子自动断句 复句分析 二次候选句子 最大熵
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部