期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
提高韵律短语正确切分方法的研究
1
作者 吴晓慧 柴佩琪 《计算机工程》 CAS CSCD 北大核心 2003年第2期151-152,160,共3页
汉语自动词性标注和韵律短语切分都是汉语文语转换(Text-to-Speech)系统的重要组成部分。在用从人工标注的语料库中得到韵律短语切分点的边界模式以及概率信息,对文本中的韵律短语切分点进行自动预测时,语素'g'这种词性就... 汉语自动词性标注和韵律短语切分都是汉语文语转换(Text-to-Speech)系统的重要组成部分。在用从人工标注的语料库中得到韵律短语切分点的边界模式以及概率信息,对文本中的韵律短语切分点进行自动预测时,语素'g'这种词性就过于模糊,导致韵律短语切分点预测得不合理。该文提出了一种修改词类标注集,去掉语素'g'这种词性的方法。该方法在进行词性标注时,对实语素恰当地标注出在句中的词性,以便提高韵律短语的正确切分。应用此方法对10万词的训练集和5万词的测试集分别进行封闭和开放测试表明,词性标注正确率分别可达96.67%和92.60%。并采用修改过的词类标注集,对1000句的文本进行了韵律短语切分点的预测,召回率在66.21%左右,正确率达到了75.79%。 展开更多
关键词 韵律短语 切分方法 词性标注 词类标注集 语素 汉语信息处理 汉语文语转换系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部