-
题名基于语法树高度的汉语韵律短语预测
被引量:6
- 1
-
-
作者
杨鸿武
王晓丽
陈龙
裴东
郭威彤
蔡莲红
-
机构
西北师范大学物理与电子工程学院
清华大学深圳研究生院
清华大学计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第36期139-143,167,共6页
-
基金
国家自然科学基金面上项目(No.60875015)
教育部科学研究重点项目(No.208146)~~
-
文摘
在文语转换系统中,从文本中预测出准确的韵律结构对于提高合成语音的自然度具有重要的作用。利用10 000句标注了词性标记的文本语料,在语言学专家的指导下,人工标注了语料的韵律词和韵律短语。选择了标注结果一致性最高的500句语句,标注了语法层级结构,并利用语法树高度描述语法词之间连接的紧密程度。通过分析韵律短语边界与语法结构的关系,发现韵律短语边界受语法树高度、语法词词性和语法词词长的影响,因此选择了这三个特征,利用TBL算法和400句训练语句训练了预测模型。测试集上的预测结果表明,提出的方法在小规模训练语料下,韵律短语预测的精确率达到了75.2%,召回率达到了77.1%,F-Score达到了76.1%。
-
关键词
韵律结构预测
语法结构
韵律短语
语法树高度
错误驱动的规则学习算法(TBL)
-
Keywords
prosodic structure prediction
syntax structure
prosodic phrase
height of syntax tree
Transformation-based Er-ror-driven Learning(TBL)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于层叠条件随机场的哈语树库构建技术研究
- 2
-
-
作者
于智娟
古丽拉.阿东别克
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第3期71-75,82,共6页
-
基金
国家自然科学基金项目(61063025
61363062)
-
文摘
针对如何提高基于统计的哈萨克语句法分析算法的处理性能问题,提出一种通过人机交互来构建哈萨克语树库的方法。在自动句法标注阶段,采用层叠条件随机场模型实现,并在其低层与高层模型之间加入改进的基于转换的错误驱动学习算法来进行简单句的自动句法标注及自动校正。最后对特殊的整体标记错误进行人工校对,形成基于短语结构的哈萨克语树库。实验结果表明,该方法在很大程度上减少了人力及物力的投入,提高了分析精度及整体处理效率,并为后期基于哈萨克语的句法机器翻译及文本挖掘奠定了一定的基础。
-
关键词
哈萨克语树库
人机交互
层叠条件随机场
错误驱动学习算法
-
Keywords
Kazakh treebank
Human-machine interaction
Cascade conditional random fields
Error-driven learning algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义角色的汉语韵律短语预测
- 3
-
-
作者
王柳渝
-
机构
重庆邮电大学自动化学院
-
出处
《广东通信技术》
2017年第1期67-69,79,共4页
-
文摘
韵律结构层级中的韵律短语是体现文本节奏感和语义完整性的关键所在。本文分析了汉语语义角色信息与韵律结构层级的关系,并对语义角色分析结果进行语义角色特征提取,将语义角色特征作为深层韵律预测特征与浅层语法特征相结合,采用TBL算法实现对韵律短语层级的预测。实验结果证明,采用语义角色特征作为韵律预测特征,能够提高韵律短语层级预测的准确度,比浅层语法的精度提高了15.5%。比其他句法特征的精度提高了14%。
-
关键词
语义角色
韵律短语
基于错误驱动的规则学习算法
语音合成
-
分类号
TN912.33
[电子电信—通信与信息系统]
-