-
题名基于语块和条件随机场(CRFs)的韵律短语识别
被引量:6
- 1
-
-
作者
钱揖丽
冯志茹
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2014年第5期32-38,共7页
-
基金
国家自然科学青年基金(61005053
61100138)
+3 种基金
山西省青年科技研究基金(2012021012-1)
山西省高校科技开发项目(20091001)
山西省自然科学基金(2011011016-2)
山西省回国留学人员科研资助项目(2013-022)
-
文摘
该文提出一种基于汉语语块这一浅层句法信息,并利用条件随机场模型的中文文本韵律短语边界预测方法。首先介绍语块的定义和标注算法,然后在进行了语块结构标注以及归并处理的语料上,利用CRFs算法生成相应模型对韵律短语进行识别。实验结果表明,基于语块信息的CRFs韵律短语识别模型的识别效果优于不利用语块结构的模型,其F值平均能够提高约十个百分点。
-
关键词
韵律短语
边界预测
语块结构
条件随机场
-
Keywords
prosodic phrase
boundary prediction
chinese chunk
CRFs
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于韵律特征和语法信息的韵律边界检测模型
被引量:7
- 2
-
-
作者
吴晓如
王仁华
刘庆峰
-
机构
中国科学技术大学电子工程与信息科学系
-
出处
《中文信息学报》
CSCD
北大核心
2003年第5期48-54,共7页
-
文摘
韵律短语边界的自动检测,对语音合成中语料库的韵律标注以及语音识别中韵律短语的自动划分都有重要意义。本文通过对影响韵律短语边界的声学、韵律等参量的分析,得到和韵律短语边界关联性较大的一组声学特征参数、韵律环境参数和语法信息;同时引入语音合成中的韵律预测思想,在假定所有音节边界均为非韵律短语边界时,预测每个音节的基频。最后使用决策树模型,将音节边界处的韵律环境信息、语法信息以及预测结果作为决策树的输入,利用决策树综合判定当前音节边界是否为韵律短语的边界。实验表明,这种方法对于基于确定性文本(text dependent)的语音韵律短语边界的检测,具有较好效果,同时可以显著提高语音合成中语料库的标注效率和标注结果的一致性。
-
关键词
计算机应用
中文信息处理
韵律边界的自动检测
韵律预测
决策树
分类与回归树
-
Keywords
computer application
chinese information processing
automatic detection of prosodic boundary
prosody prediction
decision tree
CART
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的基于决策树的英文韵律短语边界预测方法
被引量:3
- 3
-
-
作者
张元平
凌震华
戴礼荣
刘庆峰
-
机构
中国科学技术大学电子工程与信息科学系
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第8期2921-2925,共5页
-
文摘
在英文语音合成系统中,韵律短语边界预测的精度对合成语音的自然度和可懂度有着至关重要的影响。基于决策树的预测方法是现阶段最为常用的韵律短语边界预测方法,但因决策树构建时受到数据平衡性制约,难以针对关键词进行建模,而且在基于决策树进行预测时采用了局部最优的搜索方式无法达到全局最优。所以,为了进一步提升韵律短语边界的预测效果,对基于决策树的预测方法进行了改进,引入韵律短语条件概率,使用Viterbi算法同时优化韵律短语边界概率和条件概率,并提出了基于关键词在韵律短语中的位置分布特性的决策树节点概率优化方法。实验表明,在基线系统上使用改进方法后,F-Score由68.7%提升到77.8%,而不可接受率从22.4%降低到15.2%。
-
关键词
语音合成
韵律短语
边界预测
决策树
位置分布
-
Keywords
speech synthesis
prosodic phrase
boundary prediction
decision tree
location distribution
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于神经元网络的汉语短语边界识别
被引量:6
- 4
-
-
作者
奚晨海
孙茂松
-
机构
清华大学智能技术与系统国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2002年第2期20-26,共7页
-
基金
国家重点基础研究发展规划项目的支持 (编号 :G19980 30 5 0 7)
-
文摘
短语边界的识别是浅层句法分析或组块分析的基础 ,对真实文本的处理具有重要意义。在一个含有 6 442 6词的汉语树库的支持下 ,本文设计并实现了基于神经元网络的汉语短语边界自动识别模型。初步实验结果显示 ,该模型的界定准确率为 93 2 4 % (封闭测试 )和 92 5 6 % (开放测试 )。
-
关键词
汉语短语边界自动识别
神经元网络
中文信息处理
浅层句法分析
组块分析
文字识别
-
Keywords
automatic prediction of chinese phrase boundary location
neural network
chinese information processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-