针对长尾问题的二重加权多音字消歧算法被引量：2

Double-Weighted Disambiguation Algorithm for Long-tail Polyphone Problem

下载PDF

导出

摘要数据的长尾分布问题是NLP实践领域中的常见问题。以语音合成前端的多音字消歧任务为例,多音字数据的极度不均衡、尾部数据的缺乏,影响着语音合成系统的工业实用效果。该文观察到,汉语多音字的分布在“字符”与“字音”两个维度上都呈长尾特性,因此该文针对性地提出一种二重加权算法(Double Weighted,DW)。DW算法可分别与两种长尾算法:MARC,Decouple-cRT结合,进一步提升模型性能。在开源数据和工业数据上,DW算法较基线模型和两种原始算法取得了不同程度的准确率提升,为多维长尾问题提供解决方案与借鉴思路。 The problem of long-tail distributed data is common in NLP practice.Taking the polyphone disambiguation task in text-to-speech(TTS)as an example,the extreme data imbalance and the lack of tail data affect industrial online TTS applications.Observging that the Chinese polyphone is long-tail distributed on both“character”and“pronunciation”dimensions,this paper proposes a double-weighted(DW)algorithm,which can be combined with the other two long-tail algorithms:MARC and Decouple-cRT.Given the perspectives of both open-source data and industrial data,DW demonstrates improvement in accuracy compared to the baseline model and the two original algorithms.

作者高羽熊一瑾叶建成 GAO Yu;XIONG Yijin;YE Jiancheng(AI Innovation Center,Midea Group(Shanghai)Co.,Ltd.,Shanghai 201702,China)

机构地区美的集团(上海)有限公司AI创新中心

出处《中文信息学报》 CSCD 北大核心 2022年第11期169-176,共8页 Journal of Chinese Information Processing

关键词多音字消歧长尾分布重加权解耦特征与分类器 polyphone disambiguation long-tail distribution re-weighting decouple representation and classifier

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘方舟,周游.用决策树指导TBL进行多音字消歧[J].计算机工程与应用,2011,47(12):137-140. 被引量：2
2张子荣,初敏.解决多音字字-音转换的一种统计学习方法[J].中文信息学报,2002,16(3):39-45. 被引量：10

二级参考文献12

1郭进.统计语言模型及汉语音字转换的一些新结果[J].中文信息学报,1993,7(1):18-27. 被引量：17
2Yarowaky D.Homograph disambiguation in speech synthesis[M]//Santen J,Sproat R,Olive J,et al.Progress in speech synthesis.New York:Springer-Verlag,1996:159-175.
3Wang Wern-jun,Hwang Shaw-hwa,Chen Sin-horag.The broad study of homograph disambiguity for mandarin speech synthesis[C]//Proc 4th International Conference on Spoken Language Processing,Philadelphia,1996:1389-1392.
4Zhang Zi-rong,Chu Min.An efficient way to learn rules for grapheme-to-phoneme conversion in Chinese[C]//Proc 3rd International Symposium on Chinese Spokon Language Processing,Taipci,2002:233-236.
5胡国平,陈志刚,王仁华.基于规则及 SVM 权值训练的汉语多音字自动消歧研究[C]//Proc 20th International Conference on Computer Processing of Oriental Languages,Shonyang,2003:599-605.
6Zheng Min,Shi Qin.Grapheme-to-phoneme conversion based on TBL algorithm in Mandarin TTS system[C]//Proc 6th Annual Conference of the International Speech Communication Association,Lisbon,2005:1897-1900.
7Brill E.Tranformation-based error-driven learning and natural language processing:A case study in part of speech tagging[J].Computational Linguistics,1995,21(4):543-565.
8Ramshaw L,Marcus M.Text chunking using transformation-based lesming[M]//Armstrong S,Church K,Isabelle P,et al.Natural language processing using very large corpora.Dordrecht:Kluwer Academic Publishers,1999:82-94.
9Brill E.Learning to parse with transformations[M]//Bunt H,Tomita M.Recent advances in parsing technology.Dordrecht:Kluwer Academic Pubfishers,1996:221-240.
10潘以锋.计算机在汉字自动注音中的应用[J].上海师范大学学报（自然科学版）,1996,25(4):54-58. 被引量：2

共引文献10

1任慧玲 ,胡铁军 ,李丹亚 ,杨滨 ,诸文雁 ,钱庆 ,李军莲 ,王闰强 ,庞景安 .中文期刊文献数字对象唯一标识符的研究[J].情报学报,2004,23(4):437-443. 被引量：12
2范明,胡国平,王仁华.汉语字音转换中的多层面多音字读音消歧[J].计算机工程与应用,2006,42(2):167-170. 被引量：1
3姜维,关毅,王晓龙,刘秉权.基于支持向量机的音字转换模型[J].中文信息学报,2007,21(2):100-105. 被引量：6
4王洁,宋柔.字音转换策略介绍及性能代价评估[J].计算机工程与应用,2007,43(16):26-29.
5赖兴邦.宋词字-音转换中多音字处理研究[J].福建电脑,2008,24(5):105-106.
6王彩琴.读错字的危害及避免读错字的对策[J].洛阳理工学院学报（社会科学版）,2010,25(5):8-10. 被引量：1
7唐建宇.一种多音字的计算机自动注音方法[J].电子技术与软件工程,2013(18):220-220.
8拉巴顿珠,欧珠,祖漪清,裴春宝.藏语同形异音词的消歧方法研究[J].中文信息学报,2018,32(7):58-66. 被引量：3
9刘新红,吴树兴.汉语语音合成系统中影响合成自然度的主要技术因素探析[J].消费电子,2020(11):94-95.
10高贝贝,张仰森.基于预训练模型的多音字消歧方法[J].计算机科学,2024,51(11):273-279.

同被引文献4

1化柏林.知识抽取中的停用词处理技术[J].现代图书情报技术,2007(8):48-51. 被引量：39
2刘方舟,周游.用决策树指导TBL进行多音字消歧[J].计算机工程与应用,2011,47(12):137-140. 被引量：2
3奥德玛,杨云飞,穗志方,代达劢,常宝宝,李素建,昝红英.中文医学知识图谱CMeKG构建初探[J].中文信息学报,2019,33(10):1-9. 被引量：60
4陶源,彭艳兵.基于门控CNN-CRF的中文命名实体识别[J].电子设计工程,2020,28(4):42-46. 被引量：11

引证文献2

1赵立君,张军雁,何倩,庄严,郭锐.医学语言模型研究[J].长江信息通信,2023,36(11):1-7. 被引量：1
2高贝贝,张仰森.基于预训练模型的多音字消歧方法[J].计算机科学,2024,51(11):273-279.

二级引证文献1

1林岚,武雨桐.大型语言模型在医疗领域的应用现状与展望[J].医疗卫生装备,2024,45(8):102-109.

1姚红娟,赵小强,李炜,惠永永.基于双权重多邻域保持嵌入的间歇过程故障检测[J].控制与决策,2021,36(12):3023-3030. 被引量：4
2刘春磊,陈天恩,王聪,姜舒文,陈栋.小样本目标检测研究综述[J].计算机科学与探索,2023,17(1):53-73. 被引量：14
3李诗杨,殷彩琴,周楠,唐国锋,石全胜.“互联网+”背景下孤儿药可及性提升策略研究——基于长尾效应[J].卫生经济研究,2022,39(9):49-52. 被引量：2
4吴天怡.互动式元话语在高考英语写作中的应用探究[J].英语广场（学术研究）,2022(35):134-136.
5宋煜阳.几何直观素养表现与表现性任务设计[J].小学教学参考,2022(29):8-12. 被引量：1
6慕欣汝.ART DECO风格在室内装饰设计中的应用[J].设计,2022,35(23):38-41.
7王红.提升小学高段语文课堂教学质量[J].人民教育,2022(23):79-79.
8Zahida Perveen,Zulfiqar Ahmed,Munir Ahmad.On Size-Biased Double Weighted Exponential Distribution (SDWED)[J].Open Journal of Statistics,2016,6(5):917-930.
9王玉兵.高中数学“数形结合”的运用解析——以“二次函数根的分布”为例[J].数学之友,2022,36(24):37-40. 被引量：3
10张夏恒,肖林.我国跨境电子商务研究演化及趋势(2012—2021)[J].渭南师范学院学报,2022,37(12):74-81. 被引量：2

中文信息学报

2022年第11期

浏览历史

内容加载中请稍等...

针对长尾问题的二重加权多音字消歧算法被引量：2

参考文献2

二级参考文献12

共引文献10

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

针对长尾问题的二重加权多音字消歧算法 被引量：2

参考文献2

二级参考文献12

共引文献10

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

针对长尾问题的二重加权多音字消歧算法被引量：2