-
题名融合多情感的语音驱动虚拟说话人生成方法
- 1
-
-
作者
李帅帅
何向真
张跃洲
王嘉欣
-
机构
西北民族大学语言与文化计算教育部重点实验室
西北民族大学甘肃省民族语言文化智能信息处理重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第8期2546-2553,共8页
-
基金
国家自然科学基金资助项目(62341209)
甘肃省教育教学成果培育项目(2023GSJXCGPY-60)
中央高校基本科研业务费专项资金资助项目(31920230054)。
-
文摘
虚拟说话人生成是人工智能领域的一个重要研究方向,旨在通过计算机生成具有逼真语音的虚拟说话人。然而,现有方法往往忽视情绪表达、生成的人脸图像面部细节缺乏真实感,限制了虚拟说话人的表现能力和交互性。为解决这一问题,提出一种基于Transformer的生成对抗网络(generative adversarial network,GAN)方法,用于生成具有不同情绪的虚拟说话人(GANLTB)。该方法基于GAN架构,生成器采用Transformer模型处理语音和图像特征,结合情绪条件信息和潜在空间向量,生成带有指定情绪的语音和图像。判别器用于评估生成结果的真实性,并提供梯度信号指导生成器训练。通过引入双三次插值法,进一步提升了虚拟说话人生成的图像质量,使得虚拟说话人的面部细节更加清晰可见,表情更加自然和生动。使用情感多样性数据集(CREMA-D)验证了该方法,通过主观评估和客观指标,评估了生成的语音和图像的情绪表达能力和质量。实验结果表明,该方法能够生成具有多样化和逼真情绪表达的虚拟说话人。相比目前其他先进方法,所提方法在流畅度和逼真度等细节上都更加清晰,带来了更好的真实感。
-
关键词
虚拟说话人
生成对抗网络
TRANSFORMER
多情感表达
语音驱动
-
Keywords
virtual speaker
GAN
Transformer
multi-emotion expression
voice-driven
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名虚拟聊天机器人拟人化特征对用户接受的影响
- 2
-
-
作者
刘雨
操雅琴
-
机构
安徽工程大学经济与管理学院
-
出处
《人类工效学》
2023年第1期8-15,共8页
-
基金
国家自然科学基金青年项目(71701003,71801002)
2021年度安徽高校自然科学研究重点项目(KJ2021A0502)
2021年度安徽省社会科学创新发展攻关研究课题(2021CX075)。
-
文摘
目的探讨虚拟聊天机器人拟人化的特征以及拟人化特征如何影响用户对虚拟聊天机器人的接受意愿。方法采用因子分析、多因素方差分析、多元线性回归分析、机器学习(BP神经网络和支持向量SVM)等方法对500名用户的问卷调查数据进行统计分析。结果虚拟聊天机器人拟人化特征(外观拟人化和对话拟人化)对感知社会性、感知相似性、感知逻辑性、感知对话性产生显著影响;虚拟聊天机器人的拟人化特征越显著,用户心理感知越高,进而情感体验越趋向于积极,用户的接受意愿越强烈;能够利用四个拟人化感知因子对虚拟聊天机器人拟人化程度进行分类,并预测用户对虚拟聊天机器人的接受意愿。结论虚拟聊天机器人拟人化感知的高低会影响情感体验的积极性,从而影响用户对虚拟聊天机器人的接受意愿,研究为未来设计虚拟聊天机器人拟人化特征提供了参考。
-
关键词
人机交互
智能音箱
语音识别
元宇宙
虚拟聊天机器人
拟人化特征
情感体验
用户接受
-
Keywords
man-machine interaction
smart speaker
speech recognition
mataverse
virtual chatbot
anthropomorphic characteristics
emotional experience
user acceptance
-
分类号
C939
[经济管理—管理学]
C93
[经济管理—管理学]
-
-
题名小型扬声器感知低音的生成算法优化
- 3
-
-
作者
宋亮
林凡瑞
张婧颖
谢凌云
-
机构
中国传媒大学传播声学研究所
-
出处
《电声技术》
2016年第5期19-21,34,共4页
-
文摘
虚拟低音技术针对扬声器低频重放问题提供了一种较好的处理方式,其建立在"虚拟音高"理论基础上,将扬声器输入信号在不能重放的低频部分利用其高次谐波成分在听感上虚拟出基频音高。考虑到小型扬声器频带窄、失真大等特性,在虚拟低音的相位声码器算法基础上,用二阶求导的方式对频谱低频峰值进行取点,对不同频段生成不同的谐波个数,简化幅度控制,提出适合于小型扬声器的低音谐波生成模块优化算法并实现。主观实验结果表明改进后的算法在增强低音效果的同时也能保证较好的整体音质效果。
-
关键词
小型扬声器
虚拟低音
相位声码器
-
Keywords
small speakers
virtual bass
phase voeoder
-
分类号
TN643
[电子电信—电路与系统]
-
-
题名浅析虚拟扬声器技术
- 4
-
-
作者
罗颖
-
机构
广州广播电视台制作部
-
出处
《演艺科技》
2011年第8期16-19,共4页
-
文摘
分析虚拟扬声器技术的原理,介绍应用实例。
-
关键词
虚拟扬声器技术
扬声器系统
声场
信号
-
Keywords
virtual speaker
speaker system
sound field
signal
-
分类号
TN643
[电子电信—电路与系统]
-