期刊文献+
共找到10,408篇文章
< 1 2 250 >
每页显示 20 50 100
Attention-Enhanced Voice Portrait Model Using Generative Adversarial Network
1
作者 Jingyi Mao Yuchen Zhou +3 位作者 YifanWang Junyu Li Ziqing Liu Fanliang Bu 《Computers, Materials & Continua》 SCIE EI 2024年第4期837-855,共19页
Voice portrait technology has explored and established the relationship between speakers’ voices and their facialfeatures, aiming to generate corresponding facial characteristics by providing the voice of an unknown ... Voice portrait technology has explored and established the relationship between speakers’ voices and their facialfeatures, aiming to generate corresponding facial characteristics by providing the voice of an unknown speaker.Due to its powerful advantages in image generation, Generative Adversarial Networks (GANs) have now beenwidely applied across various fields. The existing Voice2Face methods for voice portraits are primarily based onGANs trained on voice-face paired datasets. However, voice portrait models solely constructed on GANs facelimitations in image generation quality and struggle to maintain facial similarity. Additionally, the training processis relatively unstable, thereby affecting the overall generative performance of the model. To overcome the abovechallenges,wepropose a novel deepGenerativeAdversarialNetworkmodel for audio-visual synthesis, namedAVPGAN(Attention-enhanced Voice Portrait Model using Generative Adversarial Network). This model is based ona convolutional attention mechanism and is capable of generating corresponding facial images from the voice ofan unknown speaker. Firstly, to address the issue of training instability, we integrate convolutional neural networkswith deep GANs. In the network architecture, we apply spectral normalization to constrain the variation of thediscriminator, preventing issues such as mode collapse. Secondly, to enhance the model’s ability to extract relevantfeatures between the two modalities, we propose a voice portrait model based on convolutional attention. Thismodel learns the mapping relationship between voice and facial features in a common space from both channeland spatial dimensions independently. Thirdly, to enhance the quality of generated faces, we have incorporated adegradation removal module and utilized pretrained facial GANs as facial priors to repair and enhance the clarityof the generated facial images. Experimental results demonstrate that our AVP-GAN achieved a cosine similarity of0.511, outperforming the performance of our comparison model, and effectively achieved the generation of highqualityfacial images corresponding to a speaker’s voice. 展开更多
关键词 Cross-modal generation GANs voice portrait technology face synthesis
下载PDF
Fuzzy Proportional Integral Derivative control of a voice coil actuator system for adaptive deformable mirrors
2
作者 Ziqiang Cui Heng Zuo +4 位作者 Weikang Qiao Hao Li Fujia Du Yifan Wang Jinrui Guo 《Astronomical Techniques and Instruments》 CSCD 2024年第3期179-186,共8页
Research on adaptive deformable mirror technology for voice coil actuators(VCAs)is an important trend in the development of large ground-based telescopes.A voice coil adaptive deformable mirror contains a large number... Research on adaptive deformable mirror technology for voice coil actuators(VCAs)is an important trend in the development of large ground-based telescopes.A voice coil adaptive deformable mirror contains a large number of actuators,and there are problems with structural coupling and large temperature increases in their internal coils.Additionally,parameters of the traditional proportional integral derivative(PID)control cannot be adjusted in real-time to adapt to system changes.These problems can be addressed by introducing fuzzy control methods.A table lookup method is adopted to replace real-time calculations of the regular fuzzy controller during the control process,and a prototype platform has been established to verify the effectiveness and robustness of this process.Experimental tests compare the control performance of traditional and fuzzy proportional integral derivative(Fuzzy-PID)controllers,showing that,in system step response tests,the fuzzy control system reduces rise time by 20.25%,decreases overshoot by 78.24%,and shortens settling time by 67.59%.In disturbance rejection experiments,fuzzy control achieves a 46.09%reduction in the maximum deviation,indicating stronger robustness.The Fuzzy-PID controller,based on table lookup,outperforms the standard controller significantly,showing excellent potential for enhancing the dynamic performance and disturbance rejection capability of the voice coil motor actuator system. 展开更多
关键词 Adaptive optics Deformable mirror voice coil actuator Fuzzy control
下载PDF
Classification research of TCM pulse conditions based on multi-label voice analysis
3
作者 Haoran Shen Junjie Cao +5 位作者 Lin Zhang Jing Li Jianghong Liu Zhiyuan Chu Shifeng Wang Yanjiang Qiao 《Journal of Traditional Chinese Medical Sciences》 CAS 2024年第2期172-179,共8页
Objective:To explore the feasibility of remotely obtaining complex information on traditional Chinese medicine(TCM)pulse conditions through voice signals.Methods: We used multi-label pulse conditions as the entry poin... Objective:To explore the feasibility of remotely obtaining complex information on traditional Chinese medicine(TCM)pulse conditions through voice signals.Methods: We used multi-label pulse conditions as the entry point and modeled and analyzed TCM pulse diagnosis by combining voice analysis and machine learning.Audio features were extracted from voice recordings in the TCM pulse condition dataset.The obtained features were combined with information from tongue and facial diagnoses.A multi-label pulse condition voice classification DNN model was built using 10-fold cross-validation,and the modeling methods were validated using publicly available datasets.Results: The analysis showed that the proposed method achieved an accuracy of 92.59%on the public dataset.The accuracies of the three single-label pulse manifestation models in the test set were 94.27%,96.35%,and 95.39%.The absolute accuracy of the multi-label model was 92.74%.Conclusion: Voice data analysis may serve as a remote adjunct to the TCM diagnostic method for pulse condition assessment. 展开更多
关键词 Pulse conditions TCM pulse diagnosis voice analysis Multi-label classification Machine learning
下载PDF
All Voices Should Be Heard and Heeded in a True Democracy
4
作者 ZHANG HUI 《China Today》 2024年第5期46-49,共4页
For all its different forms,democracy is expected to promote people’s well-being,instead of being weaponized to justify hegemony,as democracy is also a principle of global governance.
关键词 TRUE voice SHOULD
下载PDF
面向5G用户的VoWiFi解决方案及网络建设方案研究
5
作者 朱志弘 《通信与信息技术》 2024年第5期80-84,94,共6页
全面阐述面向5G用户的VoWiFi解决方案,包括网络架构、网元功能和接口、系统流程,介绍业务开通、用户鉴权、系统间切换、用户漫游、业务计费等关键技术。探讨VoWiFi的网络建设方案,包括网元设置和部署方案等内容。
关键词 vowifi 解决方案 建设方案
下载PDF
Raising the Chinese Voice
6
作者 MENG JIAXIN 《China Today》 2024年第10期74-75,共2页
As China celebrates the 40th anniversary of joining the International Atomic Energy Agency,an expert talks about how her organization is nurturing talents for overseas projects.
关键词 voice OVERSEAS ANNIVERSARY
下载PDF
Young Voices for a Better Future
7
作者 Guo Xixian Chang Xiang 《China Report ASEAN》 2024年第10期58-59,共2页
On September 4,the"Strengthening Youth Exchange to Build a Friendly Future"China-Laos Youth Dialogue was held at the National University of Laos (NUOL) in Vientiane with an aim to consolidate bilateral frien... On September 4,the"Strengthening Youth Exchange to Build a Friendly Future"China-Laos Youth Dialogue was held at the National University of Laos (NUOL) in Vientiane with an aim to consolidate bilateral friendship,promote the building of a ChinaLaos community with a shared future,and strengthen exchanges and cooperation between the youth of both countries. 展开更多
关键词 voice YOUTH FUTURE
下载PDF
Greater Voice for Global South
8
作者 MAHASHA RAMPEDI 《ChinAfrica》 2024年第1期37-37,共1页
The African Union's(AU)admission as a new G20 member is a diplomatic breakthrough and a major step towards a more balanced world order in favour of the developing nations.In September,the G20 Summit in Delhi,India... The African Union's(AU)admission as a new G20 member is a diplomatic breakthrough and a major step towards a more balanced world order in favour of the developing nations.In September,the G20 Summit in Delhi,India,accepted the AU as its new member,giving the continent a greater voice in the global economic affairs. 展开更多
关键词 BREAKTHROUGH voice AFFAIRS
下载PDF
视听翻译模式Voice-over的研究综述
9
作者 雷静 华方源 《语言与文化研究》 2024年第3期103-108,共6页
本文聚焦视听翻译模式Voice-over,分析了国内外发表于翻译研究相关学术期刊上的相关学术论文,探讨国内外Voice-over模式的具体概念、发展阶段与应用领域等问题,认为国内外翻译研究界对Voice-over这一视听翻译模式的整体关注度不高,但近... 本文聚焦视听翻译模式Voice-over,分析了国内外发表于翻译研究相关学术期刊上的相关学术论文,探讨国内外Voice-over模式的具体概念、发展阶段与应用领域等问题,认为国内外翻译研究界对Voice-over这一视听翻译模式的整体关注度不高,但近年来有增强的趋势;该模式除了应用于视听翻译领域外,开始应用于其他领域;学科意识逐渐增强,呈现多学科互相促进之势。本文对Voice-over模式的发展阶段、分类研究与国内研究现状做出了整理,以期为国内该模式的研究发展有所助益。 展开更多
关键词 视听翻译模式 发展动态 研究综述 画外音
下载PDF
农用车辆导航系统语音控制功能的实现——基于汉语言声学特征
10
作者 鲁和英 《农机化研究》 北大核心 2025年第4期264-268,共5页
随着先进技术的应用,农用车辆在农业生产中发挥着重要作用。为此,将汉语言声学特征的语音控制应用在农用车辆导航系统中,通过集成讯飞语音云实现安静和嘈杂两种环境下对导航系统的实时控制。实验结果表明:语音识别正确率很高,平均达到了... 随着先进技术的应用,农用车辆在农业生产中发挥着重要作用。为此,将汉语言声学特征的语音控制应用在农用车辆导航系统中,通过集成讯飞语音云实现安静和嘈杂两种环境下对导航系统的实时控制。实验结果表明:语音识别正确率很高,平均达到了93.17%,具有较高的实用价值和推广价值。 展开更多
关键词 农用车辆 导航 汉语言声学特征 语音控制 人工智能
下载PDF
基于SoPC的“电子系统设计”课程实验教学案例设计
11
作者 董胜 赵莹 +2 位作者 孟祥 邢砾云 贾雁飞 《科技风》 2025年第2期110-112,共3页
利用FPGA构建了SoPC,移植了uC/OS-II操作系统,实现了基于无刷直流电机的小风扇转速智能控制系统的硬件和软件设计;利用DS18B20温度传感器采集环境温度,根据环境温度自动控制电机的转速;利用HC-SR04超声波模块测量物体距离,实现了物体接... 利用FPGA构建了SoPC,移植了uC/OS-II操作系统,实现了基于无刷直流电机的小风扇转速智能控制系统的硬件和软件设计;利用DS18B20温度传感器采集环境温度,根据环境温度自动控制电机的转速;利用HC-SR04超声波模块测量物体距离,实现了物体接近风扇到8cm距离时,无刷直流电机自动限速,同时蜂鸣器报警;利用SU-03T语音识别模块实现了语音控制电机转速;通过FPGA与STM32F103C8T6单片机控制的Wi-Fi模块串口通信,实现将环境温度、风扇转速、距离报警信号、电机旋转方向数据上传到阿里云。 展开更多
关键词 SOPC UC/OS-II 无刷直流电机 语音识别 阿里云
下载PDF
运营商VoWiFi策略与优势分析 被引量:9
12
作者 刘牧寅 马瑞涛 +2 位作者 符刚 薛淼 吕光旭 《邮电设计技术》 2016年第6期7-11,共5页
通过对VoWiFi出现的背景及现有的3种Wi-Fi语音类业务方案进行分析比较,对现有运营商VoWiFi商用案例进行分析总结,提出了运营商VoWiFi的定义和典型特征。并对运营商部署VoWiFi的必要性、可行性、优势和价值,以及产业链成熟度进行了分析... 通过对VoWiFi出现的背景及现有的3种Wi-Fi语音类业务方案进行分析比较,对现有运营商VoWiFi商用案例进行分析总结,提出了运营商VoWiFi的定义和典型特征。并对运营商部署VoWiFi的必要性、可行性、优势和价值,以及产业链成熟度进行了分析。对运营商VoWiFi的部署策略、实现方式和发展趋势进行了阐述,对VoWiFi计费策略和应用场景等方面进行了分析和探讨。最后,对未来运营商VoWiFi的部署进行了展望。 展开更多
关键词 vowifi IMS WLAN WI-FI CALLING
下载PDF
基于VoiceXML的语音电子邮件系统的设计 被引量:4
13
作者 吴英 徐敬东 吴功宜 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期122-124,共3页
设计的语音电子邮件系统将传统的电子邮件服务扩展到有线或无线、固定或移动电话系统,使用户可以通过普通的电话来方便地接收自己的电子邮件。该文对基于VoiceXML标准的语音电子邮件系统开发进行了探讨,并对语音电子邮件网关的设计进行... 设计的语音电子邮件系统将传统的电子邮件服务扩展到有线或无线、固定或移动电话系统,使用户可以通过普通的电话来方便地接收自己的电子邮件。该文对基于VoiceXML标准的语音电子邮件系统开发进行了探讨,并对语音电子邮件网关的设计进行了深入的研究。 展开更多
关键词 语音电子邮件 voice XML POP3
下载PDF
VoWiFi与VoLTE的协同策略研究 被引量:6
14
作者 崔沛东 戴国华 张婷 《移动通信》 2016年第8期31-35,共5页
介绍了部分运营商商用Vo Wi Fi的现状及部署策略,对VoWiFi与VoLTE协同的关键技术也做了介绍。对VoWiFi商用以及与VoLTE协同互操作存在的问题进行了分析,并给出了相应的策略建议。
关键词 vowifi VoLTE 切换
下载PDF
VoiceXML语音平台缓存技术综述 被引量:3
15
作者 王文林 廖建新 朱晓民 《通信学报》 EI CSCD 北大核心 2007年第2期101-108,共8页
论述了VoiceXML(voice extensible markup language)语音平台缓存系统的基本要素及理想特性,介绍了VoiceXML语音平台与WWW环境的异同,分析了目前WWW缓存技术中缓存内容选择、缓存替换算法、缓存一致性控制以及内容预取等方面的研究情况... 论述了VoiceXML(voice extensible markup language)语音平台缓存系统的基本要素及理想特性,介绍了VoiceXML语音平台与WWW环境的异同,分析了目前WWW缓存技术中缓存内容选择、缓存替换算法、缓存一致性控制以及内容预取等方面的研究情况及其在VoiceXML语音平台中的应用,最后给出了VoiceXML语音平台中的缓存技术需要进一步研究的问题。 展开更多
关键词 语音平台 voiceXML 缓存 缓存替换
下载PDF
“voice”互动模型下学术语篇中的“声音”解读 被引量:2
16
作者 刘秋成 梁慧 《巢湖学院学报》 2017年第5期99-103,共5页
声音是学术语篇的基本特征,是作者在学术界实现身份认可、交流的重要渠道。文章以Hyland的"voice"互动模型为基础,以学术语篇中声音构建的语言手段为切入点,分析了学术语篇中作者的声音和读者的声音内在的关系及功能。研究发... 声音是学术语篇的基本特征,是作者在学术界实现身份认可、交流的重要渠道。文章以Hyland的"voice"互动模型为基础,以学术语篇中声音构建的语言手段为切入点,分析了学术语篇中作者的声音和读者的声音内在的关系及功能。研究发现:作者的声音与读者的声音在语篇层面存在互动并相互制约,且以作者的声音为主导,进而形成学术语篇的论点。 展开更多
关键词 学术语篇 声音 voice”互动模型
下载PDF
基于VoiceXML的语音信息发布模式 被引量:1
17
作者 杨喜权 韩正服 +1 位作者 石丹 丛荣华 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第6期935-938,共4页
探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务.在Tellme Stud io为开发平台下,利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合,实现W eb天气信息实时语音交互查询,提出了一种基于Vo... 探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务.在Tellme Stud io为开发平台下,利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合,实现W eb天气信息实时语音交互查询,提出了一种基于VoiceXML标准的天气信息语音发布模式. 展开更多
关键词 语音扩展描述语言 语音网关 可扩展样式语言 语音信息发布
下载PDF
基于VoiceXML的语音交互平台的设计与实现 被引量:4
18
作者 庾锡昌 刘伟平 +1 位作者 武晋 黄红斌 《计算机工程与设计》 CSCD 北大核心 2007年第8期1969-1972,共4页
设计并实现了一种基于VoiceXML(voice extensible markup language)的呼叫中心语音交互平台。该平台以OpenVXI开源项目的VoiceXML解析器为核心,以C/S三层结构框架来设计,在集成了杭州三汇语音板卡的基础上实现了语音合成、语音识别、呼... 设计并实现了一种基于VoiceXML(voice extensible markup language)的呼叫中心语音交互平台。该平台以OpenVXI开源项目的VoiceXML解析器为核心,以C/S三层结构框架来设计,在集成了杭州三汇语音板卡的基础上实现了语音合成、语音识别、呼叫处理等呼叫中心的基本功能。利用该平台,电信运营商不仅能方便地建立呼叫中心,而且可以联合SP/CP(service provider/content provider)推出各种语音增值业务。介绍了该平台的总体架构设计,并详细讲述关键技术的实现,最后给出了系统测试实例及其运行结果。 展开更多
关键词 语音可扩展标记语言 呼叫中心 解析器 互动式语音应答 三汇语音卡
下载PDF
基于Voice XML技术的信息服务集成 被引量:6
19
作者 舒挺 张国煊 《计算机应用》 CSCD 北大核心 2003年第6期114-116,共3页
分析了当前信息服务平台的现状与不足,介绍了新兴的VoiceXML技术和基于该项技术的语音应用开发模式,提出了构建相应信息服务集成平台的新框架,同时给出了实现基于该项技术的语音信箱和呼叫转移功能的核心代码段。
关键词 voiceXML 呼叫中心 统一消息 语音浏览器
下载PDF
基于VoiceXML的语音增值业务平台的架构设计 被引量:1
20
作者 王文林 廖建新 +1 位作者 王纯 朱晓民 《计算机工程》 CAS CSCD 北大核心 2007年第12期256-258,261,共4页
目前语音增值业务发展迅速,但还缺乏统一的规范。该文设计了一个基于VoiceXML(Voice Extensible Markup Language)的语音增值业务平台的架构,规范了语音增值业务的开发、管理界面,讨论了语音增值业务执行平台和语音增值业务管理平台的... 目前语音增值业务发展迅速,但还缺乏统一的规范。该文设计了一个基于VoiceXML(Voice Extensible Markup Language)的语音增值业务平台的架构,规范了语音增值业务的开发、管理界面,讨论了语音增值业务执行平台和语音增值业务管理平台的功能和结构,着重分析了在此架构上实现业务的几个关键流程,并将此架构和目前IVR(Interactive Voice Response)平台进行了比较。 展开更多
关键词 语音增值业务 VocieXML 语音增值业务平台 语音增值业务执行平台 语音增值业务管理平台
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部