期刊文献+
共找到342篇文章
< 1 2 18 >
每页显示 20 50 100
Research on Multi-modal In-Vehicle Intelligent Personal Assistant Design
1
作者 WANG Jia-rou TANG Cheng-xin SHUAI Liang-ying 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第4期136-146,共11页
Intelligent personal assistants play a pivotal role in in-vehicle systems,significantly enhancing life efficiency,driving safety,and decision-making support.In this study,the multi-modal design elements of intelligent... Intelligent personal assistants play a pivotal role in in-vehicle systems,significantly enhancing life efficiency,driving safety,and decision-making support.In this study,the multi-modal design elements of intelligent personal assistants within the context of visual,auditory,and somatosensory interactions with drivers were discussed.Their impact on the driver’s psychological state through various modes such as visual imagery,voice interaction,and gesture interaction were explored.The study also introduced innovative designs for in-vehicle intelligent personal assistants,incorporating design principles such as driver-centricity,prioritizing passenger safety,and utilizing timely feedback as a criterion.Additionally,the study employed design methods like driver behavior research and driving situation analysis to enhance the emotional connection between drivers and their vehicles,ultimately improving driver satisfaction and trust. 展开更多
关键词 Intelligent personal assistants Multi-modal design User psychology in-vehicle interaction voice interaction Emotional design
下载PDF
“voice”互动模型下学术语篇中的“声音”解读 被引量:1
2
作者 刘秋成 梁慧 《巢湖学院学报》 2017年第5期99-103,共5页
声音是学术语篇的基本特征,是作者在学术界实现身份认可、交流的重要渠道。文章以Hyland的"voice"互动模型为基础,以学术语篇中声音构建的语言手段为切入点,分析了学术语篇中作者的声音和读者的声音内在的关系及功能。研究发... 声音是学术语篇的基本特征,是作者在学术界实现身份认可、交流的重要渠道。文章以Hyland的"voice"互动模型为基础,以学术语篇中声音构建的语言手段为切入点,分析了学术语篇中作者的声音和读者的声音内在的关系及功能。研究发现:作者的声音与读者的声音在语篇层面存在互动并相互制约,且以作者的声音为主导,进而形成学术语篇的论点。 展开更多
关键词 学术语篇 声音 voice”互动模型
下载PDF
基于VoiceXML的交互式语音应答系统
3
作者 吴丽杰 李红祥 杨圣春 《微计算机信息》 2010年第27期215-217,共3页
交互式语音应答(IVR)系统是呼叫中心的重要部分,控制整个业务流程。OpenVXI是开源的VoiceXML解释器。文章设计了一个基于OpenVXI的语音应答系统,然后介绍了一个具体的应用实例-安徽省公路桥梁养护呼叫中心系统。
关键词 OPEN VXI voiceXML语音 媒体资源控制协议 交互式语音应答 公路桥梁养护管理系统
下载PDF
基于多重互信息约束的高表现力语音转换
4
作者 王光 刘宗泽 +1 位作者 姜彦吉 董浩 《计算机系统应用》 2024年第9期216-225,共10页
随着语音转换在人机交互领域的广泛应用,对于获取高表现力语音的需求日益显著.当前语音转换主要通过解耦声学特征实现,侧重对内容和音色特征的解耦,很少考虑语音中混合的情感特性,导致转换音频情感表现力不足.为解决上述问题,本文提出... 随着语音转换在人机交互领域的广泛应用,对于获取高表现力语音的需求日益显著.当前语音转换主要通过解耦声学特征实现,侧重对内容和音色特征的解耦,很少考虑语音中混合的情感特性,导致转换音频情感表现力不足.为解决上述问题,本文提出一种基于多重互信息约束的高表现力语音转换模型(MMIC-EVC).在对内容和音色特征进行解耦的基础上,引入表现力模块分别对话语级韵律和节奏特征进行建模,以实现情感特性的传递;随后通过最小化各特征之间的多重互信息变分对数上界,约束各编码器专注于解耦对应的声学嵌入.在CSTR-VCTK和ESD语音数据集上的实验表明,本模型的转换音频语音自然度评分(MOS)达到3.78,梅尔倒谱失真为5.39 dB,最佳最差占比测试结果大幅领先于基线模型,MMIC-EVC能够有效解耦韵律和节奏特征,并实现高表现力语音转换,为人机交互带来更加出色和自然的用户体验. 展开更多
关键词 语音转换 特征解耦 互信息约束 韵律建模 人机交互
下载PDF
基于主动交互的适老家居语音交互设计——以智能音箱为例
5
作者 祝莹 甄皓然 《创意与设计》 2024年第1期38-47,共10页
从主动交互发展及应用现状出发,对老年用户的认知特征进行分析,探索将主动交互应用在智能家居产品语音交互的设计途径。针对传统语音交互下老年用户的认知负担,明确主动交互对于老年用户的价值。通过对老年用户的实际调研,收窄智能音箱... 从主动交互发展及应用现状出发,对老年用户的认知特征进行分析,探索将主动交互应用在智能家居产品语音交互的设计途径。针对传统语音交互下老年用户的认知负担,明确主动交互对于老年用户的价值。通过对老年用户的实际调研,收窄智能音箱语音功能的范围,基于主动交互进行语音交互的创新设计,提出主动交互下适老化智能音箱的交互策略,解决了老年人在传统被动交互中存在的认知成本高、负荷大的问题,同时为智能家居语音交互提供了设计思路与流程参考。 展开更多
关键词 主动交互 语音交互 适老化 智能音箱
下载PDF
基于原子设计理论的车载智能语音交互设计方法初探
6
作者 刘学 廖子岑 《创意与设计》 2024年第4期46-52,共7页
本文根据当前智能座舱以及智能语音交互技术与特征,引入原子设计理论,梳理了原子设计及设计系统相关理论中的重要概念,并将相关理论的核心框架与智能语音交互场景相融合,在语音交互背景下对原子设计理论中的要素层次进行了重新诠释和定... 本文根据当前智能座舱以及智能语音交互技术与特征,引入原子设计理论,梳理了原子设计及设计系统相关理论中的重要概念,并将相关理论的核心框架与智能语音交互场景相融合,在语音交互背景下对原子设计理论中的要素层次进行了重新诠释和定义,提出了基于原子设计的车载语音交互设计系统构建方法,为解决车载语音交互体验一致性,提升语音交互技能的设计与开发效率提供了新的思路和参考。 展开更多
关键词 语音交互设计 原子设计 车载智能语音
下载PDF
一种“附近”空间关系增强的多源融合室内定位方法 被引量:1
7
作者 王彦坤 樊红 +3 位作者 樊勇 李晓明 王伟玺 郭仁忠 《测绘学报》 EI CSCD 北大核心 2024年第1期118-125,共8页
针对传统室内定位模式单一,结合室内位置描述中常用的“附近”空间关系,融合多传感器数据,本文提出一种“附近”空间关系增强的多源融合语音交互室内定位方法。首先,研究“附近”空间关系特征,针对室内环境,建立基于“窃取面积”和最短... 针对传统室内定位模式单一,结合室内位置描述中常用的“附近”空间关系,融合多传感器数据,本文提出一种“附近”空间关系增强的多源融合语音交互室内定位方法。首先,研究“附近”空间关系特征,针对室内环境,建立基于“窃取面积”和最短距离的“附近”空间关系的概率密度函数;其次,采集每个参考节点的指纹信息及节点间的距离和运动信息,基于隐马尔可夫模型对室内位置描述定位过程建模,通过维比特算法预测用户位置;最终,通过实际场景对本方法验证,本文提出的方法平均定位精度在1.88 m,80%的情况下定位精度可以达到2.12 m。 展开更多
关键词 “附近”空间关系 多源数据融合 室内定位 语音交互
下载PDF
互动式汉语教学模式在农机交互设计上的应用——基于多媒体环境 被引量:1
8
作者 罗杨 《农机化研究》 北大核心 2024年第9期222-226,共5页
首先,介绍了基于多媒体环境的互动式汉语教学模式,并将其应用到农机交互设计中;然后,介绍了农机交互控制系统的整体框架,并实现了基于多媒体的语音控制;最后,结合软硬件两部分实现了农机互动控制系统。测试结果表明:语音控制的平均识别... 首先,介绍了基于多媒体环境的互动式汉语教学模式,并将其应用到农机交互设计中;然后,介绍了农机交互控制系统的整体框架,并实现了基于多媒体的语音控制;最后,结合软硬件两部分实现了农机互动控制系统。测试结果表明:语音控制的平均识别率在94%以上,能够满足操作人员对农机的控制,证明了该方案的可行性。 展开更多
关键词 农机 多媒体 互动式 ARCGIS 语音控制
下载PDF
多模态人机交互系统在船舶航行中的应用
9
作者 王卉 高家骥 曹福存 《舰船科学技术》 北大核心 2024年第3期157-160,共4页
为拓展设计船舶航行中多模态人机交互模式,促进船舶航行所用导航系统的智能化发展,研究多模态人机交互系统在船舶航行中的应用,设计一种船舶航行使用的多模态人机交互系统。船员可在船舶航行时,以语音交互、手势交互这种多模态交互模式... 为拓展设计船舶航行中多模态人机交互模式,促进船舶航行所用导航系统的智能化发展,研究多模态人机交互系统在船舶航行中的应用,设计一种船舶航行使用的多模态人机交互系统。船员可在船舶航行时,以语音交互、手势交互这种多模态交互模式,完成指令输入,无需人工手动操舵。实验测试结果验证,多模态人机交互模式使用后,船舶航行时,控制指令通过语音与手势便可有效传达,船舶航行控制可靠,且无须手动控制舵机,可实现船舶航行智能化交互控制。 展开更多
关键词 多模态 人机交互 船舶航行 语音交互 手势交互 隐马尔科夫模型
下载PDF
基于智能语音技术的多功能母婴护理装置设计
10
作者 雷斌 苏江 +5 位作者 李奕莹 陈健聪 梁建圣 李纯淳 杨丹宜 黄梅秀 《机电工程技术》 2024年第2期142-145,182,共5页
为解决传统洗护装置中洗护分离、高度不可调、洗护繁琐等问题,从传统婴幼儿洗护装置出发,设计一款基于智能语音技术的多功能母婴护理装置,旨在实现洗护一体,优化洗护结构,减轻家长洗护负担。通过调研婴儿洗护过程并分析现有洗浴装置结构... 为解决传统洗护装置中洗护分离、高度不可调、洗护繁琐等问题,从传统婴幼儿洗护装置出发,设计一款基于智能语音技术的多功能母婴护理装置,旨在实现洗护一体,优化洗护结构,减轻家长洗护负担。通过调研婴儿洗护过程并分析现有洗浴装置结构,选用SolidWorks、UG软件建立装置三维模型,完成结构受力分析。装置整体设计由高度升降模块、浴盆护理台切换模块、排水模块、语音模块、恒温模块、温度检测模块、人机交互模块、控制模块组成。控制系统选用三菱FX3U系列PLC作为中央控制器,直流电机作为装置执行机构部分。在实验室进行1000余次各项测试。结果表明:所设计的结构合理、功能完善、性能稳定,能够较好地协助用户完成洗浴护理工作;与传统洗浴装置相比,该装置完成了洗护一体、高度智能可调等创新性设计,有效地缓解了新生儿父母的洗浴负担,保障了婴幼儿的洗浴安全。 展开更多
关键词 智能语音技术 控制系统 人机交互
下载PDF
面向飞行交互任务的三种人机交互方式效率比较研究
11
作者 熊端琴 姚乃明 +6 位作者 林榕 戈含笑 杜健 胡译文 丁霖 吴旭 孙国强 《航天医学与医学工程》 CAS 2024年第3期156-161,共6页
目的针对飞行任务情境下的多通道人机交互系统,比较手动触控、眼动控制和语音控制三种人机交互模式的交互效率。方法以20名飞行员为对象,基于特定飞行任务情境,分别以三种人机交互模式完成一级(相对简单)和二级(相对复杂)交互实验任务... 目的针对飞行任务情境下的多通道人机交互系统,比较手动触控、眼动控制和语音控制三种人机交互模式的交互效率。方法以20名飞行员为对象,基于特定飞行任务情境,分别以三种人机交互模式完成一级(相对简单)和二级(相对复杂)交互实验任务。交互效率指标包括系统的交互时间、响应时间、融合计算时间和错误次数。实验完成后飞行员再进行主观评价,评价内容包括交互模式与任务的适配性、与使用预期的一致性、容错性、有效反馈性和对于该交互模式在未来飞行领域的应用倾向性。结果在飞行任务情境下的交互效率,手动触控、语音控制和眼动控制之间普遍存在显著性差异,但在一级和二级交互任务中的差异性各有不同。综合各级交互实验任务,得到的主要实验结果包括:(1)手动触控的交互时间最短,语音控制的交互时间最长,交互模式的主效应显著(F=18.214,P<0.001,η^(2)=0.565);(2)手动触控的响应时间最短,眼动触控的响应时间最长,交互模式的主效应显著(F=153.085,P<0.001,η^(2)=0.944);(3)手动触控的融合计算时间最短,语音控制的融合计算时间最长,交互模式的主效应显著(F=41.702,P<0.001,η^(2)=0.777);(4)语音控制的错误最少,眼动控制的错误最多,交互模式的主效应显著(χ^(2)=22.845,P<0.001,φ=1.097);(5)飞行员对语音控制的主观评价得分均高于眼动控制,且均具有统计学意义(P<0.001,P<0.01)。结论本研究针对飞行交互任务,通过实验和主观评价相结合的方式,对手动触控、语音控制和眼动控制三种交互模式的交互效率进行了比较研究,交互模式对交互效率有明显影响。手动触控在交互时间效率上有明显优势,语音控制在简单任务的准确性中占优,而眼动控制在时间效率和准确性方面均相对较弱;相比眼动控制,飞行员对语音控制表现出更高的评价和倾向性。研究结果可为多通道交互系统的未来设计、评估与应用提供参考。 展开更多
关键词 多通道人机交互 手动触控 眼动控制 语音控制 交互效率
下载PDF
基于Android的智能虚拟数字人的设计与实现
12
作者 黄军峰 姜曼 《西安交通工程学院学术研究》 2024年第2期83-86,共4页
随着科技的飞速发展,人工智能技术在各个领域都取得了显著的成果。在智能手机和移动互联网领域的加持下,虚拟数字人作为新一代人机交互平台,其应用场景在不断拓展。根据不同的应用场景或行业,已经出现了娱乐型数字人(如虚拟主播、虚拟偶... 随着科技的飞速发展,人工智能技术在各个领域都取得了显著的成果。在智能手机和移动互联网领域的加持下,虚拟数字人作为新一代人机交互平台,其应用场景在不断拓展。根据不同的应用场景或行业,已经出现了娱乐型数字人(如虚拟主播、虚拟偶像)、教育型数字人(如虚拟教师)、助手型数字人(如虚拟客服、虚拟导游、智能助手)。虚拟数字人作为一种全新的交互方式,正逐渐改变着人们的生活方式。基于Android平台的智能虚拟数字人设计旨在为用户提供一个更加自然、智能的交互体验,利用Android平台开放性和灵活性的特点,可以直接调用手机麦克风,摄像头等功能,这样语音输入输出可以方便的实现。本文利用Android平台丰富的资源和工具,使用编程实现了虚拟数字人的语音唤醒、语音识别和智能交互等功能。本文希望能为这个方面的研究和应用提供一点参考。 展开更多
关键词 ANDROID平台 语音交互技术 ChatGPT 虚幻引擎 虚拟数字人
下载PDF
基于ESP32的ChatGPT语音交互系统设计与实现
13
作者 边玉亮 毛润 +2 位作者 李启航 张卓 李倩艺 《黄冈师范学院学报》 2024年第5期20-25,共6页
针对大多数用户使用ChatGPT主要是以网页交互的形式,为进一步扩大其实际应用范围,本文设计了一款能够实现ChatGPT在ESP32上进行语音交互的系统。选择集成Wi-Fi、语音识别等模块的ESP32-S3模组,通过VSCode配置Wi-Fi和ChatGPT-API达到将... 针对大多数用户使用ChatGPT主要是以网页交互的形式,为进一步扩大其实际应用范围,本文设计了一款能够实现ChatGPT在ESP32上进行语音交互的系统。选择集成Wi-Fi、语音识别等模块的ESP32-S3模组,通过VSCode配置Wi-Fi和ChatGPT-API达到将系统接入OpenAI的目的,使用阿里云平台的TTS服务将文本结果转换成语音输出,从而实现Wi-Fi连接、语音交互等功能。在实际开发过程中,网络连接的不稳定和背景的噪音成为影响系统数据传输的主要因素。测试结果显示,用户分别进行长、短文本问答,系统能够准确识别提问语句,可以快速产生回答并将问题和结果在屏幕显示,达到了ChatGPT在ESP32上进行语音交互的目的,展现了系统在智能家居和智能办公等场景的应用潜力,也为用户带来了更加智能和便捷的交互体验。 展开更多
关键词 ESP32 ChatGPT WI-FI连接 云平台 语音交互 语音唤醒 屏幕显示
下载PDF
用户感性偏好导向的智能语音交互设计评价方法
14
作者 王铁旦 胡艺朋 彭定洪 《工业工程》 2024年第2期57-66,共10页
用户感性偏好是智能语音交互设计的重要依据,为解决评价过程中存在的用户实际决策行为与其感性评价结果不一致的问题,提出了一种用户感性偏好导向的直觉模糊锚定评价方法。首先,采用直觉模糊集表征用户对智能语音交互设计的感性偏好信息... 用户感性偏好是智能语音交互设计的重要依据,为解决评价过程中存在的用户实际决策行为与其感性评价结果不一致的问题,提出了一种用户感性偏好导向的直觉模糊锚定评价方法。首先,采用直觉模糊集表征用户对智能语音交互设计的感性偏好信息,以充分描述用户偏好的模糊性与不确定性。其次,将最优最劣思想融入序数优先级方法以确定权重,在保证运算过程简便性的同时,克服了该方法在排序方面存在的缺陷。再次,从数理角度刻画了锚定效应在评价过程中的作用机制,并将锚定效应融入智能语音交互设计评价方法,就其对最终评价结果的影响进行量化分析。最后,以某智能车载系统语音交互设计为例,验证该方法有助于提高预测用户实际决策结果的准确性和可信度。 展开更多
关键词 智能语音交互 感性工学 直觉模糊集 序数优先级方法 锚定效应
下载PDF
智能语音交互技术在电梯检验中的应用研究
15
作者 王琦 吴冰 +1 位作者 张立楠 张佳 《电声技术》 2024年第8期42-44,共3页
电梯作为特种设备,其质量直接关系到人们的生命安全。智能语音交互技术在电梯检验中的应用能够显著提高检验效率和安全性。分析智能语音交互技术在电梯检验中的具体应用,探讨其在实际操作中的效果和优势。主要涉及自然语言处理和语音识... 电梯作为特种设备,其质量直接关系到人们的生命安全。智能语音交互技术在电梯检验中的应用能够显著提高检验效率和安全性。分析智能语音交互技术在电梯检验中的具体应用,探讨其在实际操作中的效果和优势。主要涉及自然语言处理和语音识别技术,通过解析检验员指令、提供实时语音指导、智能故障诊断支持来优化检验流程。此外,通过案例分析展示了国内首款人工智能(Artificial Intelligence,AI)语音电梯系统的应用效果,该系统结合语音识别、语音合成以及手势识别技术,提供了全方位的检验支持和培训功能。研究表明,应用智能语音交互技术不仅提高了电梯检验效率,而且提高了工作自动化程度和安全性,具有广阔的应用前景。 展开更多
关键词 智能语音交互技术 电梯 检验
下载PDF
语音交互技术在有声读物中的应用
16
作者 王小娟 《电声技术》 2024年第3期79-81,共3页
近年来,有声阅读行业发展迅速,有声读物日益增多,受到用户青睐。如何引导有声产品高质量发展,进一步规范有声阅读市场,成为全社会普遍关注的问题。基于此,首先分析语音交互技术应用于有声读物的意义,其次分析语音交互技术在有声读物中... 近年来,有声阅读行业发展迅速,有声读物日益增多,受到用户青睐。如何引导有声产品高质量发展,进一步规范有声阅读市场,成为全社会普遍关注的问题。基于此,首先分析语音交互技术应用于有声读物的意义,其次分析语音交互技术在有声读物中的应用问题,最后提出语音交互技术应用于有声读物的策略。 展开更多
关键词 语音交互技术 有声读物 智慧化
下载PDF
智能语音交互技术在地理信息系统中的应用
17
作者 纪娇娇 《电声技术》 2024年第4期54-56,共3页
随着人工智能技术的不断进步,智能语音交互技术在地理信息系统领域的应用变得日益重要。首先分析智能语音交互技术和地理信息系统的概念,其次分析智能语音交互技术在地理信息系统中的应用,最后针对存在的问题提出一系列切实可行的应用... 随着人工智能技术的不断进步,智能语音交互技术在地理信息系统领域的应用变得日益重要。首先分析智能语音交互技术和地理信息系统的概念,其次分析智能语音交互技术在地理信息系统中的应用,最后针对存在的问题提出一系列切实可行的应用策略。 展开更多
关键词 智能语音交互 地理信息 人工智能
下载PDF
央视频跨平台3D卡通智能语音助手数字人“央小频”设计与应用
18
作者 耿羽 白云 白璐 《广播与电视技术》 2024年第10期10-14,共5页
本文介绍了央视频多终端跨平台端渲染3D卡通智能语音助手的整体设计理念与应用技术创新。项目产品设计前瞻性地将虚拟数字人技术、AI智能对话、5G消息等业务进行综合运用,开展了数字人在视频APP上基于语音人机交互的创新实践。
关键词 融媒体传播 大小屏互动 语音交互 智能助手 5G消息
下载PDF
基于语音交互的智能电网调度系统的设计与实现
19
作者 田茜 吴程楠 +2 位作者 李家睿 李姝润 李曼 《自动化应用》 2024年第1期173-175,共3页
常规智能电网调度系统主要使用分布式存储虚拟化技术划分调度任务模块,易受服务对象性质变化的影响,导致其在多用户并发操作时运行异常,为此,基于语音交互设计了一种全新的智能电网调度系统。硬件部分设计了ATML嵌入式存储芯片及STM处理... 常规智能电网调度系统主要使用分布式存储虚拟化技术划分调度任务模块,易受服务对象性质变化的影响,导致其在多用户并发操作时运行异常,为此,基于语音交互设计了一种全新的智能电网调度系统。硬件部分设计了ATML嵌入式存储芯片及STM处理器,软件部分基于语音交互技术构建了智能电网调度架构,设计了智能电网调度功能模块,实现了智能电网调度。结果表明,该系统在多用户并发操作时均能正常运行,证明系统性能良好、可靠。 展开更多
关键词 语音交互 智能 电网 调度
下载PDF
融合数字人类建模与计算机交互的应用方案
20
作者 樊凤肖 顾勤 +2 位作者 毛艳丽 魏雪明 杨汝萍 《移动信息》 2024年第7期377-379,共3页
为提高人机交互的效率和体验,文中使用三维建模技术,将真实人体的形态和动作信息数字化,生成数字人类模型,并结合计算机视觉和深度学习技术,通过语音识别、手势识别、情感分析等多个方面实现与数字人类的实时互动和交流,融合数字人类模... 为提高人机交互的效率和体验,文中使用三维建模技术,将真实人体的形态和动作信息数字化,生成数字人类模型,并结合计算机视觉和深度学习技术,通过语音识别、手势识别、情感分析等多个方面实现与数字人类的实时互动和交流,融合数字人类模型与计算机应用程序,实现更直观、自然的人机交互界面。通过语音模拟技术,可以根据对已有的人物音频数据的分析,复制和再现人物的声音特征,保障声音与动画效果的适配性,为用户提供更加真实的体验和感受。 展开更多
关键词 数字人类建模 计算机交互 语音模拟
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部