期刊文献+
共找到11,331篇文章
< 1 2 250 >
每页显示 20 50 100
面向多模态知识图谱的实体对齐方法研究
1
作者 张艺玮 周乾 +1 位作者 陈伟 赵雷 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1257-1263,共7页
实体对齐是构建知识图谱的重要环节,也是该领域的一个研究热点.现有实体对齐工作在包含文本、图片的多模态知识图谱数据集DB15K-FB15K和YAGO15K-FB15K上做了大量研究,但是它们仅局限于文本和图片两种模态,且在多模态知识融合方面的性能... 实体对齐是构建知识图谱的重要环节,也是该领域的一个研究热点.现有实体对齐工作在包含文本、图片的多模态知识图谱数据集DB15K-FB15K和YAGO15K-FB15K上做了大量研究,但是它们仅局限于文本和图片两种模态,且在多模态知识融合方面的性能并不显著.为弥补已有工作的不足,本文构建了一个包含文本、图片、视频的多模态知识图谱数据集Douban-Baidu,并提出了EA-MMKG模型来解决多模态知识图谱实体对齐问题.EA-MMKG包含两部分:多模态知识嵌入模块和多模态知识交互融合模块.具体来讲,多模态知识嵌入模块由关系三元组嵌入、图片嵌入、视频嵌入和属性三元组嵌入4个部分组成;多模态知识交互融合模块采用了基于注意力的融合机制来融合从文本、图片、视频3种模态中提取的特征信息,从而使得各模态之间的交互更加充分、融合效果更好,并最终提高多模态知识图谱实体对齐的性能.实验结果表明,EA-MMKG模型在Douban-Baidu数据集、DB15K-FB15K数据集和YAGO15K-FB15K数据集上的性能均优于现有的模型. 展开更多
关键词 多模态 实体对齐 多模态知识图谱嵌入 多模态融合
下载PDF
基于多模态掩码Transformer网络的社会事件分类
2
作者 陈宏 钱胜胜 +2 位作者 李章明 方全 徐常胜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期579-587,共9页
多模态社会事件分类的关键是充分且准确地利用图像和文字2种模态的特征。然而,现有的大多数方法存在以下局限性:简单地将事件的图像特征和文本特征连接起来,不同模态之间存在不相关的上下文信息导致相互干扰。因此,仅仅考虑多模态数据... 多模态社会事件分类的关键是充分且准确地利用图像和文字2种模态的特征。然而,现有的大多数方法存在以下局限性:简单地将事件的图像特征和文本特征连接起来,不同模态之间存在不相关的上下文信息导致相互干扰。因此,仅仅考虑多模态数据模态间的关系是不够的,还要考虑模态之间不相关的上下文信息(即区域或单词)。为克服这些局限性,提出一种新颖的基于多模态掩码Transformer网络(MMTN)模型的社会事件分类方法。通过图-文编码网络来学习文本和图像的更好的表示。将获得的图像和文本表示输入多模态掩码Transformer网络来融合多模态信息,并通过计算多模态信息之间的相似性,对多模态信息的模态间的关系进行建模,掩盖模态之间的不相关上下文。在2个基准数据集上的大量实验表明:所提模型达到了最先进的性能。 展开更多
关键词 多模态 社会事件分类 社交媒体 表示学习 多模态Transformer网络
下载PDF
社交网络舆情多模态知识图谱构建框架研究 被引量:1
3
作者 何巍 《情报杂志》 北大核心 2024年第1期160-166,共7页
[研究目的]信息技术的发展丰富了社交媒体用户的沟通交流方式,研究社交网络舆情多模态知识图谱的构建对网络舆情治理具有重要的现实意义。[研究方法]基于多模态数据的语义互补,讨论了实体属性关联、图像(视频)文字描述、图像(视频)属性... [研究目的]信息技术的发展丰富了社交媒体用户的沟通交流方式,研究社交网络舆情多模态知识图谱的构建对网络舆情治理具有重要的现实意义。[研究方法]基于多模态数据的语义互补,讨论了实体属性关联、图像(视频)文字描述、图像(视频)属性、图像(视频)关联等多种异构数据融合方式。在此基础上,提出社交网络舆情多模态知识图谱的构建框架,并分析了在多模态语义理解、多模态实体对齐、多模态知识表示等方面存在的问题与挑战。[研究结论]提出基于多模态知识融合的社交网络舆情多模态知识图谱构建框架,为交互方式日趋丰富的社交网络舆情治理提供有益参考。 展开更多
关键词 社交媒体 多模态 多模态知识图谱 多模态数据 网络舆情 舆情治理 情感分析
下载PDF
基于样本内外协同表示和自适应融合的多模态学习方法
4
作者 黄学坚 马廷淮 王根生 《计算机研究与发展》 EI CSCD 北大核心 2024年第5期1310-1324,共15页
多模态机器学习是一种新的人工智能范式,结合各种模态和智能处理算法以实现更高的性能.多模态表示和多模态融合是多模态机器学习的2个关键任务.目前,多模态表示方法很少考虑样本间的协同,导致特征表示缺乏鲁棒性,大部分多模态特征融合... 多模态机器学习是一种新的人工智能范式,结合各种模态和智能处理算法以实现更高的性能.多模态表示和多模态融合是多模态机器学习的2个关键任务.目前,多模态表示方法很少考虑样本间的协同,导致特征表示缺乏鲁棒性,大部分多模态特征融合方法对噪声数据敏感.因此,在多模态表示方面,为了充分学习模态内和模态间的交互,提升特征表示的鲁棒性,提出一种基于样本内和样本间多模态协同的表示方法.首先,分别基于预训练的BERT,Wav2vec 2.0,Faster R-CNN提取文本特征、语音特征和视觉特征;其次,针对多模态数据的互补性和一致性,构建模态特定和模态共用2类编码器,分别学习模态特有和共享2种特征表示;然后,利用中心矩差异和正交性构建样本内协同损失函数,采用对比学习构建样本间协同损失函数;最后,基于样本内协同误差、样本间协同误差和样本重构误差设计表示学习函数.在多模态融合方面,针对每种模态可能在不同时刻表现出不同作用类型和不同级别的噪声,设计一种基于注意力机制和门控神经网络的自适应的多模态特征融合方法.在多模态意图识别数据集MIntRec和情感数据集CMU-MOSI,CMU-MOSEI上的实验结果表明,该多模态学习方法在多个评价指标上优于基线方法. 展开更多
关键词 多模态表示 多模态融合 多模态学习 协同表示 自适应融合
下载PDF
多模态知识图谱表示学习综述
5
作者 王春雷 王肖 刘凯 《计算机应用》 CSCD 北大核心 2024年第1期1-15,共15页
在综合对比传统知识图谱表示学习模型优缺点以及适用任务后,发现传统的单一模态知识图谱无法很好地表示知识。因此,如何利用文本、图片、视频、音频等多模态数据进行知识图谱表示学习成为一个重要的研究方向。同时,详细分析了常用的多... 在综合对比传统知识图谱表示学习模型优缺点以及适用任务后,发现传统的单一模态知识图谱无法很好地表示知识。因此,如何利用文本、图片、视频、音频等多模态数据进行知识图谱表示学习成为一个重要的研究方向。同时,详细分析了常用的多模态知识图谱数据集,为相关研究人员提供数据支持。在此基础上,进一步讨论了文本、图片、视频、音频等多模态融合下的知识图谱表示学习模型,并对其中各种模型进行了总结和比较。最后,总结了多模态知识图谱表示学习如何改善经典应用,包括知识图谱补全、问答系统、多模态生成和推荐系统在实际应用中的效果,并对未来的研究工作进行了展望。 展开更多
关键词 多模态知识图谱 表示学习 多模态融合 知识图谱补全 多模态生成
下载PDF
结合时间注意力机制和单模态标签自动生成策略的自监督多模态情感识别
6
作者 孙强 王姝玉 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期588-601,共14页
大多数多模态情感识别方法旨在寻求一种有效的融合机制,构建异构模态的特征,从而学习到具有语义一致性的特征表示。然而,这些方法通常忽略了模态间情感语义的差异性信息。为解决这一问题,提出了一种多任务学习框架,联合训练1个多模态任... 大多数多模态情感识别方法旨在寻求一种有效的融合机制,构建异构模态的特征,从而学习到具有语义一致性的特征表示。然而,这些方法通常忽略了模态间情感语义的差异性信息。为解决这一问题,提出了一种多任务学习框架,联合训练1个多模态任务和3个单模态任务,分别学习多模态特征间的情感语义一致性信息和各个模态所含情感语义的差异性信息。首先,为了学习情感语义一致性信息,提出了一种基于多层循环神经网络的时间注意力机制(TAM),通过赋予时间序列特征向量不同的权重来描述情感特征的贡献度。然后,针对多模态融合,在语义空间进行了逐语义维度的细粒度特征融合。其次,为了有效学习各个模态所含情感语义的差异性信息,提出了一种基于模态间特征向量相似度的自监督单模态标签自动生成策略(ULAG)。通过在CMU-MOSI,CMU-MOSEI, CH-SIMS 3个数据集上的大量实验结果证实,提出的TAM-ULAG模型具有很强的竞争力:在分类指标(Acc_(2),F_(1))和回归指标(MAE, Corr)上与基准模型的指标相比均有所提升;对于二分类识别准确率,在CMUMOSI和CMU-MOSEI数据集上分别为87.2%和85.8%,而在CH-SIMS数据集上达到81.47%。这些研究结果表明,同时学习多模态间的情感语义一致性信息和各模态情感语义的差异性信息,有助于提高自监督多模态情感识别方法的性能。 展开更多
关键词 多模态情感识别 自监督标签生成 多任务学习 时间注意力机制 多模态融合
下载PDF
多模态方面级情感分析的多视图交互学习网络
7
作者 王旭阳 庞文倩 赵丽婕 《计算机工程与应用》 CSCD 北大核心 2024年第7期92-100,共9页
以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示,对方面和观点词相关性的识别不敏感,且不能动态获取图片信息对单词表示的贡献,因而不能充分识别多模态与方面之间的相关性。针对上述问题,提出一种多视图交互学习... 以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示,对方面和观点词相关性的识别不敏感,且不能动态获取图片信息对单词表示的贡献,因而不能充分识别多模态与方面之间的相关性。针对上述问题,提出一种多视图交互学习网络模型。将句子从上下文和句法两个视图上分别提取特征,以便在多模态交互时充分利用到文本的全局特征;对文本、图片和方面之间的关系进行建模,使模型实现多模态交互;同时融合不同模态的交互表示,动态获取视觉信息对文本中每个单词的贡献程度,充分提取模态与方面之间的相关性。最后通过全连接层和Softmax层获取情感分类结果。在两个数据集上进行实验,实验结果表明该模型能够有效增强多模态方面级情感分类的效果。 展开更多
关键词 多模态方面级情感分析 预训练模型 多视图学习 多模态交互 动态融合
下载PDF
基于数字化多模态创编提升中学生多元读写能力的案例研究
8
作者 刘晓斌 欧阳瑞姚 谢秋竹 《基础外语教育》 2024年第1期3-11,107,共10页
在新媒体时代,语言创作过程已不再仅限于纯文字的表达。越来越多的师生开始尝试将文字与其他多种模态(如图像、声音、画面等)符号设计成多模态语篇的形式,这就是多模态创编的过程。本文从多元读写能力以及新媒体时代的要求出发,介绍了... 在新媒体时代,语言创作过程已不再仅限于纯文字的表达。越来越多的师生开始尝试将文字与其他多种模态(如图像、声音、画面等)符号设计成多模态语篇的形式,这就是多模态创编的过程。本文从多元读写能力以及新媒体时代的要求出发,介绍了数字化多模态创编这种新的教学活动形式,并通过一个以创编前的导入课、创编中的活动课和创编后的展示课所开展的单元活动案例,展示了数字化多模态创编活动的教学过程及注意事项。这个案例展示了数字化多模态创编活动如何激发学生带着问题意识去分析问题、解决问题,从而真正地提高他们用英语做事的综合语言运用能力。该案例特别强调,创编后对多模态作品及任务的评价方法是创编活动中至关重要的一环。 展开更多
关键词 多元读写 多模态创编 多模态写作
下载PDF
基于智能技术的多模态学习分析:内涵、模型、挑战
9
作者 李嘉瑶 《中国教育技术装备》 2024年第1期26-30,37,共6页
智能技术的发展为学习分析提供广阔的发展空间,助长了多模态学习分析的出现和发展。文章解读多模态学习分析概念,归纳多模态学习分析的平台和工具,分析多模态学习数据的复杂性和动态化,构建多模态学习分析的模型。未来多模态学习分析借... 智能技术的发展为学习分析提供广阔的发展空间,助长了多模态学习分析的出现和发展。文章解读多模态学习分析概念,归纳多模态学习分析的平台和工具,分析多模态学习数据的复杂性和动态化,构建多模态学习分析的模型。未来多模态学习分析借助智能技术在神经科学、心理学、计算机领域的发展,将在教育研究实践中得到广泛应用。 展开更多
关键词 多模态 多模态学习分析 多模态数据 学习分析
下载PDF
基于多模态双向信息增强的RGBT跟踪网络
10
作者 赵伟 刘磊 +2 位作者 王鲲鹏 涂铮铮 罗斌 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期596-605,共10页
可见光-热红外(RGBT)目标跟踪旨在挖掘可见光和热红外数据的互补优势,实现鲁棒的目标跟踪。目前主流方法通常引入模态权重来实现多模态信息融合,但简单地为各个模态分配权重无法充分挖掘可见光和热红外模态的互补优势。基于此,提出了一... 可见光-热红外(RGBT)目标跟踪旨在挖掘可见光和热红外数据的互补优势,实现鲁棒的目标跟踪。目前主流方法通常引入模态权重来实现多模态信息融合,但简单地为各个模态分配权重无法充分挖掘可见光和热红外模态的互补优势。基于此,提出了一种多模态双向信息增强的RGBT跟踪网络(MBIENet)。设计了一种特征聚合模块,用于聚合模态共享特征和模态特定特征以建模目标外观信息;提出了一种新的多模态双向调制融合模块,可有效融合模态互补信息,减少冗余特征和无用特征对跟踪器的影响;提出了一个轻量化的通道空间注意力模块,可自适应调整不同环境下不同模态的贡献。在GTOT、RGBT234和LasHeR数据集上的实验结果表明:所提跟踪算法的准确率和成功率优于当前主流的跟踪算法。 展开更多
关键词 可见光-热红外 目标跟踪 深度学习 多模态信息融合 多模态信息交互
下载PDF
基于多模态融合的图神经网络推荐算法
11
作者 吴志强 解庆 +1 位作者 李琳 刘永坚 《计算机工程》 CSCD 北大核心 2024年第1期91-100,共10页
已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加... 已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,不能区分用户对不同模态信息的偏好。针对上述问题,提出多模态融合的GNN推荐模型。首先针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;然后利用GAT聚合邻居信息,丰富本节点表示,同时根据门控循环单元决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明:多模态信息、注意力融合机制能有效提升推荐的准确度,算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升;当评估指标K值选取10时,Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。 展开更多
关键词 多模态推荐 多模态融合 注意力机制 图神经网络 推荐系统 门控图神经网络
下载PDF
融合多模态信息的产品摘要抽取模型
12
作者 赵强 王中卿 王红玲 《计算机应用》 CSCD 北大核心 2024年第1期73-78,共6页
在网络购物平台上,简洁、真实、有效的产品摘要对于提升购物体验至关重要。网上购物无法接触到产品实物,产品图像所含信息是除产品文本描述外的重要视觉信息,因此融合包括产品文本和产品图像在内的多模态信息的产品摘要对于网络购物具... 在网络购物平台上,简洁、真实、有效的产品摘要对于提升购物体验至关重要。网上购物无法接触到产品实物,产品图像所含信息是除产品文本描述外的重要视觉信息,因此融合包括产品文本和产品图像在内的多模态信息的产品摘要对于网络购物具有重要的意义。针对融合产品文本描述和产品图像的问题,提出一种融合多模态信息的产品摘要抽取模型。与一般的产品摘要任务的输入只包含产品文本描述不同,该模型引入了产品图像作为一种额外的信息来源,使抽取产生的摘要更丰富。具体来说,首先对产品文本描述和产品图像分别使用预训练模型进行特征表示,从产品文本描述中提取每个句子的文本特征表示,从产品图像中提取产品整体的视觉特征表示;然后使用基于低阶张量的多模态融合方法将每个句子的文本特征和整体视觉特征进行模态融合,得到每个句子的多模态特征表示;最后将所有句子的多模态特征表示输入摘要生成器中以生成最终的产品摘要。在CEPSUM(Chinese E-commerce Product SUMmarization)2.0数据集上进行对比实验,在CEPSUM 2.0的3个数据子集上,该模型的平均ROUGE-1比TextRank高3.12个百分点,比BERTSUMExt(BERT SUMmarization Extractive)高1.75个百分点。实验结果表明,该模型融合产品文本和图像信息对于产品摘要是有效的,在ROUGE评价指标上表现良好。 展开更多
关键词 产品摘要 多模态摘要 抽取式摘要 多模态融合 自动文摘
下载PDF
多模态特征的越南语语音识别文本标点恢复
13
作者 赖华 孙童 +3 位作者 王文君 余正涛 高盛祥 董凌 《计算机应用》 CSCD 北大核心 2024年第2期418-423,共6页
越南语语音识别系统输出的文本序列缺少标点符号,恢复识别文本标点有助于消除歧义,更易于阅读和理解。越南语语音识别文本中常出现破坏语义的错误音节,基于文本模态的标点恢复模型在识别带噪文本时存在标点预测不准确的问题。利用越南... 越南语语音识别系统输出的文本序列缺少标点符号,恢复识别文本标点有助于消除歧义,更易于阅读和理解。越南语语音识别文本中常出现破坏语义的错误音节,基于文本模态的标点恢复模型在识别带噪文本时存在标点预测不准确的问题。利用越南语语音中的语气停顿及声调变化指导模型对带噪文本作出正确的标点预测,提出多模态特征的越南语语音识别文本标点恢复方法,利用梅尔倒谱系数(MFCC)提取语音特征,利用预训练语言模型提取文本上下文特征,基于标签注意力机制实现语音与文本多模态特征融合,增强模型对越南语带噪文本上下文信息的学习能力。实验结果表明,相较于基于Transformer和BERT提取文本单一模态特征的标点恢复模型,所提方法在越南语数据集上精确率、召回率和F1值均至少提高10个百分点,验证了融合语音与文本特征对提升越南语语音识别带噪文本标点预测精确率的有效性。 展开更多
关键词 语音识别 标点恢复 越南语 BERT 多模态
下载PDF
多模态影像技术在儿童症状性癫痫中的应用进展
14
作者 房俊芳 狄宁宁 +3 位作者 董景敏 李潇潇 穆新暖 姜兴岳 《磁共振成像》 CAS CSCD 北大核心 2024年第4期171-176,共6页
儿童是癫痫的好发人群,由于其中枢神经系统处于发育阶段,所以病因更加复杂、表现形式更加多样,早期诊断和及时、有效处理能减少儿童中枢神经损伤,最大程度地保护患儿的脑功能。根据有无明显抽搐可将癫痫分为惊厥性和非惊厥性,而非惊厥... 儿童是癫痫的好发人群,由于其中枢神经系统处于发育阶段,所以病因更加复杂、表现形式更加多样,早期诊断和及时、有效处理能减少儿童中枢神经损伤,最大程度地保护患儿的脑功能。根据有无明显抽搐可将癫痫分为惊厥性和非惊厥性,而非惊厥性因无明显临床症状,诊断相对比较困难,容易导致误诊而延误治疗,明确诊断需要依靠脑电图(癫痫样或节律性放电)。随着影像检查手段的不断发展,明确癫痫病因、定位癫痫病灶的方式更加多样化,定位更加准确,同时功能成像检查方式也使得早期评估癫痫的脑功能变化成为可能。本文就近年来症状性儿童癫痫的MRI及其与正电子发射计算机断层显像(positron emission tomography,PET)融合应用的研究进展及临床应用进行综述,旨在为今后的相关研究提供参考和借鉴。 展开更多
关键词 儿童 癫痫 磁共振成像 结构磁共振成像 功能磁共振成像 多模态成像
下载PDF
多模态协同感知与融合技术专题前言
15
作者 孙立峰 宋新航 +2 位作者 蒋树强 王莉莉 申恒涛 《软件学报》 EI CSCD 北大核心 2024年第5期2099-2100,共2页
与人类利用视觉、听觉、触觉等多种感官信息来感知世界相似,计算机智能系统也可通过不同的传感器,如摄像头、雷达、麦克风、触觉传感器等,来获取人类和物理世界中的数据与信息.随着智能终端和多模态传感设备的普及,可用于感知世界的数... 与人类利用视觉、听觉、触觉等多种感官信息来感知世界相似,计算机智能系统也可通过不同的传感器,如摄像头、雷达、麦克风、触觉传感器等,来获取人类和物理世界中的数据与信息.随着智能终端和多模态传感设备的普及,可用于感知世界的数据来源、维度和数据量都在快速增长,单独模态数据所提供的信息已经不能满足智能系统感知与理解世界的需求.因此智能系统在感知世界时,需要从更多模态数据的差异化获取、动态适配、互补融合、协同感知等角度开展深入研究,这也是多媒体领域的一个非常重要和具有挑战性的问题.本专题强调多模态的协同交互与有机融合,研究多模态协同感知与融合技术,重点关注视觉语言多模态交互理解技术、多模态交互生成与重建技术和多模态智能融合与协同学习技术,旨在促进多模态特征表示、自适应融合、协同学习和交互生成等相关理论与方法的研究进展. 展开更多
关键词 智能系统 触觉传感器 融合技术 协同感知 协同学习 自适应融合 多模态数据 动态适配
下载PDF
基于非文本模态强化和门控融合方法的多模态情感分析
16
作者 魏金龙 邵新慧 《计算机应用研究》 CSCD 北大核心 2024年第1期39-44,共6页
针对各模态之间信息密度存在差距和融合过程中可能会丢失部分情感信息等问题,提出一种基于非文本模态强化和门控融合方法的多模态情感分析模型。该模型通过设计一个音频-视觉强化模块来实现音频和视觉模态的信息增强,从而减小与文本模... 针对各模态之间信息密度存在差距和融合过程中可能会丢失部分情感信息等问题,提出一种基于非文本模态强化和门控融合方法的多模态情感分析模型。该模型通过设计一个音频-视觉强化模块来实现音频和视觉模态的信息增强,从而减小与文本模态的信息差距。之后,通过跨模态注意力和门控融合方法,使得模型充分学习到多模态情感信息和原始情感信息,从而增强模型的表达能力。在对齐和非对齐的CMU-MOSEI数据集上的实验结果表明,所提模型是有效的,相比现有的一些模型取得了更好的性能。 展开更多
关键词 多模态情感分析 多模态融合 模态强化 门控机制
下载PDF
基于深度置信网络的多模态过程故障评估方法及应用
17
作者 张凯 杨朋澄 +1 位作者 彭开香 陈志文 《自动化学报》 EI CAS CSCD 北大核心 2024年第1期89-102,共14页
传统的多模态过程故障等级评估方法对模态之间的共性特征考虑较少,导致当被评估模态故障信息不充分时,评估的准确性较低.针对此问题,首先,提出一种共性–个性深度置信网络(Common and specific deep belief network,CS-DBN),该网络充分... 传统的多模态过程故障等级评估方法对模态之间的共性特征考虑较少,导致当被评估模态故障信息不充分时,评估的准确性较低.针对此问题,首先,提出一种共性–个性深度置信网络(Common and specific deep belief network,CS-DBN),该网络充分利用深度置信网络(Deep belief network,DBN)的深度分层特征提取能力,通过度量多模态数据间分布的相似性和差异性,进一步得到能够反映多模态过程共有信息的共性特征以及反映每个模态独有信息的个性特征;其次,基于CS-DBN,利用多模态过程的已知故障等级数据生成多模态共性–个性特征集,通过加权逻辑回归构建故障等级评估模型;最后,将所提方法应用于带钢热连轧生产过程的故障等级评估中.应用结果表明,随着多模态故障等级数据的增加,所提方法的评估准确率逐渐增加,当故障信息充足时,评估准确率可达98.75%;故障信息不足时,与传统方法相比,评估准确率提升近10%. 展开更多
关键词 多模态过程 故障等级评估 共性–个性特征 深度置信网络 带钢热连轧
下载PDF
面向多模态数据的新型数据库技术专题前言
18
作者 彭智勇 高云君 +1 位作者 李国良 许建秋 《软件学报》 EI CSCD 北大核心 2024年第3期1049-1050,共2页
以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据... 以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据等.这要求数据库系统能够同时高效地管理多种不同类型的数据.多模态数据管理与分析成为亟需解决的问题.目前的方法主要通过拓展现有的数据库或通过集成各种不同模态数据管理引擎来支持多模态数据管理与分析,缺少新颖的理论、方法与技术的支撑.本专题围绕多模态数据管理与分析的整个生命周期,通过结合大数据技术和人工智能方法探讨新型数据库系统理论、方法和技术,包括多模态数据统一建模、存储与索引、查询与挖掘、并发控制、多模态数据库系统构建及其典型应用等主题,赋予数据库系统新的管理能力,形成多模态数据管理与分析在各行各业的最新应用成果. 展开更多
关键词 数据库系统 多模态数据 数据库技术 人工智能方法 并发控制 大数据技术 数据类型 统一建模
下载PDF
基于细粒度特征融合的部分多模态哈希
19
作者 殷崭祚 李博涵 +3 位作者 王萌 黄瑞龙 吴文隆 王昊奋 《软件学报》 EI CSCD 北大核心 2024年第3期1074-1089,共16页
多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但... 多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但是仍然存在着3个重要问题:(1)已有方法偏向于考虑所有样本都是模态完整的,然而在实际检索场景中,样本缺失部分模态的情况依然存在;(2)大多数方法都是基于浅层学习模型,这不可避免地限制了模型的学习能力,从而影响最终的检索效果;(3)针对模型学习能力弱的问题已提出了基于深度学习框架的方法,但是它们在提取各个模态的特征后直接采用了向量拼接等粗粒度特征融合方法,未能有效地捕获深层语义信息,从而弱化了哈希码的表示能力并影响最终的检索效果.针对以上问题,提出了PMH-F^(3)模型.该模型针对样本缺失部分模态的情况,实现了部分多模态哈希.同时,基于深层网络架构,利用Transformer编码器,以自注意力方式捕获深层语义信息,并实现细粒度的多模态特征融合.基于MIRFlickr和MSCOCO数据集进行了充分实验并取得了最优的检索效果.实验结果表明:所提出的PMH-F^(3)模型能够有效地实现部分多模态哈希,并可应用于大规模多模态数据检索. 展开更多
关键词 部分多模态哈希 多模态数据检索 细粒度特征融合
下载PDF
综采液压支架中部跟机多模态人机协同控制系统
20
作者 付翔 李浩杰 +3 位作者 张锦涛 王然风 王宏伟 秦一凡 《煤炭学报》 EI CAS CSCD 北大核心 2024年第3期1717-1730,共14页
我国煤矿智能化综采工作面建设处于初级阶段,液压支架电液控自动化技术已广泛应用,但目前液压支架单一固化的自动化控制逻辑难以适应复杂、多变、动态的工作面生产场景,现场实际控制过程仍大多采用自动化+人工干预方式。针对综采工作面... 我国煤矿智能化综采工作面建设处于初级阶段,液压支架电液控自动化技术已广泛应用,但目前液压支架单一固化的自动化控制逻辑难以适应复杂、多变、动态的工作面生产场景,现场实际控制过程仍大多采用自动化+人工干预方式。针对综采工作面复杂场景中液压支架人机交互协作任务需求,提出液压支架中部跟机多模态人机协同控制系统的理论方法与技术原理。首先,设计了人工式、分工式、批准式、否决式4种人机协同模态,以煤层地质、瓦斯粉尘、采煤机速度、液压支架智能水平、系统状态、岗位工技术水平、任务负荷等为判别因素,构建了基于AOG的液压支架人机协同模态选择模型,实现了人工、机器偏好的模态选择。然后,设计了液压支架中部跟机人机协同控制决策机制,提出液压支架中部跟机再次调控策略AI推理技术思路,利用现场数据学习人工操作经验,分别构建了液压支架是否再次调控决策树分类模型和再次拉架时间贝叶斯回归模型,基于上述模型开发了液压支架人机协同控制决策程序,实现了基于多模态与或推理和再次调控策略AI推理的液压支架人机协同控制。最后,采用云-边-端架构软硬件技术,开发了液压支架多模态人机协同控制系统,实现了模型进化、运算推理、程序执行等液压支架多模态人机协同控制功能。该系统在沙曲二矿3404工作面进行了工业试运行,相比于系统使用前,该工作面液压支架中部跟机效率平均提高2%。 展开更多
关键词 液压支架 人机协同 多模态 AI赋能 云边端架构
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部