期刊文献+
共找到209篇文章
< 1 2 11 >
每页显示 20 50 100
Visual Relationship Detection with Contextual Information 被引量:1
1
作者 Yugang Li Yongbin Wang +1 位作者 Zhe Chen Yuting Zhu 《Computers, Materials & Continua》 SCIE EI 2020年第6期1575-1589,共15页
Understanding an image goes beyond recognizing and locating the objects in it,the relationships between objects also very important in image understanding.Most previous methods have focused on recognizing local predic... Understanding an image goes beyond recognizing and locating the objects in it,the relationships between objects also very important in image understanding.Most previous methods have focused on recognizing local predictions of the relationships.But real-world image relationships often determined by the surrounding objects and other contextual information.In this work,we employ this insight to propose a novel framework to deal with the problem of visual relationship detection.The core of the framework is a relationship inference network,which is a recurrent structure designed for combining the global contextual information of the object to infer the relationship of the image.Experimental results on Stanford VRD and Visual Genome demonstrate that the proposed method achieves a good performance both in efficiency and accuracy.Finally,we demonstrate the value of visual relationship on two computer vision tasks:image retrieval and scene graph generation. 展开更多
关键词 visual relationship deep learning gated recurrent units image retrieval contextual information
下载PDF
知识引导的视觉关系检测模型
2
作者 王元龙 胡文博 张虎 《计算机应用》 CSCD 北大核心 2024年第3期683-689,共7页
视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。... 视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。针对上述问题,提出知识引导的视觉关系检测模型。首先构建视觉知识,对常见的视觉关系检测数据集中的实体标签和关系标签进行数据分析与统计,得到实体和关系间交互共现频率作为视觉知识;然后利用所构建的视觉知识,优化实体对的组合流程,降低关联性较弱的实体对得分,提升关联性较强的实体对得分,进而按照实体对的得分排序并删除得分较低的实体对,对于实体之间的关系也同样采用知识引导的方式优化关系得分,从而提升模型的召回率。在公开数据集视觉基因库(VG)和VRD中验证所提模型的效果:在谓词分类任务中,与现有模型PE-Net(Prototype-based Embedding Network)相比,在VG数据集上,召回率Recall@50和Recall@100分别提高了1.84和1.14个百分点;在VRD数据集上,相较于Coacher,Recall@20、Recall@50和Recall@100分别提高了0.22、0.32和0.31个百分点。 展开更多
关键词 视觉关系检测 实体对排序 组合爆炸 共现频率 知识引导
下载PDF
双无人机对地快速移动目标跟踪的构型设计与控制方法 被引量:1
3
作者 杨璇 尹栋 +3 位作者 王惠方 陈浩 张轩 张伟杰 《火炮发射与控制学报》 北大核心 2024年第2期14-21,共8页
为实现对地面快速移动目标的探测跟踪,基于无人机侦察载荷的误差模型,设计了双无人机编队跟踪目标的构型与跟踪控制律。面向持续跟踪的典型应用场景,设计了基于Leader-Follower的双机编队构型,并基于相机误差模型建立了双无人机探测叠... 为实现对地面快速移动目标的探测跟踪,基于无人机侦察载荷的误差模型,设计了双无人机编队跟踪目标的构型与跟踪控制律。面向持续跟踪的典型应用场景,设计了基于Leader-Follower的双机编队构型,并基于相机误差模型建立了双无人机探测叠加区域的误差分布模型,以此确定了目标与无人机编队的位置关系。之后,基于无人机与目标的视觉关系定义长机的矢量前置角和与目标之间的距离为跟踪误差,设计了基于李雅普诺夫方法的跟踪控制律,并证明跟踪控制的渐近稳定性。设计了僚机相对于长机的编队控制律,以保持双机平行编队的构型。仿真结果表明,目标机动运动时,双无人机系统能够在较短时间内收敛,实现对目标的持续稳定跟踪。 展开更多
关键词 无人机 目标跟踪 编队控制律 LEADER-FOLLOWER 视线关系 LYAPUNOV
下载PDF
基于协同训练的半监督图文关系抽取方法
4
作者 王亚萍 王智强 +1 位作者 王元龙 梁吉业 《南京理工大学学报》 CAS CSCD 北大核心 2024年第4期451-459,共9页
为克服获取大量关系标记样本的昂贵代价,提出基于协同训练的半监督图文关系抽取模型,以利用大量无标记的数据来提升图文关系抽取的准确性。首先,基于图像和文本2种模态构建图像视图和文本语义视图,在标记数据集上训练2种不同视图的分类... 为克服获取大量关系标记样本的昂贵代价,提出基于协同训练的半监督图文关系抽取模型,以利用大量无标记的数据来提升图文关系抽取的准确性。首先,基于图像和文本2种模态构建图像视图和文本语义视图,在标记数据集上训练2种不同视图的分类器;然后,将2种视图下的数据分别交叉输入另一视图的分类器,充分挖掘标记数据和未标记数据的信息,输出更准确的分类结果;最后,2种视图下的分类器对未标记数据进行预测,以输出一致的结果。在公开数据集VRD和VG上的实验结果显示,与6种较新的关系检测方法相比,该文方法图像视图和语义视图参数在VRD数据集上分别提升了2.24%、1.41%,在VG数据集上提升了3.59%。 展开更多
关键词 协同训练 半监督 多模态 关系抽取 视觉关系检测
下载PDF
基于知识图谱的区域企业关联可视化及关系挖掘
5
作者 汪显顺 熊卿智 +3 位作者 万磊 李祥 林重汕 金安安 《计算机与现代化》 2024年第8期11-16,共6页
现有区域企业关联分析结果呈现复杂的网络结构,难以理解,而且区域企业关联在时间和空间上具有动态性。针对当前区域企业分析中存在的结果解释问题,本文提出一种基于知识图谱的区域企业关联分析模型。采用属性图建模方法,运用多源异构数... 现有区域企业关联分析结果呈现复杂的网络结构,难以理解,而且区域企业关联在时间和空间上具有动态性。针对当前区域企业分析中存在的结果解释问题,本文提出一种基于知识图谱的区域企业关联分析模型。采用属性图建模方法,运用多源异构数据进行知识抽取和存储,并结合Neo4j图数据库实现区域企业关系的知识存储。在力导向布局方面,通过采用斥力优化求解和节点边处理,成功实现企业关系的可视化呈现。通过深入挖掘分析企业间的关联关系,旨在揭示区域企业之间的合作与竞争关系,为政府产业政策制定、企业招商引资和企业间合作提供决策支持。实验结果表明,该模型能够准确揭示企业间的关系,为区域经济发展提供有力支持。 展开更多
关键词 知识图谱 企业关联分析 区域经济 关系挖掘 可视化决策支持
下载PDF
基于语义一致性约束与局部-全局感知的多模态3D视觉定位
6
作者 罗寒 马浩统 +2 位作者 刘杰 严华 雷印杰 《计算机应用研究》 CSCD 北大核心 2024年第7期2203-2208,共6页
3D多模态数据稀缺,使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息,从而导致性能不佳。针对上述问题,提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先,... 3D多模态数据稀缺,使得传统方法进行监督训练时文本与视觉特征缺乏语义一致性。同时传统方法还易忽视局部关系与全局信息,从而导致性能不佳。针对上述问题,提出了一种基于语义一致性约束与局部-全局感知的多模态3D视觉定位方法。首先,该方法通过蒸馏2D预训练视觉语言模型知识,帮助3D模型提取到点云-文本语义一致性特征;其次设计了局部-全局感知模块,不断补充增强候选目标特征,以更精确匹配目标。在现有的3D视觉定位数据集ScanRefer上进行的实验表明,该方法在Acc@0.25 IoU和Acc@0.5 IoU两个指标上分别达到了50.53%和37.67%,超越了现有大多数3D视觉定位算法,证实了该方法的有效性。 展开更多
关键词 3D视觉定位 多模态 特征一致性约束 局部关系 全局位置信息
下载PDF
基于文献计量学的高温大曲研究进展与发展态势分析
7
作者 何琪 沈毅 +5 位作者 张亚东 尹杰兵 杨伟杰 刘君 袁思棋 王西 《酿酒科技》 2024年第3期24-32,共9页
基于Web of Science核心合集数据库和中国知网学术期刊数据库(CNKI),分别从年度发文量、发文作者和机构、高引文章和关键词等角度,采用文献计量法对1980-2022年该领域共208篇中文文献和47篇英文文献进行知识图谱分析,详细阐述了高温大... 基于Web of Science核心合集数据库和中国知网学术期刊数据库(CNKI),分别从年度发文量、发文作者和机构、高引文章和关键词等角度,采用文献计量法对1980-2022年该领域共208篇中文文献和47篇英文文献进行知识图谱分析,详细阐述了高温大曲的研究进展和该研究领域未来的发展态势。高温大曲研究是酱香型白酒品质提升的重要方面。近十年来高温大曲的文献研究总体呈现上升趋势。中国学者是发文的主力军,总发文量呈逐年上升趋势,其中WOS数据库发文量增长明显。郎酒集团、茅台集团、江南大学、中国农业大学、中国食品发酵工业研究院等单位是该领域的研究主体。通过本文综合分析,可以为白酒行业相关研究人员了解高温大曲的研究动态和研究方向、开展科研合作与学术交流提供信息帮助。 展开更多
关键词 高温大曲 文献计量学 可视化关系图谱 聚类分析
下载PDF
基于注意力机制和多粒度特征融合的跨视角匹配模型
8
作者 蔡美玉 朱润哲 +2 位作者 吴飞 张开昱 李家乐 《计算机应用》 CSCD 北大核心 2024年第3期901-908,共8页
跨视角景象匹配是指从不同平台(如无人机、卫星等)发现同一地理目标的图像。然而,不同图像平台会导致无人机(UAV)定位和导航任务精度较低,现有方法通常只关注图像的单一维度,忽略了图像的多维特征。针对上述问题,提出一种全局注意力和... 跨视角景象匹配是指从不同平台(如无人机、卫星等)发现同一地理目标的图像。然而,不同图像平台会导致无人机(UAV)定位和导航任务精度较低,现有方法通常只关注图像的单一维度,忽略了图像的多维特征。针对上述问题,提出一种全局注意力和多粒度特征融合(GAMF)深度神经网络以改进特征表示,提高特征可区分度。首先,GAMF模型结合无人机视角和卫星视角的图像,在统一的网络架构下延展为3个分支,从3个维度提取图像的空间位置、通道和局部特征;然后,建立空间全局关系注意力模块(SGAM)和通道全局注意力模块(CGAM),引入空间全局关系机制和通道注意力机制捕获全局信息,从而更好地进行注意力学习;其次,为了融合局部感知特征,引入局部划分策略,以更好地增强模型提取细粒度特征的能力;最后,联合3个维度的特征作为最后的特征对模型训练。在公开数据集University-1652上的实验结果表明,GAMF模型在无人机视觉定位任务上的平均精准率(AP)达到了87.41%,在无人机视觉导航任务中召回率(R@1)达到了90.30%。验证了GAMF模型能够有效聚合图像的多维特征,提高无人机定位和导航任务的准确性。 展开更多
关键词 无人机 景象匹配定位 视觉定位 度量学习 全局关系注意力 深度学习
下载PDF
基于CiteSpace的新时代高校师生关系研究可视化分析
9
作者 洪千禧 苏李依 《宿州教育学院学报》 2024年第3期17-24,共8页
在教育高质量发展的时代背景下,高校师生关系的研究越来越受到关注与重视。借助CiteSpace软件,以近年来CNKI数据库中发表在CSSCI和北大核心期刊上的391篇关于我国高校师生关系的学术性期刊文献为研究对象,对我国高校师生关系研究的现状... 在教育高质量发展的时代背景下,高校师生关系的研究越来越受到关注与重视。借助CiteSpace软件,以近年来CNKI数据库中发表在CSSCI和北大核心期刊上的391篇关于我国高校师生关系的学术性期刊文献为研究对象,对我国高校师生关系研究的现状、演进、前沿进行可视化分析,整体描绘了我国高校师生关系研究的现实图景。新时代针对现有研究的薄弱之处,需注意拓宽研究视角和方法,多维延伸师生关系研究范畴;厘清研究方向和内容,夯实师生关系学理研究基础。 展开更多
关键词 CITESPACE 高校 师生关系 可视化分析
下载PDF
基于CiteSpace计量分析的工业设计教育研究动态与发展策略
10
作者 董晓日 范一鹏 +3 位作者 徐凤芹 高小针 杨小东 田蜜 《山西师范大学学报(自然科学版)》 2024年第2期34-47,共14页
运用文献计量学方法,借助CiteSpace对中国知网于1998~2021收录的394篇文献绘制知识图谱.采用关键词聚类与共现分析、突现分析、普赖斯定律测算等方法开展研究.结果表明,工业设计教育经历了起步、迅速攀升、轻度波动式平稳发展三个阶段.... 运用文献计量学方法,借助CiteSpace对中国知网于1998~2021收录的394篇文献绘制知识图谱.采用关键词聚类与共现分析、突现分析、普赖斯定律测算等方法开展研究.结果表明,工业设计教育经历了起步、迅速攀升、轻度波动式平稳发展三个阶段.核心研究方向主要涉及工业设计专业发展瓶颈、专业课程实体设计训练、工程教育模式介入与创新、教学模式探索与应用四方面.当前存在四个问题亟待解决:实体介入训练机会不均;项目信息传播渠道不够通畅;专业办学定位更新与教学人员知识体系跟进衔接不够紧密;高校进入条件与所需人员实践技能匹配度较低;学术合作网络关系相对分散,核心教学科研团队有待于进一步构建. 展开更多
关键词 工业设计教育 CITESPACE 可视化分析 网络关系共现 发展策略
下载PDF
Thermal Degradation Kinetics of Anthocyanins and Visual Color of Blood Orange Juice 被引量:4
11
作者 CAO Shao-qian LIU Liang PAN Si-yi 《Agricultural Sciences in China》 CAS CSCD 2011年第12期1992-1997,共6页
Thermal degradation kinetics of anthocyanins and visual color (Hunter α value) of blood orange juice were studied at selected temperatures (70-90℃). Results indicated that both the thermal degradation of anthocy... Thermal degradation kinetics of anthocyanins and visual color (Hunter α value) of blood orange juice were studied at selected temperatures (70-90℃). Results indicated that both the thermal degradation of anthocyanin and visual color all followed first-order reaction kinetics, and they could be expressed by Arrhenius equation. The activation energy values for the anthocyanins degradation and visual color degradation were 55.81 and 47.51 kJ tool-1, respectively. The linear relationship between visual color and anthocyanin content was obtained. Furthermore, during thermal processing of blood orange juice, the formulas about the linear relationships showed no significant difference at selected temperatures. So, the relationships between visual color and anthocyanins content during thermal processing at selected temperatures could be described by the same equation: α*/αo'=0.559(C/Co)+0.43. It might be inferred that visual color measured instantaneously by tristimulus colorimeters for on-line quality control, could be used to predict the anthocyanins degradation during thermal processing of blood orange juice. 展开更多
关键词 blood orange juice anthocyanins visual color degradation kinetics relationship
下载PDF
基于标签层次结构的视觉关系检测模型
12
作者 王元龙 雷鸣 +3 位作者 王智强 张虎 李茹 梁吉业 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3496-3506,共11页
视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术.然而,由于关系标签视觉上的相似性以及数据不平衡问题造成少样本的尾部关系检测召回率较低.为了提高尾部关系的检测效果,本文将关系标签进... 视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术.然而,由于关系标签视觉上的相似性以及数据不平衡问题造成少样本的尾部关系检测召回率较低.为了提高尾部关系的检测效果,本文将关系标签进行粗细粒度划分构建了标签的层次结构表示,提出了基于标签层次结构的视觉关系检测模型.模型利用视觉关系之间的相似性以及数据带有的偏见性构建关系标签的层次结构表示,以此将关系区分为粗粒度关系和细粒度关系,使尾部关系在由粗粒度到细粒度的结构上获得更多的关注.同时,针对标签层次结构的性质设计其损失函数,该损失函数通过结构化信息逐层学习不同类别关系之间的差异,使模型更好的检测尾部细粒度关系.分别在公开数据集Visual Relationship Detection(VRD)和Visual Genome(VG)中验证了本文模型检测尾部关系的效果.与现有模型相比,在VRD数据集中平均召回率mR@20、mR@50和mR@100分别提高了0.62%、1.57%和2.47%;在VG数据集中,mR@20、mR@50和mR@100分别提高了0.67%、0.83%和1.15%. 展开更多
关键词 视觉关系检测 标签层次结构表示 长尾分布 粗粒度关系 细粒度关系
下载PDF
煤矿事故因素的自组织映射分布研究 被引量:3
13
作者 张江石 李泳暾 +3 位作者 秦芳 王慧超 潘雨 王梓伊 《中国安全科学学报》 CAS CSCD 北大核心 2023年第2期9-15,共7页
为进一步明确煤矿事故致因因素间的复杂耦合机制,引入自组织映射(SOM)神经网络。首先利用24Model分析煤矿事故因素,构建事故属性数据集;其次通过SOM算法,可视化分析因素与事故间的耦合关系,最后结合K-means聚类算法,研究煤矿事故致因中... 为进一步明确煤矿事故致因因素间的复杂耦合机制,引入自组织映射(SOM)神经网络。首先利用24Model分析煤矿事故因素,构建事故属性数据集;其次通过SOM算法,可视化分析因素与事故间的耦合关系,最后结合K-means聚类算法,研究煤矿事故致因中单因素及多因素耦合对事故的映射特征,并计算因素间的耦合程度。结果表明:“事故-单因素”映射分布可反映出单因素对事故影响程度的差异性,其中管理落实不到位、安全培训不到位以及制度文件不健全等因素对煤矿事故的影响较大;“事故-多因素耦合”映射分布得到直接因素类别中违章指挥、违规作业、操作失误和不安全物态4种因素的耦合作用较强;因素耦合度分析中“体系文件不健全、安全文化欠缺-人员组织不合理”、“配套设施不齐全-安全习惯不佳”等多对因素的耦合度大于0.8,存在较强的耦合关系和因果性。 展开更多
关键词 煤矿事故 自组织映射(SOM) 事故致因因素 耦合关系 可视化
下载PDF
Bruch's membrane opening-minimum rim width and visual field loss in glaucoma:a broken stick analysis 被引量:1
14
作者 Keun-Heung Park Ji-Woong Lee +2 位作者 Jin-Mi Kim Kouros Nouri-Mahdavi Joseph Caprioli 《International Journal of Ophthalmology(English edition)》 SCIE CAS 2018年第5期828-834,共7页
AIM:To determine the Bruch's membrane opening-minimum rim width(BMO-MRW) tipping point where corresponding visual field(VF) damages become detectable.METHODS:A total of 85 normal subjects and 83 glaucoma patie... AIM:To determine the Bruch's membrane opening-minimum rim width(BMO-MRW) tipping point where corresponding visual field(VF) damages become detectable.METHODS:A total of 85 normal subjects and 83 glaucoma patients(one eye per participant) were recruited for the study.All of the patients had VF examinations and spectral-domain optical coherence tomography to measure the BMO-MRW.Total deviation values for 52 VF points were allocated to the corresponding sector according to the Garway-Heath distribution map.To evaluate the relationship between VF loss and BMOMRW measurements,a "broken-stick" statistical model was used.The tipping point where the VF values started to sharply decrease as a function of BMO-MRW measurements was estimated and the slopes above and below this tipping point were compared.RESULTS:A 25.9% global BMO-MRW loss from normative value was required for the VF loss to be detectable.Sectorally,substantial BMO-MRW thinning in inferotemporal sector(33.1%) and relatively less BMO-MRW thinning in the superotemporal sector(8.9%) were necessary for the detection of the VF loss.Beyond the tipping point,the slopes were close to zero throughout all of the sectors and the VF loss was unrelated to the BMO-MRW loss.The VF loss was related to the BMO-MRW loss below the tipping point.The difference between the two slopes was statistically significant(P≤0.002).CONCLUSION:Substantial BMO-MRW loss appears to be necessary for VF loss to be detectable in patients with open angle glaucoma with standard achromatic perimetry. 展开更多
关键词 Bruch's membrane opening-minimum rim width visual field loss structure function relationship broken stick model optical coherence tomography
下载PDF
智能媒介与视障者社会融合的实证分析 被引量:6
15
作者 杨柳 林仲轩 《新闻与传播评论》 2023年第1期40-56,共17页
受身体功能障碍和社会无障碍环境的双重限制,在传统社会中曾区隔于主流社会之外的视障人群,能否借助人工智能和新媒体技术等媒介参与现代社会之中?基于对这一问题的思考,研究借助“使用与满足理论”的MAIN模型,对视障人群进行了问卷调查... 受身体功能障碍和社会无障碍环境的双重限制,在传统社会中曾区隔于主流社会之外的视障人群,能否借助人工智能和新媒体技术等媒介参与现代社会之中?基于对这一问题的思考,研究借助“使用与满足理论”的MAIN模型,对视障人群进行了问卷调查,检测了“形式”“主体”“互动”和“导航”四类需求维度下15个类目的满足指标与视障者在社会参与和社会关系层面的因果关系。其中,社会参与指视障者在现实社会环境中参与日常活动的情况,社交关系则是视障者在社会中能获得的支持、认同与尊重程度。回归数据显示,视障者对智能媒介工具类属性的使用对于他们的社会融合会产生正面影响,且对社会参与的影响大于其对社交关系的影响。然而,若综合考虑视障者的个人社会经济背景因素、对人工智能技术的依赖程度,智能媒介的使用与满足对个人社会经济背景相对不占优势的视障者影响更大,且受访者在社交关系上的影响大于其在社会参与层面的影响。这一研究结果表明智能媒介对视障人群是一把“双刃剑”。不同类型的技术可供性所激活的使用与满足体验对不同社会经济背景的视障者会产生不同程度的影响,且这种影响是因“需”而异的。智能媒介使用与满足下的一些工具性需求指标,如“形式”维度上的需求为用户提供了走进真实社会场景的沟通工具,成为视障者的“眼睛”。但是智能媒介在引领视障者“看见”新世界的同时,也为他们提供了进一步“逃离”主流社会的“避风港”。数据显示:对于社会经济背景相对不占优势的视障者,他们更倾向于利用智能媒介获得社交关系层面的支持与链接,参与到现实世界之中。这种数字化的包容并不是现实意义上的社会融合,若不能进一步突破他们的现实困境,技术赋能反而可能增加他们与主流社会进一步隔离与分化的风险。这个发现给新媒体技术究竟是为弱势群体增权赋能还是“技术乌托邦”的争论提供了实证案例,这或许是媒介与残障研究领域内的一次有意义的尝试。此外,这也是MAIN模式在不同群体中对不同媒介使用效应的实证检验。MAIN模式主要关注特定媒介的可供性在不同群体中能带来何种感知和影响,是传统使用与满足理论的现代转向。依据智能媒介和视障者的特点对MAIN模式下的测量指标进行调试,验证该模式下的工具性需求和非工具性需求对视障者社会融合的影响。这是对MAIN模式的思考与验证,也是对不同类型的技术可供性所激活的启发是如何导致不同用户群体对媒介功能的使用体验产生不同感和影响而进行的实证探讨。 展开更多
关键词 智能媒介 视障者 使用与满足MAIN模型 社会参与 社交关系
下载PDF
Three-Dimensional Visualization of Neurovascular Structures in the Posterior Cranial Fossa: A Potential Concept for Microsurgical Considerations in Aneursyms
16
作者 Levent Tanrikulu Peter Hastreiter +1 位作者 Michael Buchfelder Ramin Naraghi 《Open Journal of Modern Neurosurgery》 2016年第1期51-54,共4页
3D visualization was established for noninvasive evaluation of neurovascular compression syndromes. MR-CISS (constructive interference in the steady state) is the most potent image source to depict neurovascular detai... 3D visualization was established for noninvasive evaluation of neurovascular compression syndromes. MR-CISS (constructive interference in the steady state) is the most potent image source to depict neurovascular details. The purpose of this article is the conceptual view over the established technique of 3D visualization in the topography of aneurysms in the posterior circulation in relation to surrounding cranial nerves and the brainstem. 展开更多
关键词 3D visualization High-Resolution Mri Neurovascular relationships Intracranial Aneurysm
下载PDF
基于空间关系聚合与全局特征注入的视觉问答模型
17
作者 陈巧红 漏杨波 方贤 《浙江理工大学学报(自然科学版)》 2023年第6期764-774,共11页
现有视觉问答模型缺乏视觉对象间关系的理解能力,导致复杂问题的答案预测准确率较差;针对该问题,提出了一种基于空间关系聚合与全局特征注入的视觉问答模型。该模型首先利用空间关系聚合视觉区域特征,将其转换为视觉全局特征,并将这些... 现有视觉问答模型缺乏视觉对象间关系的理解能力,导致复杂问题的答案预测准确率较差;针对该问题,提出了一种基于空间关系聚合与全局特征注入的视觉问答模型。该模型首先利用空间关系聚合视觉区域特征,将其转换为视觉全局特征,并将这些特征注入网络;然后引入双边门控机制进行特征融合,使模型能够根据不同的问题输入,自适应地调整视觉全局特征和视觉区域特征对答案预测的贡献度;最后将融合特征输入分类网络,得到预测结果。在VQA 2.0和GQA公开数据集上进行实验,结果表明:该模型在VQA2.0的测试-开发集、测试-标准集和GQA的数据集上的总准确率分别达到71.12%、71.54%和57.71%,优于MCAN和SCAVQAN等主流模型。该模型由于引入了具有空间关系的视觉全局特征,能够更好地提升视觉对象间关系的理解能力,有效提高了视觉问答模型的准确率。 展开更多
关键词 视觉问答 空间关系聚合 全局特征注入 视觉区域特征 视觉全局特征 双边门控机制
下载PDF
多模态视阈下汉语教材中少数民族形象塑造分析 被引量:6
18
作者 杨璇 韩佳蓉 《云南师范大学学报(对外汉语教学与研究版)》 2023年第1期20-32,共13页
构建全面、真实的少数民族形象对传播中华民族文化,打破偏见与误解,优化国际汉语教材具有深刻的现实意义。本研究聚焦《走遍中国》《中文听说读写》《发展汉语》及《新实用汉语》四套国际汉语教材,以多模态话语分析及态度评价理论为依据... 构建全面、真实的少数民族形象对传播中华民族文化,打破偏见与误解,优化国际汉语教材具有深刻的现实意义。本研究聚焦《走遍中国》《中文听说读写》《发展汉语》及《新实用汉语》四套国际汉语教材,以多模态话语分析及态度评价理论为依据,考察上述教材中少数民族形象的呈现方式、呈现内容及对少数民族的态度评价。研究结果表明,少数民族形象可通过“人物、地域、物质、行为、精神”五个维度共同塑造,所选教材的语言模态和视觉模态均体现出对少数民族的积极态度。但是,教材中仍存在对各民族关注度不均、模态使用单一、现代性特征不足等问题。 展开更多
关键词 少数民族形象 多模态话语分析 图文关系 态度评价理论 国际汉语教材
下载PDF
嵌入视觉关系掩码的多类别金具检测方法
19
作者 王巍 杨耀权 +2 位作者 王乾铭 翟永杰 赵振兵 《智能系统学报》 CSCD 北大核心 2023年第3期440-449,共10页
在对输电线路金具进行检测的过程中,由于受到复杂背景的影响,一些互相遮挡或者特征不明显的金具会隐匿在复杂环境难以精确检测。针对这一问题,提出了基于视觉关系掩码的多类别金具检测模型,通过挖掘和提取输电线路金具之间包含空间信息... 在对输电线路金具进行检测的过程中,由于受到复杂背景的影响,一些互相遮挡或者特征不明显的金具会隐匿在复杂环境难以精确检测。针对这一问题,提出了基于视觉关系掩码的多类别金具检测模型,通过挖掘和提取输电线路金具之间包含空间信息的视觉关系先验知识,构建视觉关系掩码和视觉关系检测网络,并将先验知识作为辅助信息融入视觉关系模块中,最终实现多类别金具的精确定位与识别。对具有14类金具的数据集进行多种定性和定量实验,结果表明,改进后的模型平均检测精度能提高到76.25%,检测效果也优于其他先进目标检测模型。 展开更多
关键词 目标检测 输电线路 金具 深度学习 视觉关系 先验知识 空间信息 辅助信息
下载PDF
融合多模态特征的新闻短视频分类模型 被引量:2
20
作者 曾祥玖 刘达维 +3 位作者 刘逸凡 赵志滨 柳秀梅 任酉贵 《计算机工程与应用》 CSCD 北大核心 2023年第14期107-113,共7页
视频分类是理解、归纳和检索视频数据的一个重要环节。新闻短视频具有音频信息比图像信息更能完整地描述新闻事件的特点,但传统视频分类模型常常只考虑图像信息或融合了音频和图像的多模态信息,并没有考虑模态信息之间的主辅关系。针对... 视频分类是理解、归纳和检索视频数据的一个重要环节。新闻短视频具有音频信息比图像信息更能完整地描述新闻事件的特点,但传统视频分类模型常常只考虑图像信息或融合了音频和图像的多模态信息,并没有考虑模态信息之间的主辅关系。针对上述问题,采用以音频模态为主,图像模态为辅的融合机制,提出了融合多模态特征的新闻短视频分类模型。为进一步利用音频为主的特点,采用两阶段训练方式,使用音频模态单独训练,音频和图像模态联合训练,利用图像信息修正分类结果,提升新闻短视频分类的准确率。为训练和评价模型,采集了10304个新闻联播短视频作为实验数据集,总时长约为240 h。实验结果表明,所提模型的分类效果优于传统的新闻短视频分类模型。 展开更多
关键词 音画关系 多模态特征融合 新闻短视频分类
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部