期刊文献+
共找到571篇文章
< 1 2 29 >
每页显示 20 50 100
Generative Multi-Modal Mutual Enhancement Video Semantic Communications
1
作者 Yuanle Chen Haobo Wang +3 位作者 Chunyu Liu Linyi Wang Jiaxin Liu Wei Wu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第6期2985-3009,共25页
Recently,there have been significant advancements in the study of semantic communication in single-modal scenarios.However,the ability to process information in multi-modal environments remains limited.Inspired by the... Recently,there have been significant advancements in the study of semantic communication in single-modal scenarios.However,the ability to process information in multi-modal environments remains limited.Inspired by the research and applications of natural language processing across different modalities,our goal is to accurately extract frame-level semantic information from videos and ultimately transmit high-quality videos.Specifically,we propose a deep learning-basedMulti-ModalMutual Enhancement Video Semantic Communication system,called M3E-VSC.Built upon a VectorQuantized Generative AdversarialNetwork(VQGAN),our systemaims to leverage mutual enhancement among different modalities by using text as the main carrier of transmission.With it,the semantic information can be extracted fromkey-frame images and audio of the video and performdifferential value to ensure that the extracted text conveys accurate semantic information with fewer bits,thus improving the capacity of the system.Furthermore,a multi-frame semantic detection module is designed to facilitate semantic transitions during video generation.Simulation results demonstrate that our proposed model maintains high robustness in complex noise environments,particularly in low signal-to-noise ratio conditions,significantly improving the accuracy and speed of semantic transmission in video communication by approximately 50 percent. 展开更多
关键词 generative adversarial networks multi-modal mutual enhancement video semantic transmission deep learning
下载PDF
Generalized Testability Scheme Modeling of Materiel System Based on Information Ontology
2
作者 陈希祥 姜云春 《Journal of Donghua University(English Edition)》 EI CAS 2016年第2期308-313,共6页
A mode of ontology-based information integration and management( OIIM) for testability scheme was proposed through expatiating on the connotation of the system testability scheme.Aiming at the complexity of influencin... A mode of ontology-based information integration and management( OIIM) for testability scheme was proposed through expatiating on the connotation of the system testability scheme.Aiming at the complexity of influencing factors in optimal design procedure of the testability scheme, the information of concept entities,concept attributions and concept relationships was analyzed and extracted,and then the testability scheme information ontology( TSIO) was built and coded via web ontology language( OWL).Based on the information ontology, the generalized model for testability scheme( GMTS) was founded by defining transformation rules. The primary study shows that the mode of OIIM for testability scheme can make up the deficiencies in knowledge representation and reasoning existing in traditional information models,and achieve the information share and reuse. It provides the effectual model basis for the optimal design of the testability scheme. 展开更多
关键词 testability scheme information ontology semantic web ontology language(OWL) generalized model for testability scheme(GMTS)
下载PDF
Automated Service Management for Semantic IP Multimedia System [S-IMS]
3
作者 Kidd S. C. Toh S. M. F. D. Syed Mustapha 《Communications and Network》 2013年第3期211-219,共9页
Next Generation Network (NGN) has drawn great attention by the researchers and telecommunication industries as the future generation in the communication technologies and services. The interest covers all aspects on N... Next Generation Network (NGN) has drawn great attention by the researchers and telecommunication industries as the future generation in the communication technologies and services. The interest covers all aspects on NGN from the global standards, architecture and services. The management of services provided in the NGN environment has posed great challenges due to the heterogeneity of the service protocols, service requirements and specifications and service functionalities. The research proposes enhancement of the automated service management through embedding the semantic service descriptions that can be referenced to the service ontology for service creation and management into the Next Generation Network, which will become Semantic Next Generation Network (SNGN). 展开更多
关键词 IP Mutimedia SYSTEM Web SERVICE SESSION Initiated Protocols SERVICE Oriented Architecture semantic NEXT generation Network
下载PDF
基于卫星图像的城区屋面分布式光伏潜力评估
4
作者 彭曙蓉 何洁妮 +3 位作者 刘韬文 李彬 苏盛 壮婕 《太阳能学报》 EI CAS CSCD 北大核心 2024年第5期517-526,共10页
结合市辖区层面光伏发展情况以及城市中不同用地的特点,利用卫星图片识别长沙市各地区适合装设分布式光伏的建筑区域。基于太阳高度角和方位角,通过山体阴影分析屋顶上的建筑阴影,计算地区屋面光伏可承载容量。对市场侧、制造商及电网... 结合市辖区层面光伏发展情况以及城市中不同用地的特点,利用卫星图片识别长沙市各地区适合装设分布式光伏的建筑区域。基于太阳高度角和方位角,通过山体阴影分析屋顶上的建筑阴影,计算地区屋面光伏可承载容量。对市场侧、制造商及电网部门的分布式光伏规划进行研究。通过识别结果可为光伏建设方及电网提供明确地域列表及可用面积,以及可实现基于实际建设项目的可新增光分布式光伏装机容量的预测,以期为分布式光伏电站用地不足问题提供新的解决思路。 展开更多
关键词 可再生能源 分布式发电 深度学习 语义分割 卫星图像
下载PDF
社交媒体中“刺客”的隐喻性语义泛化
5
作者 穆军芳 朱洁 高越新 《重庆交通大学学报(社会科学版)》 2024年第5期104-112,共9页
“刺客”经过认知隐喻的作用已然发生语义泛化,并成为当下流行语之一。从语义泛化的三个阶段,即语义隐喻、语义抽象以及语义泛化阶段分析“刺客”的语义泛化过程,发现其语域已经过自职业域到商品域、再到情感域的延伸,指谓范围更加宽阔... “刺客”经过认知隐喻的作用已然发生语义泛化,并成为当下流行语之一。从语义泛化的三个阶段,即语义隐喻、语义抽象以及语义泛化阶段分析“刺客”的语义泛化过程,发现其语域已经过自职业域到商品域、再到情感域的延伸,指谓范围更加宽阔,表达意义更加复杂。此外,在模因论视角下深度探讨其流行的原因。 展开更多
关键词 “刺客” 隐喻 语义泛化 模因 流行语
下载PDF
专利数据辅助的新产品概念设计方案生成方法
6
作者 杨雯丹 曹国忠 《计算机集成制造系统》 EI CSCD 北大核心 2024年第3期992-1010,共19页
在生成新产品概念设计方案的过程中,企业常缺乏辅助新产品功能描述、分解及创新的设计知识,且存在功能实现技术检索结果可用性不高、难以有效转化为概念设计方案技术特征的问题。为此,提出一种专利数据辅助的新产品概念设计方案生成方... 在生成新产品概念设计方案的过程中,企业常缺乏辅助新产品功能描述、分解及创新的设计知识,且存在功能实现技术检索结果可用性不高、难以有效转化为概念设计方案技术特征的问题。为此,提出一种专利数据辅助的新产品概念设计方案生成方法。首先,使用文本相似度算法,检索国际专利分类表中与设计任务相关的分类号文本,辅助描述新产品的主功能。其次,引入C-K理论将下级分类号释义视为K空间中的元素,新产品子功能视为C空间中的元素,通过元素间转化辅助完成主功能分解。再次,结合专利技术成熟度分析和功能创新策略,确定新产品的功能创新方向,并依据共现分类号释义预测新产品的集成功能,辅助实现新产品的功能创新。接着,应用专利文献跨域特征分析模型,引入技术领域融合度的概念,量化专利技术的知识广度和流动性,辅助优选功能实现技术,并利用语义解析技术自动提取专利独立权利要求中的技术特征,辅助生成新产品概念设计方案。最后,将该方法应用于重型汽车底盘预装设备领域的新产品开发,证明了方法的有效性。 展开更多
关键词 概念设计 专利数据 功能设计 专利技术优选 语义解析
下载PDF
基于域适应的图像语义分割综述
7
作者 刘美琴 王子麟 《北京交通大学学报》 CAS CSCD 北大核心 2024年第2期1-9,共9页
随着深度学习技术的迅速发展,语义分割算法在性能提升的同时依赖于大规模成对图像数据及其耗时耗力的像素级标注.人工制作的合成图像以规模大、易标注的特点,替代真实图像有效降低了训练成本.然而,合成图像与真实图像的域间差异性降低... 随着深度学习技术的迅速发展,语义分割算法在性能提升的同时依赖于大规模成对图像数据及其耗时耗力的像素级标注.人工制作的合成图像以规模大、易标注的特点,替代真实图像有效降低了训练成本.然而,合成图像与真实图像的域间差异性降低了分割网络的泛化能力.针对域间差异问题,研究者提出域适应语义分割(Domain Adaptive Semantic Segmentation,DASS)算法.该算法通过提取合成图像与真实图像的跨域共享知识,减小域间差异,提升分割网络在真实图像上的泛化能力.本文根据网络结构对主流DASS算法进行分类,分析了不同算法的性能对比结果,并提出未来研究方向.研究结果表明:早期的DASS算法利用生成对抗网络对齐源域和目标域的边缘分布,但网络结构复杂,并且只能实现两域的全局对齐,无法实现不同类别之间的精细对齐,性能较低;后续算法逐渐转向自训练网络结构,利用预训练的分割网络在目标域生成伪标签,为下一轮训练提供监督,结构简单,性能表现优于早期算法;随着Transformer网络的出现,其强大的特征提取能力进一步提升了DASS算法的准确性. 展开更多
关键词 图像语义分割 深度学习 域适应语义分割 生成对抗网络 自训练网络
下载PDF
基于Transformer生成对抗网络的跨模态哈希检索算法
8
作者 雷蕾 徐黎明 《南阳理工学院学报》 2024年第4期38-44,共7页
考虑生成对抗网络在保持跨模态数据之间的流形结构的优势,并结合Transformer利用自注意力和无须使用卷积的优点,提出一种基于Transformer生成对抗网络的跨模态哈希检索算法。首先在ImageNet数据集上预训练Vision Transformer框架,并将... 考虑生成对抗网络在保持跨模态数据之间的流形结构的优势,并结合Transformer利用自注意力和无须使用卷积的优点,提出一种基于Transformer生成对抗网络的跨模态哈希检索算法。首先在ImageNet数据集上预训练Vision Transformer框架,并将其作为图像特征提取的主干网络,然后将不同模态的数据分割为共享特征和私有特征。接着,构建对抗学习模块减少不同模态的共享特征的分布距离与保持语义一致性,同时增大不同模态的私有特征分布距离与保持语义非一致性。最后将通用的特征表示映射为紧凑的哈希码,实现跨模态哈希检索。实验结果表明,在公共数据集上,所提算法优于对比算法。 展开更多
关键词 TRANSFORMER 生成对抗网络 跨模态检索 哈希编码 语义保持
下载PDF
下一代互联网发展趋势对图书馆智慧化转型的启示
9
作者 刘金哲 《图书馆理论与实践》 2024年第2期66-71,共6页
未来互联网将以更加高效、开放、智能、虚实结合和聚合关联等特点,开启一个更加智慧的时代,催生出更多新业态、新应用、新场景。图书馆要积极借鉴下一代互联网的发展理念和技术,充分考虑新形势下用户需求和行为习惯的变化,开启智慧化转... 未来互联网将以更加高效、开放、智能、虚实结合和聚合关联等特点,开启一个更加智慧的时代,催生出更多新业态、新应用、新场景。图书馆要积极借鉴下一代互联网的发展理念和技术,充分考虑新形势下用户需求和行为习惯的变化,开启智慧化转型和知识服务探索之路,创新资源管理模式、应用场景和发展生态,平稳过渡并无缝连接数实融合、聚合共享的广阔未来。 展开更多
关键词 下一代互联网 语义网 去中心化 元宇宙 智能网
下载PDF
基于生成式逻辑的古籍文献自动化置标语义框架构建与应用研究
10
作者 文玉锋 赵悦言 《图书与情报》 北大核心 2024年第2期126-134,共9页
目前,我国古籍文献的数字化以文献扫描、粗粒度文件管理等浅层知识服务为主,生成式人工智能技术的发展为古籍文献数字化的深度化提供了新的机遇。文章基于框架语义学理论构建置标语义逻辑结构框架,以生成式逻辑向大语言模型提出问题,递... 目前,我国古籍文献的数字化以文献扫描、粗粒度文件管理等浅层知识服务为主,生成式人工智能技术的发展为古籍文献数字化的深度化提供了新的机遇。文章基于框架语义学理论构建置标语义逻辑结构框架,以生成式逻辑向大语言模型提出问题,递归提取古籍语料中深层语义内容,并将其输出为符合置标语义框架的结构化数据,使古籍文本在基础语义层面获得统一的处理逻辑。古籍自动置标语义框架能够实现大规模自动化古籍文献内容结构生成式表征,为古籍整理智能化转型提供一种自动可行的技术方案。 展开更多
关键词 古籍文本 生成式表征 自动置标语义框架 大语言模型
下载PDF
基于ChatGPT的生成式人工智能自动化控制系统
11
作者 何安元 《计算机测量与控制》 2024年第9期142-148,共7页
将人工智能技术与自动控制相结合是自动化控制系统发展的趋势,因此,设计基于ChatGPT的生成式人工智能自动化控制系统;该系统划分为5个部分,输入层通过语音、文本、图像等形式将用户的控制信息输入系统内;ChatGPT处理层采用神经语义分析... 将人工智能技术与自动控制相结合是自动化控制系统发展的趋势,因此,设计基于ChatGPT的生成式人工智能自动化控制系统;该系统划分为5个部分,输入层通过语音、文本、图像等形式将用户的控制信息输入系统内;ChatGPT处理层采用神经语义分析算法分析用户输入的控制信息的语义,提取用户意图与需求,生成相应的控制指令;在此基础上,指令生成层负责将生成的控制指令转化为具体的控制信号,并传输至控制执行层,利用模糊PID控制器实现被控目标的自动化控制;控制后学习优化层收集和分析用户的行为和反馈,以及被控目标的运行状态,以此学习和优化ChatGPT模型;经实验测试,该系统能够有效分析输入控制信息的语义,分析结果的问题匹配度和上下文相关交互匹配度分别达到97%和91%以上,并且能够准确控制被控目标的动作。 展开更多
关键词 ChatGPT 生成式 人工智能 自动化控制 语义分析 模糊PID
下载PDF
基于非局部操作和多尺度特征聚合的图像修复方法
12
作者 吕秀丽 王阳 曹志民 《化工自动化及仪表》 CAS 2024年第5期821-829,共9页
为有效解决修复大范围破损图像时存在的纹理模糊和整体语义信息不连贯的问题,提出基于非局部操作和多尺度特征聚合的两阶段图像修复算法,在第1阶段,边缘重建网络生成整体的边缘结构信息;在第2阶段,引入非局部操作机制进行纹理细节信息... 为有效解决修复大范围破损图像时存在的纹理模糊和整体语义信息不连贯的问题,提出基于非局部操作和多尺度特征聚合的两阶段图像修复算法,在第1阶段,边缘重建网络生成整体的边缘结构信息;在第2阶段,引入非局部操作机制进行纹理细节信息的修复。在CelebA-HQ数据集上采用不同掩码率的图像进行性能验证,结果显示所提模型的PSNR和SSIM分别达到了32.17 dB和0.982;与EdgeConnect、RFR、CTSDG和AOT-GAN模型进行比较,结果表明:该模型对大范围破损图像能够生成纹理更加清晰且语义合理的修复图像,PSNR、SSIM和FID指标均优于其他4种算法。 展开更多
关键词 图像修复 大范围破损 非局部操作 多尺度特征聚合 生成对抗网络 纹理模糊 掩码率 整体语义信息不连贯
下载PDF
融合词语语义与标签依赖的隐式篇章关系识别
13
作者 吕国英 郭校金 贾荣荣 《软件导刊》 2024年第4期1-7,共7页
中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法... 中文隐式篇章关系识别旨在推断出两个论元间的篇章关系类型。然而,现有的方法往往忽略了论元中词语所蕴含的关键信息,并且仅考虑单个层级内的篇章关系类型,忽略了各层级间篇章关系的依赖关联。鉴于此,提出融合词语语义和标签依赖的方法,以序列生成的方式实现篇章关系识别,先根据相似度权重将词向量嵌入到字编码表示中,应用字词对齐注意力机制强调关键字、词信息,再采用标签注意力编码从蕴含词语语义的论元表示和篇章关系表示中获取篇章关系依赖性的上下文表示,以自下而上的方式预测顶层的篇章关系类型。此外,构建面向阅读理解篇章的篇章关系数据集,并在该数据集上展开实验,结果显示隐式篇章关系识别准确率和F1值分别达到74.19%和73.81%,最终验证了该方法的有效性。 展开更多
关键词 隐式篇章关系 词语语义 标签依赖 序列生成
下载PDF
结合语义分割图的注意力机制文本生成图像
14
作者 梁成名 李云红 +3 位作者 李丽敏 苏雪平 朱绵云 朱耀麟 《空军工程大学学报》 CSCD 北大核心 2024年第4期118-127,共10页
针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合... 针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合文本信息。其次结合语义分割图像,提取其边缘轮廓特征,为模型提供额外的生成和约束条件。然后采用注意力机制为模型提供细粒度词级信息,丰富所生成图像的细节。最后使用多模态相似度计算模型计算细粒度的图像-文本匹配损失,更好地训练生成器。通过CUB-200和Oxford-102 Flowers数据集测试并验证模型,结果表明:所提模型(SSA-GAN)与StackGAN、AttnGAN、DF-GAN以及RAT-GAN等模型最终生成的图像质量相比,IS指标值最高分别提升了13.7%和43.2%,FID指标值最高分别降低了34.7%和74.9%,且具有更好的可视化效果,证明了所提方法的有效性。 展开更多
关键词 文本生成图像 语义分割图像 生成对抗网络 注意力机制 仿射变换
下载PDF
专有名词增强的复述生成方法研究
15
作者 张雪 陈钰枫 +1 位作者 徐金安 田凤占 《计算机工程》 CAS CSCD 北大核心 2024年第3期98-105,共8页
现有的中文复述生成模型在对包含专有名词的原句生成复述句时经常丢失原句中的专有名词,造成复述句的语义偏移,降低复述句的可用性,进而影响其在下游任务中的应用效果。为了解决这类问题,提出专有名词增强的复述生成方法。针对包含单个... 现有的中文复述生成模型在对包含专有名词的原句生成复述句时经常丢失原句中的专有名词,造成复述句的语义偏移,降低复述句的可用性,进而影响其在下游任务中的应用效果。为了解决这类问题,提出专有名词增强的复述生成方法。针对包含单个专有名词的原句构建基于占位符的复述生成模型,通过将训练句对中的专有名词用占位符替换,训练模型对占位符的保留能力;针对包含多个专有名词的原句构建词汇约束的复述生成模型,通过将专有名词列表与原句拼接并进行区分,训练模型对多个专有名词的识别和复制能力,提高复述句对专有名词的保留率。此外,综合考虑语义一致性和表达多样性,提出参考句无关的复述句质量评价指标用来评估生成复述句的质量。以真实对话系统业务中的意图识别冷启动任务为下游任务,对比不同模型生成复述句的质量以及在意图识别任务上的准确率。实验结果表明,词汇约束的复述生成模型能够生成与原句语义一致且表达具有多样性的高质量复述语料,对应语料训练得到的意图识别模型准确率最高,相较于未考虑专有名词的复述模型,意图识别模型的准确率提高了5.38%。 展开更多
关键词 复述生成 语义偏移 占位符 词汇约束 意图识别
下载PDF
一种融合标签信息的多标签文本分类方法
16
作者 任彦凝 陈俊霖 刘群 《小型微型计算机系统》 CSCD 北大核心 2024年第3期584-590,共7页
多标签文本分类旨在从若干标签中选取最相关的标签子集来标记一个样本点.传统的研究倾向于探讨标签间关系而忽略标签语义,造成信息提取不完整,因此如何利用标签元数据有效提取样本中的关键信息是需要解决的一个重要问题.为解决上述问题... 多标签文本分类旨在从若干标签中选取最相关的标签子集来标记一个样本点.传统的研究倾向于探讨标签间关系而忽略标签语义,造成信息提取不完整,因此如何利用标签元数据有效提取样本中的关键信息是需要解决的一个重要问题.为解决上述问题,本文首先提出从现有数据集中生成标签语义元数据的方法,利用注意力模型对样本中混杂的语义进行筛选和清洗,生成标签的语义信息,解决了标签语义获取困难的问题.其次提出combined-attention模型用以提取样本中的关键信息,此模型将标签语义和标签关系结合起来共同提取样本中的信息,并且其内部设置了自适应融合单元,将以上两种关键信息根据其在分类结果中的关键程度自适应分配权重,进一步提升了模型的分类能力.3个英文数据集上的实验结果表明本模型优于最先进的基线方法,在分类精度上最高提升了5.68%,在真实的中文法律数据集上也实现了优异的分类效果. 展开更多
关键词 多标签文本分类 注意力 注意力头 语义生成
下载PDF
基于生成对抗网络和视觉-语义对齐的零样本害虫识别方法
17
作者 李天俊 杨信廷 +3 位作者 陈晓 胡焕 周子洁 李文勇 《智慧农业(中英文)》 CSCD 2024年第2期72-84,共13页
[目的/意义]害虫的精准识别对农作物虫害有效防治具有重大意义。然而,当前的害虫图像识别模型都是针对闭集数据构建的模型,难以对训练集中没有出现过的害虫种类(不可见害虫)进行推理,导致在实际应用过程中遇见不可见类别昆虫时误判现象... [目的/意义]害虫的精准识别对农作物虫害有效防治具有重大意义。然而,当前的害虫图像识别模型都是针对闭集数据构建的模型,难以对训练集中没有出现过的害虫种类(不可见害虫)进行推理,导致在实际应用过程中遇见不可见类别昆虫时误判现象尤为严重。[方法]针对这一问题,提出了一种适用零样本学习(Zero-Shot Learning,ZSL)和广义零样本学习(Generalized Zero-Shot Learning,GZSL)范式的害虫图像识别方法VSAWGAN,可以实现对可见(训练集中包含的类别)与不可见害虫种类的辨识。该方法基于生成对抗网络(Genera⁃tive Adversarial Network,GAN)生成伪视觉特征,将零样本害虫识别问题转化为传统监督学习任务,且通过引入对比学习来优化生成器的生成质量,添加视觉-语义对齐模块进一步约束生成器,使其能生成更具判别性的特征。[结果与讨论]在自建的一个适用于零样本学习研究的害虫数据集和几个公开数据集对提出方法进行了评估。其中,在多个公开数据上取得了目前最优结果,相比之前方法最大提升达到2.8%;在自建20类害虫数据集上取得了零样本设置下77.4%的识别精度和广义零样本设置下78.3%的调和精度,相比之前方法分别提升了2.1%和1.2%。[结论]所提方法能有效地将害虫的视觉特征泛化到不可见类,实现害虫的零样本识别,有助于提升害虫识别模型的泛化能力,为农作物新虫害的发现与防治提供帮助。 展开更多
关键词 害虫识别 语义知识 图像特征 生成对抗网络 对比学习 广义零样本学习
下载PDF
一种基于语义引导和对比学习的战场图像去烟算法
18
作者 熊佳梅 王永振 +1 位作者 燕雪峰 魏明强 《兵工学报》 EI CAS CSCD 北大核心 2024年第2期671-683,共13页
烟雾作为现代战争中最常见的作战产物,不可避免地会降低作战场景的可视性,进而影响下游军事智能系统的性能,因此对含烟图像进行复原处理非常重要,现有算法通常忽略图像中高阶的语义信息和降质图像本身都可以为提高网络去烟能力提供有价... 烟雾作为现代战争中最常见的作战产物,不可避免地会降低作战场景的可视性,进而影响下游军事智能系统的性能,因此对含烟图像进行复原处理非常重要,现有算法通常忽略图像中高阶的语义信息和降质图像本身都可以为提高网络去烟能力提供有价值的监督信息。为此,提出一种基于语义引导和对比学习的生成对抗网络来去除战场图像中的烟雾。通过在低阶视觉任务中融入高阶语义特征,将语义信息作为引导帮助网络更好地恢复图像的结构和色彩信息;利用对比学习范式将清晰和含烟图像构建为正、负样本,并采用对比约束使去烟后的图像与清晰图像接近,并远离含烟图像。此外,为模拟真实的战场含烟场景,首次构建一套含烟战场数据集,推进了相关研究的发展。实验结果表明,与现有图像去烟算法相比,所提方法在定量和定性指标上均达到了先进水平。 展开更多
关键词 军事智能 图像去烟 生成对抗网络 语义引导 对比学习 注意力机制
下载PDF
基于多通道多步融合的生成式视觉对话模型
19
作者 陈思航 江爱文 +1 位作者 崔朝阳 王明文 《计算机应用》 CSCD 北大核心 2024年第1期39-46,共8页
当前视觉对话任务在多模态信息融合和推理方面取得了较大进展,但是,在回答一些涉及具有比较明确语义属性和位置空间关系的问题时,主流模型的能力依然有限。比较少的主流模型在正式响应之前能够显式地提供有关图像内容的、语义充分的细... 当前视觉对话任务在多模态信息融合和推理方面取得了较大进展,但是,在回答一些涉及具有比较明确语义属性和位置空间关系的问题时,主流模型的能力依然有限。比较少的主流模型在正式响应之前能够显式地提供有关图像内容的、语义充分的细粒度表达。视觉特征表示与对话历史、当前问句等文本语义之间缺少必要的、缓解语义鸿沟的桥梁,因此提出一种基于多通道多步融合的视觉对话模型MCMI。该模型显式提供一组关于视觉内容的细粒度语义描述信息,并通过“视觉−语义−对话”历史三者相互作用和多步融合,能够丰富问题的语义表示,实现较为准确的答案解码。在VisDial v0.9/VisDial v1.0数据集中,MCMI模型较基准模型双通道多跳推理模型(DMRM),平均倒数排名(MRR)分别提升了1.95和2.12个百分点,召回率(R@1)分别提升了2.62和3.09个百分点,正确答案平均排名(Mean)分别提升了0.88和0.99;在VisDial v1.0数据集中,较最新模型UTC(Unified Transformer Contrastive learning model),MRR、R@1、Mean分别提升了0.06百分点,0.68百分点和1.47。为了进一步评估生成对话的质量,提出类图灵测试响应通过比例M1和对话质量分数(五分制)M2两个人工评价指标。在VisDial v0.9数据集中,相较于基准模型DMRM,MCMI模型的M1和M2指标分别提高了9.00百分点和0.70。 展开更多
关键词 视觉对话 生成式任务 视觉语义描述 多步融合 多通道融合
下载PDF
基于实例分布约束的事件语义自动划分
20
作者 高剑奇 骆祥峰 裴昕淼 《应用科学学报》 CAS CSCD 北大核心 2024年第2期323-333,共11页
针对离散分布于新闻文本集合中的事件语义难以聚合的问题,提出了基于实例分布约束的事件语义自动划分算法。首先,利用远程监督方法,构建用于事件语义划分的训练数据集;其次,设计基于实例分布约束的事件语义分类器,用于判断新的事件触发... 针对离散分布于新闻文本集合中的事件语义难以聚合的问题,提出了基于实例分布约束的事件语义自动划分算法。首先,利用远程监督方法,构建用于事件语义划分的训练数据集;其次,设计基于实例分布约束的事件语义分类器,用于判断新的事件触发词的加入是否影响事件语义的聚合;最后,在该分类器的基础上设计事件语义集合生成算法,在不需要预先设定事件类型的情况下,将分布离散的事件触发词自动地划分到不同的事件语义集合中。结果表明本方法可有效实现事件语义的自动划分,为事件语义的高质量聚合提供了一种新的探索。 展开更多
关键词 实例分布约束 事件语义自动划分 远程监督 事件语义分类器 集合生成算法
下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部