期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于视觉空间定向理论的虚拟现实空间重构 被引量:20
1
作者 夏振平 胡伏原 +1 位作者 程成 顾敏明 《液晶与显示》 CAS CSCD 北大核心 2019年第2期215-219,共5页
立体视觉中,虚拟的中央眼是立体空间定向的依据。中央眼存在个体差异,然而现有虚拟现实技术在立体影像呈现过程中尚未考虑到中央眼的个体差异。模拟的射击实验结果表明,人眼视觉系统对立体空间中,物体之间相对方向的判断极其敏感,实际... 立体视觉中,虚拟的中央眼是立体空间定向的依据。中央眼存在个体差异,然而现有虚拟现实技术在立体影像呈现过程中尚未考虑到中央眼的个体差异。模拟的射击实验结果表明,人眼视觉系统对立体空间中,物体之间相对方向的判断极其敏感,实际中央眼位置与理想情况之间的微小偏移会带来显著性的感知差异。虚拟现实技术模拟真实场景的拟真性和交互性可以通过考虑个体中央眼位置的方式进行提升。本文通过对人眼双目定向理论的分析,提出了基于中央眼位置的虚拟空间重构方法,采用对立体相机系统反方向平移的方法补偿由于中央眼偏移带来的偏差。所提出的方法有望为虚拟现实技术拟真性和交互性的提升提供理论依据。 展开更多
关键词 虚拟现实 中央眼 空间定向 空间重构
下载PDF
一种面向智能家居设备控制的多模态人机智能交互方法 被引量:10
2
作者 邵帮丽 朱寅 +4 位作者 朱润 潘晨曦 王坚 奚雪峰 杨颢 《林业工程学报》 CSCD 北大核心 2021年第4期190-196,共7页
传统家居设备人机交互主要采用接触式控制方式,限制了用户双手的活动空间,难以满足日益繁多的智能设备控制便利性需求。而语音控制这种非接触的控制形式虽然解放了用户双手,能够提供自然的控制方式,但这种基于单模态的控制方式仍然存在... 传统家居设备人机交互主要采用接触式控制方式,限制了用户双手的活动空间,难以满足日益繁多的智能设备控制便利性需求。而语音控制这种非接触的控制形式虽然解放了用户双手,能够提供自然的控制方式,但这种基于单模态的控制方式仍然存在识别准确率不高等问题。融合视觉、声音等多模态信息的方法,能够形成模态信息之间的互补性,已在多个领域得到成功应用。受此启发,针对上述家居设备人机交互控制两个方面的问题,提出一种融合语音识别与手势识别的多模态人机智能交互方法,实现高效准确的非接触式智能家居人机交互。首先,采用基于Keras搭建的CNN模型以及ResNet50两种网络模型得到两种手势控制命令识别结果;其次,通过语音识别及处理,形成文本控制命令识别结果;最后,对上述3种控制命令结果通过投票法进行多模态融合,选取概率最高的结果作为最终控制命令输出。其中,采用常用手势符号作为系统预定义手势标签,降低记忆的要求,方便用户使用。同时,针对家居控制手势图片数据集不足的情况,还构建了一个包含28 105张图片的手势数据集。实验结果表明,多模态交互方式能够弥补家居设备单一控制交互的缺陷,并且提高了控制指令的准确性,准确率达96.33%。 展开更多
关键词 智能家居 手势识别 语音识别 人机交互 模态融合
下载PDF
图神经网络在命名实体识别中的应用研究
3
作者 束文豪 奚雪峰 +1 位作者 崔志明 顾晨凯 《计算机工程与应用》 CSCD 北大核心 2023年第19期52-65,共14页
命名实体识别是自然语言处理的预处理任务之一,目的是从非结构化文本中识别出所需的实体及类型,应用于众多下游任务,例如构建知识图谱、事件抽取及自动问答等。近几年,随着自然语言处理领域对图神经网络的广泛应用,一些基于图神经网络... 命名实体识别是自然语言处理的预处理任务之一,目的是从非结构化文本中识别出所需的实体及类型,应用于众多下游任务,例如构建知识图谱、事件抽取及自动问答等。近几年,随着自然语言处理领域对图神经网络的广泛应用,一些基于图神经网络的命名实体识别方法取得了较好的结果。对图神经网络在命名实体识别中的应用进行了系统性的调研,描述了命名实体识别的发展进程,介绍了图神经网络及三种变体模型,详细分析了如何利用图神经网络的特点在命名实体识别任务上的应用研究,最后提出了未来可能研究的方向和思路。 展开更多
关键词 命名实体识别 图神经网络 自然语言处理 深度学习
下载PDF
面向知识图谱的会话式机器阅读理解研究综述
4
作者 胡娟 奚雪峰 崔志明 《计算机工程与应用》 CSCD 北大核心 2024年第3期17-28,共12页
对话式机器阅读理解随着数据集的发展而发展,目的在于让机器在理解文章内容的基础上能够进行多轮对话。但现有的模型方法无法从对话历史中捕获到与当前问题最相关的历史信息,模型的推理能力较差,很难获取实体间的隐含信息。知识图谱应... 对话式机器阅读理解随着数据集的发展而发展,目的在于让机器在理解文章内容的基础上能够进行多轮对话。但现有的模型方法无法从对话历史中捕获到与当前问题最相关的历史信息,模型的推理能力较差,很难获取实体间的隐含信息。知识图谱应用于推理问答是当前的一大研究热点。知识图谱技术可以推断出实体间的隐含关系,应用于推理问答则能够提升模型的推理问答能力,提高预测的准确率。近年来,知识图谱推理技术的广泛应用,极大地推动了知识图谱推理问答的发展。对基于知识图谱的会话式机器阅读理解从三方面进行总结:介绍了会话式机器阅读理解领域的数据集以及当前的一些典型的模型方法,并对模型的性能和优缺点作了简要的分析与比较;介绍了知识图谱的定义、架构以及四大核心技术,并简要介绍了三大类知识图谱推理问答的模型方法;最后总结工作,并根据会话式机器阅读理解的数据集特点和知识图谱推理问答模型的缺点,对未来的研究重点进行展望。 展开更多
关键词 机器阅读理解 多轮对话 知识图谱 知识图谱推理问答
下载PDF
基于改进DBSCAN算法的智能照明控制系统 被引量:4
5
作者 汤烨 陆卫忠 +1 位作者 陈成 王磊 《苏州科技大学学报(工程技术版)》 CAS 2017年第4期70-75,共6页
在大型场所,针对传统照明系统无法实时、智能地控制照明区域,导致电能浪费的现象,设计了一种基于改进DBSCAN算法的智能照明控制系统。首先,使用传感器获取室内人员位置信息;然后,将位置信息转化为照明平面上的二维坐标数据并使用改进后... 在大型场所,针对传统照明系统无法实时、智能地控制照明区域,导致电能浪费的现象,设计了一种基于改进DBSCAN算法的智能照明控制系统。首先,使用传感器获取室内人员位置信息;然后,将位置信息转化为照明平面上的二维坐标数据并使用改进后的DBSCAN聚类算法对数据进行聚类分析,找出人员分布相对密集的区域;最后,用单位容量法确定每个区域需要开启的灯具个数。通过对照明区域的实时、智能控制,有效节约电能。实验结果表明,当照明场所内人员较少,或人员分布不集中时,节能效果明显。 展开更多
关键词 聚类 DBSCAN 智能照明 单位容量法
下载PDF
人物关系网络在包装产品精准营销中的应用 被引量:1
6
作者 彭丽丽 奚雪峰 《苏州科技大学学报(自然科学版)》 CAS 2018年第3期70-73,共4页
在当今信息化社会中,人物关系网络研究具有十分重要的意义,它蕴含了巨大的商机,并可应用于不同的领域。在包装产品信息分析中,文本信息是重要的基础资源,将原始文本经过命名实体识别、人物实体关系抽取、指代消解等技术处理后,构建出人... 在当今信息化社会中,人物关系网络研究具有十分重要的意义,它蕴含了巨大的商机,并可应用于不同的领域。在包装产品信息分析中,文本信息是重要的基础资源,将原始文本经过命名实体识别、人物实体关系抽取、指代消解等技术处理后,构建出人物社会关系网络来服务于包装产品的精准营销,是一种行之有效的方法。实验结果表明,人物关系网络构建方法具有领域可移植性,它便于在大规模的网络文本中对包装产品相关文本进行灵活分析,从而为包装产品生产经营者精准营销提供辅助决策功能,其方法具有较强的实用价值。 展开更多
关键词 人物关系网络 自然语言处理 精准营销 包装产品 结构化信息
下载PDF
基于联合注意与特征关联的实例分割算法
7
作者 周逸云 万新军 +1 位作者 胡伏原 陈昊 《计算机工程》 CAS CSCD 北大核心 2023年第6期217-226,共10页
针对现有实例分割算法因目标特征表示不充分、模型捕获信息不完整等因素导致分割精度较低的问题,提出一种基于联合注意和特征关联的实例分割算法。该算法采用联合注意力机制,沿通道和空间两个不同维度对感兴趣区域特征进行权重优化,聚... 针对现有实例分割算法因目标特征表示不充分、模型捕获信息不完整等因素导致分割精度较低的问题,提出一种基于联合注意和特征关联的实例分割算法。该算法采用联合注意力机制,沿通道和空间两个不同维度对感兴趣区域特征进行权重优化,聚焦关键对象位置,实现目标特征表示,抑制冗余信息对实例检测和分割结果干扰。在此基础上,在分割阶段建立特征关联关系,充分挖掘实例内部各像素点相似性,加强网络对实例部分的细节特征感知,实现高质量的掩膜预测。此外,通过引入协调损失函数监督检测中分类和回归任务产生一致预测,提高目标对象检测的准确性,进一步提升分割性能。在MS COCO 2017和Cityscapes两个数据集上进行实验验证,结果表明:该算法能够有效提高各现实场景下实例的检测和分割质量。当主干网络为ResNet-50/101时,该算法在COCO数据集上的掩膜平均精度分别达到37.5%和38.6%,较基线方法Mask R-CNN分别提高1.9和2.4个百分点;在Cityscapes验证集和测试集上,该算法较Mask R-CNN在主干网络为ResNet-50时分别提高2.4和2.5个百分点。 展开更多
关键词 计算机视觉 实例分割 联合注意 特征关联 掩膜预测
下载PDF
基于姿态编码器的2D/3D脊椎医学图像实时配准方法
8
作者 徐少康 张战成 +2 位作者 姚浩男 邹智伟 张宝成 《计算机应用》 CSCD 北大核心 2023年第2期589-594,共6页
2D/3D医学图像配准是骨科手术三维实时导航中的一项关键技术,然而传统的基于优化迭代的2D/3D配准方法需要经过多次迭代计算,无法满足医生在手术过程中对于实时配准的要求。针对该问题,提出一种基于自编码器的姿态回归网络来通过隐空间... 2D/3D医学图像配准是骨科手术三维实时导航中的一项关键技术,然而传统的基于优化迭代的2D/3D配准方法需要经过多次迭代计算,无法满足医生在手术过程中对于实时配准的要求。针对该问题,提出一种基于自编码器的姿态回归网络来通过隐空间解码捕获几何姿态信息,从而快速地回归出术中X射线图像对应的术前脊椎位置的3D姿态,并经过重新投影生成最终的配准图像。通过引入新的损失函数,以“粗细”结合配准的方式对模型进行约束,保证了姿态回归的精确度。在CTSpine1K脊椎数据集中抽取100组CT扫描图像进行10折交叉验证,实验结果表明:所提出的模型所生成的配准结果图像与X射线图像的平均绝对误差(MAE)为0.04,平均目标配准误差(mTRE)为1.16 mm,单帧耗时1.7 s。与基于传统优化的方法相比,该模型配准时间大幅缩短。相较于基于学习的方法,该模型在快速配准的同时,保证了较高的配准精度。可见,所提模型可以满足术中实时高精配准的要求。 展开更多
关键词 2D/3D图像配准 自编码器 隐空间 姿态回归 骨科手术
下载PDF
多标签文本分类研究回顾与展望
9
作者 张文峰 奚雪峰 +2 位作者 崔志明 邹逸晨 栾进权 《计算机工程与应用》 CSCD 北大核心 2023年第18期28-48,共21页
文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支。为了对多标签文本分类领域进行深入了解,介绍了多标签文本分类的概念和流程。将近年来多标签文本分类方法划分为基于传统机器学习方法和基于... 文本分类(TC)是自然语言处理(NLP)领域的重要基础任务,多标签文本分类(MLTC)是TC的重要分支。为了对多标签文本分类领域进行深入了解,介绍了多标签文本分类的概念和流程。将近年来多标签文本分类方法划分为基于传统机器学习方法和基于深度学习方法,梳理了多标签文本分类领域常用的数据集和评价指标,分析了部分多标签文本分类模型的优势和存在问题。介绍了多标签文本分类的研究方向:标签相关性、特定标签特性、类别不平衡、标签丢失和标签压缩。对多标签文本分类的难点和未来的发展方向进行了总结展望。 展开更多
关键词 多标签文本分类 深度学习 标签相关性 特定标签特性 类别不平衡
下载PDF
地名实体识别研究与展望
10
作者 王文涛 奚雪峰 +1 位作者 崔志明 徐川 《计算机工程与应用》 CSCD 北大核心 2023年第21期66-82,共17页
地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数... 地名作为一种常见的命名实体,广泛存在于非结构化文本中。是非结构化数据转为结构化过程中重要的关联实体。为了全面了解地名识别的最新研究成果和现状,概述了地名识别现有的应用场景、地名识别技术在具体场景的详细应用以及地名识别数据集和评价指标。总结分析了现有的地名识别方法:基于规则和地名词典匹配的方法、基于统计机器学习的方法、基于深度学习模型和混合模型方法。归纳总结了每一种地名识别方法的关键思路、优缺点和具体模型。同时对混合方法的融合特征和模型特点进行了总结归纳。并从模型性能展开比对分析,以及对词嵌入模型和预训练模型的模型特点进行了总结归纳。对地名实体识别研究方向进行总结和展望。 展开更多
关键词 命名实体识别 地名实体识别 自然语言处理 深度学习 信息抽取
下载PDF
基于深度学习的灾后建筑物损坏程度检测综述
11
作者 陈晓艺 陆一鸣 +2 位作者 沈加炜 钱美玲 陆卫忠 《计算机技术与发展》 2023年第9期1-7,共7页
遥感图像分类和语义分割是一项非常有应用价值的计算机视觉任务。由于现实生活对遥感信息有更高的需求,使计算机视觉领域中高分辨率遥感图像研究日益活跃。其广泛应用于国土资源监测、道路提取和土地划分等领域。自然灾害后建筑物损害... 遥感图像分类和语义分割是一项非常有应用价值的计算机视觉任务。由于现实生活对遥感信息有更高的需求,使计算机视觉领域中高分辨率遥感图像研究日益活跃。其广泛应用于国土资源监测、道路提取和土地划分等领域。自然灾害后建筑物损害程度检测也作为其应用领域之一,目的是对灾后建筑物损坏程度进行相关检测和评估。近年来,随着深度学习的发展,遥感图像领域取得巨大进展,深度学习在遥感图像分类和语义分割领域中的应用获得了巨大的成功,使其解析遥感图像信息和提取底物特征的速度更快,也在很大程度上提高了处理遥感图像相关任务的准确性。因此,深度学习中的计算机视觉技术对自然灾害后建筑物损害程度检测具有很大帮助。该文介绍了基于深度学习的自然灾害后建筑物损坏程度检测的相关任务、难点和发展现状。接着对xBD数据集进行介绍,并说明了不同算法模型的相关评价标准。然后对深度学习方法中几种应用于建筑物损坏程度检测的卷积神经网络模型进行总结和对比。最后对其存在的问题及未来可能的发展方向进行了讨论。 展开更多
关键词 遥感图像 深度学习 计算机视觉 自然灾害 建筑物损坏程度检测
下载PDF
基于深度学习的人体行为检测方法研究综述
12
作者 沈加炜 陆一鸣 +2 位作者 陈晓艺 钱美玲 陆卫忠 《计算机与现代化》 2023年第9期1-9,共9页
当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热,并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪... 当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热,并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪音影响从而降低精确率等缺点,而不断发展的深度学习技术逐渐展现出它的优势,可以很好地解决这些问题。本文基于此,首先介绍一些目前常用的行为识别数据集并在此基础上剖析当下基于深度学习的人体行为识别检测的研究现状;其次描述常见的人体行为识别检测方法及其识别的流程;最后对现存的各种行为识别检测方法性能、现存问题进行总结和未来发展方向进行展望。 展开更多
关键词 深度学习 人体行为检测 智能监控 行为数据集
下载PDF
汉语篇章微观话题结构建模与语料库构建 被引量:9
13
作者 奚雪峰 褚晓敏 +1 位作者 孙庆英 周国栋 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1833-1852,共20页
篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论... 篇章话题结构分析是自然语言理解的前沿基础,而大规模高质量的适用于汉语篇章分析的语料资源缺乏,严重制约了相关篇章话题计算模型的研究.针对上述问题,首先研究了汉语篇章话题结构的理论表示体系.分析了主述位理论、英语修辞结构理论和宾州篇章树库体系的优势,结合汉语复句句群理论以及汉语自身特点,提出了一种基于主述位理论的汉语篇章微观话题结构表示方式,并借助微观话题链构建了汉语篇章话题结构表示体系.随后,在此基础上,采用自顶向下、后向搜索的标注策略和人机结合的语料库标注方式,构建了基于篇章微观话题表示体系的汉语篇章话题结构语料库(Chinese discourse topic corpus,CDTC).CDTC共包含500个文档,对其进行了详细统计分析并展示了语料库的标注情况.与宾州篇章树库体系、广义话题结构理论的对比表明,所提篇章微观话题结构表示体系在理论上具有一定的优越性,并且符合汉语特点;一致性检验表明CDTC能够充分体现汉语篇章话题分析问题本身的难度,并能够为相关研究提供语料资源支持. 展开更多
关键词 篇章话题结构 主位-述位理论 主位推进 话题链 语料库构建
下载PDF
基于Spark的大数据聚类研究及系统实现 被引量:24
14
作者 王磊 邹恩岑 +2 位作者 曾诚 奚雪峰 陆悠 《数据采集与处理》 CSCD 北大核心 2018年第6期1077-1085,共9页
传统聚类算法由于单机内存和运算能力的限制已经不能满足当前大数据处理的要求,因而迫切需要寻找新的解决方法。针对单机内存运算问题,结合聚类算法的迭代计算特点,提出并实现了一种基于Spark平台的聚类系统。针对稀疏集和密集集两种不... 传统聚类算法由于单机内存和运算能力的限制已经不能满足当前大数据处理的要求,因而迫切需要寻找新的解决方法。针对单机内存运算问题,结合聚类算法的迭代计算特点,提出并实现了一种基于Spark平台的聚类系统。针对稀疏集和密集集两种不同类型的数据集,系统首先采用不同策略实现数据预处理;其次分析比较了不同聚类算法在Spark平台下的聚类性能,并给出最佳方案;最后利用数据持久化技术提高了计算速度。实验结果表明,所提系统能够有效满足海量数据聚类分析的任务要求。 展开更多
关键词 SPARK 聚类 大数据
下载PDF
增强型深度确定策略梯度算法 被引量:7
15
作者 陈建平 何超 +3 位作者 刘全 吴宏杰 胡伏原 傅启明 《通信学报》 EI CSCD 北大核心 2018年第11期106-115,共10页
针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样... 针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样性样本池和高误差样本池按比例选取,以兼顾样本多样性以及样本价值信息,提高样本的利用效率和算法的收敛性能。此外,进一步从理论上证明了利用自模拟度量方法对样本进行相似性度量的合理性,建立值函数与样本相似性之间的关系。将E-DDPG算法以及DDPG算法用于经典的Pendulum问题和MountainCar问题,实验结果表明,E-DDPG具有更好的收敛稳定性,同时具有更快的收敛速率。 展开更多
关键词 深度强化学习 样本排序 自模拟度量 时间差分误差
下载PDF
深度卷积神经网络图像实例分割方法研究进展 被引量:9
16
作者 胡伏原 万新军 +3 位作者 沈鸣飞 徐江浪 姚睿 陶重犇 《计算机科学》 CSCD 北大核心 2022年第5期10-24,共15页
图像实例分割是图像处理和计算机视觉技术中关于图像理解的重要环节,随着深度学习和深层卷积神经网络日趋成熟,基于深度卷积神经网络的图像实例分割方法取得了跨越性进展。实例分割任务实际上是目标检测和语义分割两项任务的结合,可以... 图像实例分割是图像处理和计算机视觉技术中关于图像理解的重要环节,随着深度学习和深层卷积神经网络日趋成熟,基于深度卷积神经网络的图像实例分割方法取得了跨越性进展。实例分割任务实际上是目标检测和语义分割两项任务的结合,可以在像素层面完成识别图像中目标轮廓的任务。实例分割不仅可以定位图像中目标的位置,从像素层面上分割所有目标,还可以标注出图像中同一类别的不同个体,既是对图像的像素级分割,又是实例级理解。首先,阐述了图像实例分割产生的原因和深度卷积神经网络的作用。然后,根据图像实例分割方法的过程和特征,分别从两阶段和单阶段的角度介绍了图像实例分割的研究进展,详细阐述了两类方法的优势和不足,进而总结了各类实例分割方法对区域、特征提取和掩膜的设计思路。此外,归纳了图像实例分割方法的性能评价标准和常用的公开数据集,并在此基础上对比和评估了主流的图像实例分割模型的分割精度。最后,指出了当前图像实例分割存在的问题及解决思路,并对其未来发展进行了总结和展望。 展开更多
关键词 实例分割 深度卷积神经网络 目标检测 语义分割 两阶段 单阶段
下载PDF
基于冷暖白光LED的线性调光混合照明 被引量:5
17
作者 夏振平 付保川 程成 《发光学报》 EI CAS CSCD 北大核心 2018年第5期730-736,共7页
为了提供高品质、更安全和智能的照明光源,基于冷暖白光LED建立了线性调光混合照明系统及其优化调光调色方法。混合照明光源以色温和明度等级分别设定光色度和光强度,更加符合人性化需求。在系统智能优化配光过程中,设定色温转换为CIE u... 为了提供高品质、更安全和智能的照明光源,基于冷暖白光LED建立了线性调光混合照明系统及其优化调光调色方法。混合照明光源以色温和明度等级分别设定光色度和光强度,更加符合人性化需求。在系统智能优化配光过程中,设定色温转换为CIE u'v'均匀色品坐标,明度转换为亮度,使优化计算更加精确。系统采用的线性调光避免了闪烁潜在的安全风险,同时配合优化算法解决了线性调光色度漂移大的问题。实验结果表明,系统混合光的色度稳定性可以保持在1阶CIE u'v'圆内,相应色度设定下的整个光强度调节范围内无可察觉的色差。理论研究和实验结果表明该混光照明系统简单可行,具有较高的实用价值。 展开更多
关键词 白光LED 混合照明 线性调光 色差 CIE u′v′圆
下载PDF
面向图像自动语句标注的注意力反馈模型 被引量:5
18
作者 吕凡 胡伏原 +2 位作者 张艳宁 夏振平 盛胜利 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第7期1122-1129,共8页
图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的... 图像自动语句标注利用计算机自动生成描述图像内容的语句,在服务机器人等领域有广泛应用.许多学者已经提出了一些基于注意力机制的算法,但是注意力分散问题以及由注意力分散引起的生成语句错乱问题还未得到较好解决.在传统注意力机制的基础上引入注意力反馈机制,利用关注信息的图像特征指导文本生成,同时借助生成文本中的关注信息进一步修正图像中的关注区域,该过程不断强化图像和文本中的关键信息匹配、优化生成的语句.针对常用数据集Flickr8k, Flickr30k 和MSCOCO 的实验结果表明,该模型在一定程度上解决了注意力分散和语句顺序错乱问题,比其他基于注意力机制方法标注的关注区域更加准确,生成语句更加通顺. 展开更多
关键词 图像自动语句标注 注意力机制 注意力反馈
下载PDF
面向意图性的篇章话题结构分析研究与展望 被引量:4
19
作者 奚雪峰 孙庆英 周国栋 《计算机学报》 EI CSCD 北大核心 2019年第12期2769-2794,共26页
篇章话题结构分析主要针对篇章的意图性,是篇章语义分析的基础,其主要任务是从整体层次上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章.篇章分析既需要研究篇章的基本构成单元,更需要研究基本构成单元之间的篇章关系... 篇章话题结构分析主要针对篇章的意图性,是篇章语义分析的基础,其主要任务是从整体层次上分析出篇章结构及其构成单元之间的语义关系,并利用上下文理解篇章.篇章分析既需要研究篇章的基本构成单元,更需要研究基本构成单元之间的篇章关系.然而当前自然语言处理的研究重心大都集中在词法和句法领域,而忽略了对篇章内在规律的研究,缺乏对篇章话题结构展开有效分析的系统理论方法,这就极大阻碍了基于篇章语义分析的相关应用.本文首先从篇章衔接性和连贯性两个基本特征入手,讨论了篇章话题结构分析的国内外研究现状,从理论体系探索、语料库构建和计算模型三方面展开详细综述,分析对比了各类理论、资源及其模型的特点.其中,理论部分代表性的工作包括语域加衔接理论,Hobbs模型,修辞结构理论,PDTB体系,意图结构理论,宏观结构理论等;资源部分主要工作有修辞结构篇章树库、宾州篇章树库、MUC语料、ACE评测语料、ARRAU、OntoNotes和篇章图库等;在计算模型方面,主要围绕上述理论和技术资源展开相关研究;随后,特别讨论了汉语篇章话题结构的最新研究进展.基于上述讨论,本文分析探索了基于主述位理论的篇章微观话题结构表示体系,并描述了相应语料库资源的构建及其一致性检验;篇章微观话题结构形式化表示为一个三元组,其主要特征是一种链式结构,链结点为篇章基本话题(子句),其内部的主位或述位为连接端,连接端之间通过微观话题联接建立起连接关系,其实质是一种语义关联,体现篇章之间的衔接关系.最后,本文还对篇章话题结构研究的未来发展方向进行了总结展望. 展开更多
关键词 篇章话题结构 篇章理论 语料库标注 计算模型 篇章意图性 篇章语义分析
下载PDF
基于卷积神经网络的目标检测算法综述 被引量:17
20
作者 胡伏原 李林燕 +2 位作者 尚欣茹 沈军宇 戴永良 《苏州科技大学学报(自然科学版)》 CAS 2020年第2期1-10,25,共11页
针对基于卷积神经网络的目标检测算法的国内外发展现状进行综述。首先,回顾了传统目标检测算法的发展历程和算法尚存的问题。然后,简要阐述了基于卷积神经网络(CNN)的目标检测算法原理和优势,并根据算法处理目标分类和边框回归使用的解... 针对基于卷积神经网络的目标检测算法的国内外发展现状进行综述。首先,回顾了传统目标检测算法的发展历程和算法尚存的问题。然后,简要阐述了基于卷积神经网络(CNN)的目标检测算法原理和优势,并根据算法处理目标分类和边框回归使用的解决思路不同,分别介绍了基于候选区域的多阶段目标检测算法和基于回归思想的一阶段检测算法;依据算法发展演变过程,对每个类别中若干经典算法的产生背景、解决问题和设计思路进行了描述。最后,在公开的MS COCO与Pascal VOC数据集上对算法检测效果进行对比分析,并对未来发展趋势进行展望。 展开更多
关键词 计算机视觉 目标检测 深度学习 卷积神经网络
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部