期刊文献+
共找到707篇文章
< 1 2 36 >
每页显示 20 50 100
Highly maneuvering target tracking using multi-parameter fusion Singer model 被引量:2
1
作者 Shuyi Jia Yun Zhang Guohong Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2017年第5期841-850,共10页
An algorithm of highly maneuvering target tracking is proposed to solve the problem of large tracking error caused by strong maneuver. In this algorithm, a new estimator, named as multi-parameter fusion Singer (MF-Sin... An algorithm of highly maneuvering target tracking is proposed to solve the problem of large tracking error caused by strong maneuver. In this algorithm, a new estimator, named as multi-parameter fusion Singer (MF-Singer) model is derived based on the Singer model and the fuzzy reasoning method by using radial acceleration and velocity of the target, and applied to the problem of maneuvering target tracking in strong maneuvering environment and operating environment. The tracking performance of the MF-Singer model is evaluated and compared with other manuevering tracking models. It is shown that the MF-Singer model outperforms these algorithms in several examples. 展开更多
关键词 maneuvering target multi-parameter fusion Singer (MF-Singer) fuzzy reasoning Singer model
下载PDF
Combination Model for Sentiment Classification Based on Multi-feature Fusion
2
作者 Wenqing Zhao Yaqin Yang 《通讯和计算机(中英文版)》 2012年第8期890-895,共6页
关键词 朴素贝叶斯分类器 多特征融合 组合模型 情感 组合模式 选择模型 召回率 信息
下载PDF
基于多模型融合的中长期径流集成预测方法 被引量:1
3
作者 朱非林 陈嘉乙 +2 位作者 张咪 徐向荣 钟平安 《水力发电》 CAS 2024年第2期6-13,29,共9页
中长期水文预报是流域水资源规划与合理配置的重要依据。为提高中长期径流预测精度,提出了一种基于多模型融合的水库中长期径流集成预测方法。该方法将ARMA、BP、LSTM、RF和SVR等5个异质预测模型进行融合,同时采用超参数优化方法确定各... 中长期水文预报是流域水资源规划与合理配置的重要依据。为提高中长期径流预测精度,提出了一种基于多模型融合的水库中长期径流集成预测方法。该方法将ARMA、BP、LSTM、RF和SVR等5个异质预测模型进行融合,同时采用超参数优化方法确定各模型的最优参数。将其用于青海省龙羊峡水库的中长期径流预报中,结果表明,通过Stacking融合算法建立的集成预测模型相较于单一模型,取得了更高的预测精度(R2值由0.71提升至0.82)。此方法可为提升流域中长期径流预测精度提供一定参考。 展开更多
关键词 中长期径流预报 ARMA BP LSTM RF SVR 多模型融合 集成预测 Stacking融合算法 超参数寻优 龙羊峡水库
下载PDF
面向水库型小流域的多源水利三维建模方法研究 被引量:1
4
作者 胡金龙 胡宜娜 +2 位作者 钱进 朱海波 胡文斌 《水利信息化》 2024年第1期41-45,共5页
针对大型河道三维可视化建模中采用激光雷达、声呐等传感器获取水下地形建模方式操作复杂且成本较高的缺陷,在利用基础测绘成果构建实景地形模型的基础上,采用多源三维模型融合方法对月塘水库小流域进行实景建模。首先采用倾斜摄影三维... 针对大型河道三维可视化建模中采用激光雷达、声呐等传感器获取水下地形建模方式操作复杂且成本较高的缺陷,在利用基础测绘成果构建实景地形模型的基础上,采用多源三维模型融合方法对月塘水库小流域进行实景建模。首先采用倾斜摄影三维建模技术对重点水利工程进行实景建模,并利用专业建模软件对重要控制单元进行构件级建模;然后利用已有河道断面数据结合河流面状矢量数据,实现流域内胥浦河河道实景三维建模;最后通过人机交互方式对多源实景模型进行微调与相互印证,实现月塘水库小流域多源三维模型精准融合构建。研究成果可为河道型水库的预报调度与洪水风险分析提供可视化模型基础与决策支撑。 展开更多
关键词 实景三维建模 多源模型融合 倾斜摄影 数据生态 水库型小流域
下载PDF
ENHANCING GROUND RESOLUTION OF TM6 BASED ON MULTI-VARIATE REGRESSION MODEL AND SEMI-VARIOGRAM FUNCTION
5
作者 MA Hongchao LI Deren 《Geo-Spatial Information Science》 2001年第1期43-49,共7页
It is well known that Landsat TM images are the most widely used remote sensing data in various fields.Usually,it has 7 different electromagnetic spectrum bands,among which the sixth one has much lower ground resoluti... It is well known that Landsat TM images are the most widely used remote sensing data in various fields.Usually,it has 7 different electromagnetic spectrum bands,among which the sixth one has much lower ground resolution compared with the other six bands.Nevertheless,it is useful in the study of rock spectrum reflection,geothermal resources exploration,etc.To improve the ground resolution of TM6 to the level as that of the other six bands is a problem .This paper presents an algorithm based on the combination of multivariate regression model with semivariogram function which can improve the ground resolution of TM6 by "fusing" the data of other six bands.It includes the following main steps: (1) testing the correlation between TM6 and one of TM15,7.If the correlation coefficient between TM6 and another one is greater than a given threshold value,then select the band to the regression analysis as an argument.(2) calculating the size of the template window within which some parameters needed by the regression model will be calculated; (3) replacing the original pixel values of TM6 by those obtained by regression analysis; (4) using image entropy as a measurement to evaluate the quality of the fused image of TM6.The basic mechanism of the algorithm is discussed and the V C ++ program for implementing this algorithm is also presented.A simple application example is given in the last part of this paper,showing the effectiveness of the algorithm. 展开更多
关键词 multi-variate regression model semi-variogram FUNCTION image fusion TEMPLATE WINDOW V C++ PROGRAMMING
下载PDF
基于特征匹配度与异类子模型融合的安全性评估方法
6
作者 徐晓滨 张云硕 +2 位作者 施凡 常雷雷 陶志刚 《计算机工程》 CAS CSCD 北大核心 2024年第8期113-122,共10页
机器学习模型的好坏影响预测精度、输入与输出结果的拟合情况。在复杂系统中,使用单一模型评估系统安全性问题时容易受数据量、数据格式、模型结构以及环境干扰等因素影响,使得这个模型在解决某个问题的能力上比较出色,而在解决其他问题... 机器学习模型的好坏影响预测精度、输入与输出结果的拟合情况。在复杂系统中,使用单一模型评估系统安全性问题时容易受数据量、数据格式、模型结构以及环境干扰等因素影响,使得这个模型在解决某个问题的能力上比较出色,而在解决其他问题时,结果却不尽如人意。针对上述问题,提出一种基于特征匹配度和异类子模型融合的安全性评估方法。首先,按照采样数据的输出值划分不同规模的数据集并构建子模型;其次,通过计算每个新数据对于这些子模型的匹配度,进而得到每个子模型的权重;最后,根据权重大小融合所有子模型的子输出得到最终的多模型融合结果。所提方法对山东省济宁市霄云煤矿采掘数据集进行研究,实验结果表明,该方法与多样本单模型、少样本单模型和传统多模型方法相比,在以330/70的比例来构建子模型的情况下均方根误差(RMSE)分别降低了15.13%、51.67%和12.46%,该方法充分集成各子模型所能提供的有效信息,减少和分散单一模型的预测误差,以提高模型的预测精度和泛化能力。 展开更多
关键词 特征匹配度 异类子模型 单模型 多模型融合 安全性评估
下载PDF
一种基于多模型融合的隐蔽隧道和加密恶意流量检测方法
7
作者 顾国民 陈文浩 黄伟达 《信息网络安全》 CSCD 北大核心 2024年第5期694-708,共15页
高级持续威胁APT攻击为了躲避检测,攻击者往往采用加密恶意流量和隐蔽隧道等策略隐匿恶意行为,从而增加检测的难度。目前大多数检测DNS隐蔽隧道的方法基于统计、频率、数据包等特征,这种方法不能很好地进行实时检测,从而导致数据泄露,因... 高级持续威胁APT攻击为了躲避检测,攻击者往往采用加密恶意流量和隐蔽隧道等策略隐匿恶意行为,从而增加检测的难度。目前大多数检测DNS隐蔽隧道的方法基于统计、频率、数据包等特征,这种方法不能很好地进行实时检测,从而导致数据泄露,因此,需要根据单个DNS请求进行检测而不是对流量进行统计后再检测,才能够实现实时且可靠的检测,当系统判定单个DNS请求为隧道流量,便可做出响应,进而避免数据泄露。而现有的加密恶意检测方法存在无法完整提取流量特征信息、提取特征手段单一、特征利用少等问题。因此,文章提出了基于多模型融合的隐蔽隧道加密恶意流量检测方法。对于DNS隐蔽隧道,文章提出了MLP、1D-CNN、RNN模型融合的检测方法并根据提出的数学模型计算融合结果,该方法能够对隐蔽隧道实时监测,进一步提高检测的整体准确率。对于加密恶意流量,文章提出了1D-CNN、LSTM模型的并行融合的检测方法,并行融合模型能够更加全面地提取特征信息,反应流量数据的全貌,进而提高模型的检测精度。 展开更多
关键词 加密恶意流量检测 DNS隐蔽隧道检测 多模型融合
下载PDF
基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别方法
8
作者 胡宏宇 黎烨宸 +3 位作者 张争光 曲优 何磊 高镇海 《汽车工程》 EI CSCD 北大核心 2024年第1期1-8,28,共9页
识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image base... 识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image based behavior recognition network,SIBBR-Net)。SIBBR-Net通过基于多尺度图的图卷积网络和基于局部视觉及注意力机制的卷积神经网络,充分提取运动和外观特征,较好地平衡了模型表征能力和计算量间的关系。基于手部运动的特征双向引导学习策略、自适应特征融合模块和静态特征空间上的辅助损失,使运动和外观特征间互相引导更新并实现自适应融合。最终在Drive&Act数据集进行算法测试,SIBBR-Net在动态标签和静态标签条件下的平均正确率分别为61.78%和80.42%,每秒浮点运算次数为25.92G,较最优方法降低了76.96%。 展开更多
关键词 驾驶员行为识别 多尺度骨架图 局部视觉上下文 多模态数据自适应融合
下载PDF
基于残差密集融合对抗生成网络的PET-MRI图像融合
9
作者 刘尚旺 杨荔涵 《河南师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期74-83,I0005,共11页
为了增强核磁共振与正电子发射断层扫描图像融合的纹理细节,摆脱人工设计融合规则对先验知识的依赖.提出了自适应的残差密集生成对抗网络(adaptive dense residual generative adversarial network,ADRGAN)来融合两种模态的医学图像.ADR... 为了增强核磁共振与正电子发射断层扫描图像融合的纹理细节,摆脱人工设计融合规则对先验知识的依赖.提出了自适应的残差密集生成对抗网络(adaptive dense residual generative adversarial network,ADRGAN)来融合两种模态的医学图像.ADRGAN设计了区域残差学习模块与输出级联生成器,在加深网络结构的同时避免特征丢失;然后,设计了基于自适应模块的内容损失函数,强化输出融合图像的内容信息;最后,通过源图像的联合梯度图与融合图像的梯度图构建对抗性博弈来高效训练生成器与鉴别器.实验结果表明,ADRGAN在哈佛医学院MRI/PET数据集的测试中峰值信噪比和结构相似度分别达到55.2124和0.4697,均优于目前最先进的算法;所构建的模型具有端对端和无监督两特性,无需人工干预,也不需要真实数据作为标签. 展开更多
关键词 深度学习 对抗生成网络 多模态图像融合 密集残差网络
下载PDF
自适应特征融合的多模态实体对齐研究 被引量:1
10
作者 郭浩 李欣奕 +2 位作者 唐九阳 郭延明 赵翔 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期758-770,共13页
多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过... 多模态数据间交互式任务的兴起对于综合利用不同模态的知识提出了更高的要求,因此融合不同模态知识的多模态知识图谱应运而生.然而,现有多模态知识图谱存在图谱知识不完整的问题,严重阻碍对信息的有效利用.缓解此问题的有效方法是通过实体对齐进行知识图谱补全.当前多模态实体对齐方法以固定权重融合多种模态信息,在融合过程中忽略不同模态信息贡献的差异性.为解决上述问题,设计一套自适应特征融合机制,根据不同模态数据质量动态融合实体结构信息和视觉信息.此外,考虑到视觉信息质量不高、知识图谱之间的结构差异也影响实体对齐的效果,本文分别设计提升视觉信息有效利用率的视觉特征处理模块以及缓和结构差异性的三元组筛选模块.在多模态实体对齐任务上的实验结果表明,提出的多模态实体对齐方法的性能优于当前最好的方法. 展开更多
关键词 多模态知识图谱 实体对齐 预训练模型 特征融合
下载PDF
Obstacle avoidance technology of bionic quadruped robot based on multi-sensor information fusion
11
作者 韩宝玲 张天 +2 位作者 罗庆生 朱颖 宋明辉 《Journal of Beijing Institute of Technology》 EI CAS 2016年第4期448-454,共7页
In order to improve the ability of a bionic quadruped robot to percept the location of obstacles in a complex and dynamic environment, the information fusion between an ultrasonic sensor and a binocular sensor was stu... In order to improve the ability of a bionic quadruped robot to percept the location of obstacles in a complex and dynamic environment, the information fusion between an ultrasonic sensor and a binocular sensor was studied under the condition that the robot moves in the Walk gait on a structured road. Firstly, the distance information of obstacles from these two sensors was separately processed by the Kalman filter algorithm, which largely reduced the noise interference. After that, we obtained two groups of estimated distance values from the robot to the obstacle and a variance of the estimation value. Additionally, a fusion of the estimation values and the variances was achieved based on the STF fusion algorithm. Finally, a simulation was performed to show that the curve of a real value was tracked well by that of the estimation value, which attributes to the effectiveness of the Kalman filter algorithm. In contrast to statistics before fusion, the fusion variance of the estimation value was sharply decreased. The precision of the position information is 4. 6 cm, which meets the application requirements of the robot. 展开更多
关键词 multi-SENSOR Kalman filter algorithm constant velocity (CV) model STF fusion algo-rithm obstacle avoidance of robot
下载PDF
大区域实景三维模型拼接融合方法及应用
12
作者 张广庆 王新田 +2 位作者 张允涛 吴琪 孟萌 《山东国土资源》 2024年第2期33-39,共7页
随着实景三维中国建设的开展,大区域实景三维重建与更新已成为迫切需求,其建模面积大、模型成果异构、多尺度等特点导致场景拼接与融合成为丞待解决的问题,本文分别从影像及控制点重叠建立空三工程、包含相同控制点的空三工程融合2个角... 随着实景三维中国建设的开展,大区域实景三维重建与更新已成为迫切需求,其建模面积大、模型成果异构、多尺度等特点导致场景拼接与融合成为丞待解决的问题,本文分别从影像及控制点重叠建立空三工程、包含相同控制点的空三工程融合2个角度,探究了从数据处理中实现三维场景拼接的方法,其次从模型成果的角度通过邻域瓦块的几何拓扑优化实现三维场景无缝拼接,文章对3种方法进行了试验对比及适用性分析,该研究解决了大场景三维模型拼接的问题,促进了实景三维高效高质建设。 展开更多
关键词 大区域 实景三维模型 多尺度 拼接融合
下载PDF
多源数据融合的深埋隧道岩爆预测方法
13
作者 张平 任松 +2 位作者 吴斐 刘跃 陈星宇 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期707-716,共10页
为提高隧道设计阶段未开挖区域的岩爆预测准确性,提出了一种多源数据融合的隧道岩爆预测方法.综合隧道勘察和施工阶段的不同地质信息,采用基于证据关联系数的加权融合技术,构建了隧道精细化三维动态地质模型.建立了基于强度理论的岩爆... 为提高隧道设计阶段未开挖区域的岩爆预测准确性,提出了一种多源数据融合的隧道岩爆预测方法.综合隧道勘察和施工阶段的不同地质信息,采用基于证据关联系数的加权融合技术,构建了隧道精细化三维动态地质模型.建立了基于强度理论的岩爆可能性判定方法和基于能量理论的岩爆烈度预测方法,通过Hoek-Brown强度准则判断围岩是否发生岩爆,利用储能极限阈值和能量释放指数划分岩爆烈度,并将其应用于四川某隧道工程中.结果表明,所提方法可以实现隧道掌子面前方30 m范围内的岩爆精准预测,预测结果与隧道开挖实际岩爆的吻合率为95.8%.因此,该预测方法能够在隧道施工前预判岩爆烈度,为隧道岩爆防治提供指导. 展开更多
关键词 隧道 地质信息 多源融合 三维地质模型 双控理论 岩爆预测
下载PDF
多源数据融合的高层建筑物三维建模研究
14
作者 王宗辉 温世林 《科技资讯》 2024年第5期5-9,共5页
随着无人机的大规模普及,倾斜摄影测量技术应用越来越广泛,但是由于其技术特点,在数据采集过程中受角度、遮蔽等因素的影响,导致三维模型极易出现拉花、扭曲等问题。基于此,探讨了融合机载激光雷达(Light Laser Detection and Ranging,L... 随着无人机的大规模普及,倾斜摄影测量技术应用越来越广泛,但是由于其技术特点,在数据采集过程中受角度、遮蔽等因素的影响,导致三维模型极易出现拉花、扭曲等问题。基于此,探讨了融合机载激光雷达(Light Laser Detection and Ranging,LiDAR)、地面数据采集和倾斜摄影技术的方法,以提高高层建筑物三维建模的精度和细节。机载LiDAR技术通过激光雷达扫描获取点云数据,提供建筑物的几何形状和细节信息,倾斜摄影技术可以提供建筑物纹理信息,与机载LiDAR技术结合可以提高建模的真实感和精度。点面三维激光扫描仪能够有效补充前两项技术的缺失,如补充细节数据。研究融合三种数据源的信息,综合利用它们的优势,为城市规划、建设和管理提供更准确、可靠的数据支持。 展开更多
关键词 多源数据 融合 三维建模 数据处理
下载PDF
面向复杂环境的UWB/LiDAR/IMU组合定位方法 被引量:1
15
作者 杨秀建 敖鹏 +2 位作者 沈世全 杨义兴 皇甫尚昆 《中国惯性技术学报》 EI CSCD 北大核心 2024年第7期654-662,共9页
针对室外全球卫星导航系统(GNSS)拒止并且超宽带(UWB)和LiDAR在非视距和点云特征稀疏环境下定位效果较差的问题,提出了一种面向复杂环境的UWB/LiDAR/惯性测量单元(IMU)组合定位方法。首先,利用LiDAR和UWB的互补特性设计了时变因子,用于... 针对室外全球卫星导航系统(GNSS)拒止并且超宽带(UWB)和LiDAR在非视距和点云特征稀疏环境下定位效果较差的问题,提出了一种面向复杂环境的UWB/LiDAR/惯性测量单元(IMU)组合定位方法。首先,利用LiDAR和UWB的互补特性设计了时变因子,用于对车辆进行重定位;然后,引入三种运动模型描述车辆的运动状态,各模型采用无迹卡尔曼滤波方法设计滤波器;最后,将重定位后的车辆定位和IMU的测量数据作为交互式多模型-无迹卡尔曼滤波算法的状态输入,解算出最终的车辆位置。实验结果表明,所提组合定位方法具有较高的定位精度,相对于UWB和LiDAR单一传感器,视距环境下的定位精度分别提升了35.1%和22.8%,非视距环境下分别提升了53.1%和27.2%;所提重定位方法相对于UWB和LiDAR单一传感器,视距环境下的定位精度分别提升了23.2%和8.7%,非视距环境下分别提升了42.9%和11.4%,体现出了较高的定位精度和对复杂环境的适应能力。 展开更多
关键词 无人车辆 融合定位 超宽带 交互式多模型 无迹卡尔曼滤波
下载PDF
基于DS证据理论的电网信息自动融合模型构建
16
作者 汤德荣 《佳木斯大学学报(自然科学版)》 CAS 2024年第7期52-55,共4页
多智能体感知的智能电网信息中,通常存在信息冗余与缺失等问题。为解决这些问题,研究构建智能电网多智能体信息自动化融合模型,精准自动化融合多智能体信息,改进DS证据组合规则,完成决策级信息自动化融合,提升自动化融合效果,为智能电... 多智能体感知的智能电网信息中,通常存在信息冗余与缺失等问题。为解决这些问题,研究构建智能电网多智能体信息自动化融合模型,精准自动化融合多智能体信息,改进DS证据组合规则,完成决策级信息自动化融合,提升自动化融合效果,为智能电网的后续应用,提供更加全面的信息。 展开更多
关键词 智能电网 多智能体信息 自动化 融合模型 神经网络
下载PDF
多视图专家组区域建议预测的视觉跟踪 被引量:1
17
作者 单彬 丁昕苗 +1 位作者 王铭淏 郭文 《计算机工程与设计》 北大核心 2024年第2期459-466,共8页
为解决大多数最新的目标跟踪器都面临着判别特征表示缺乏多样性、目标定位过于模糊以及正样本的数量要求问题,提出一种基于多视图的顶层特征的区域建议网络的跟踪预测学习算法。融合多种视图的特征表示方式,利用丰富多样的语义信息,有... 为解决大多数最新的目标跟踪器都面临着判别特征表示缺乏多样性、目标定位过于模糊以及正样本的数量要求问题,提出一种基于多视图的顶层特征的区域建议网络的跟踪预测学习算法。融合多种视图的特征表示方式,利用丰富多样的语义信息,有效解决判别特征过于单一的问题。在扩展的边界框上构建多个支持向量机模型并加入区域建议网络模块,精确优化边界框,预测最优的目标位置,缓解目标定位过于模糊和正样本的数量有限的问题。通过大量视频基准序列对方法的综合评价,其结果表明,提出方法融合了轻量化的深度学习模型和多视图专家组的优点,使跟踪性能有了显著提升。 展开更多
关键词 区域建议预测 特征判别机制 多专家组模型 多视图模型 特征融合 视觉跟踪 深度学习
下载PDF
基于注意力网络尺度特征融合的遥感场景分类
18
作者 帖军 肖鹏飞 +2 位作者 郑禄 马海荣 彭丹 《中南民族大学学报(自然科学版)》 CAS 2024年第4期474-484,共11页
针对遥感数据集存在的类内差异性大和类间相似性高的特点导致遥感场景分类准确率不高的问题,提出了一种基于注意力网络尺度特征融合(MSA-CNN)的遥感影像场景分类模型.将遥感图像经过尺度变换操作输入到VGG-16网络提取遥感影像的多尺度特... 针对遥感数据集存在的类内差异性大和类间相似性高的特点导致遥感场景分类准确率不高的问题,提出了一种基于注意力网络尺度特征融合(MSA-CNN)的遥感影像场景分类模型.将遥感图像经过尺度变换操作输入到VGG-16网络提取遥感影像的多尺度特征,使用多选框注意力模型(MS-APN)提取图像多尺度下的目标区域,对目标区域进行剪切和放大并输入到三层网络结构中.融合原始影像的多尺度特征和目标区域的特征,并且利用LBP对全局特征表达,克服遥感图像因拍摄角度不同带来的差异性.将融合的多尺度特征输入到网络全连接层来完成最终的分类预测任务.实验结果显示:MSA-CNN平均分类精度较注意循环卷积网络(ARCNet)和传统细粒度循环注意力网络(RA-CNN)在NWPU-RESISC45公开数据集上分别提升1.63%和2.66%,在UC Merced Land-Use公开数据集上较RA-CNN提升0.64%.结果表明:提出的MSA-CNN能够有效提高遥感图像场景分类的准确率. 展开更多
关键词 遥感图像 场景分类 多尺度特征 多选框注意力模型 LBP特征融合
下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:1
19
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 Res2Net结构 错误拒绝 多模型融合
下载PDF
结合轻量化与多尺度融合的交通标志检测算法
20
作者 兰红 王惠钊 《计算机工程》 CAS CSCD 北大核心 2024年第10期381-392,共12页
交通标志检测在自动驾驶领域具有重要的应用价值,及时准确地检测交通目标对提高驾驶安全性和预防交通事故具有重要意义。针对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,在YOLOv8的结构基础上提出一种结合轻量化与... 交通标志检测在自动驾驶领域具有重要的应用价值,及时准确地检测交通目标对提高驾驶安全性和预防交通事故具有重要意义。针对交通标志尺寸小,易受遮挡,在复杂环境下容易出现漏检、错检等问题,在YOLOv8的结构基础上提出一种结合轻量化与多尺度融合的交通标志检测网络架构M-YOLO,构建M-YOLOs模型来应对高精度需求的检测任务,并调整网络深度得到更轻量化的M-YOLOn模型来解决不同环境下的检测需求。首先针对交通标志目标尺寸小、图像特征流失的问题,通过增加小目标检测层,保留更多的特征信息,提高网络对于小目标的特征学习能力。提出高效多尺度特征金字塔融合网络MPANet,将浅层特征图进行降维与跳跃连接,从而融合更多的图像特征信息。然后提出融合稀疏注意力和空间注意力的BRSA注意力模块,有效提取全局和局部的位置信息,减少复杂背景下对于关键信息的干扰。最后设计两种轻量高效的BBot模块和C2fGhost模块,以提高模型运算速度并减少参数量。实验结果表明,M-YOLO相较于YOLOv8,参数量降低约1/3。在TT100K数据集和GTSDB数据集上,M-YOLOs检测精度分别提升了9.7和2.1个百分点,M-YOLOn检测精度分别提升了14.5和2.6个百分点,在轻量化的同时具备更高的检测效果。M-YOLO架构解决了浅层特征图在特征提取过程中信息丢失的问题,并显著降低模型特征提取过程中冗余的计算开销,在实景采集的数据集上证实效果有效,表明在交通标志检测任务中具有应用价值。 展开更多
关键词 卷积神经网络 轻量化模型 目标检测 注意力模块 多尺度融合
下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部