期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
基于类的余弦距离聚类缺失值填补方法研究
1
作者 夏婷婷 林康 +1 位作者 张潇予 刘海忠 《河南科技》 2024年第8期28-35,共8页
【目的】为了解决欧氏距离计算相似性带来的高维度问题,提出了基于类的余弦距离聚类缺失值填补方法。【方法】首先将不完整数据集分为两个不同的组(G1和GIM);其次通过聚类中心对GIM组中的缺失数据进行预填补;再次利用余弦距离计算相关性... 【目的】为了解决欧氏距离计算相似性带来的高维度问题,提出了基于类的余弦距离聚类缺失值填补方法。【方法】首先将不完整数据集分为两个不同的组(G1和GIM);其次通过聚类中心对GIM组中的缺失数据进行预填补;再次利用余弦距离计算相关性;最后选择与G1组中距离最小的数据来填补缺失值。【结果】实验结果表明,该方法在类别和混合数据集上均优于其他插补方法。【结论】该方法显著提高了准确率、召回率、F1-score及插补效果。 展开更多
关键词 不完整数据 缺失值插补 聚类 余弦距离
下载PDF
基于余弦距离和DBSCAN聚类的小电阻接地系统选线方法 被引量:1
2
作者 郭左 张恒伟 +3 位作者 张贝贝 董淑海 董新伟 朱聪 《电工技术》 2023年第9期39-44,共6页
针对小电阻接地系统发生单相高阻接地故障时存在的保护死区问题,依据接地线路与正常线路零序电流相位存在明显差异的特点,提出一种基于余弦距离和DBSCAN聚类的小电阻接地系统选线方法,通过计算馈线零序电流余弦距离矩阵并结合DBSCAN聚... 针对小电阻接地系统发生单相高阻接地故障时存在的保护死区问题,依据接地线路与正常线路零序电流相位存在明显差异的特点,提出一种基于余弦距离和DBSCAN聚类的小电阻接地系统选线方法,通过计算馈线零序电流余弦距离矩阵并结合DBSCAN聚类算法实现选线。对于工程中零序电流互感器极性错误,通过对零序电流进行预处理,进一步提高选线的可靠性。通过仿真验证所提方法在单相高阻接地、谐波干扰、零序电流互感器极性错误、同相两点接地、母线接地等情况下能可靠选线。 展开更多
关键词 电阻接地系统 单相高阻接地 余弦距离 零序电流
下载PDF
基于余弦距离的人体运动数据行为分割算法 被引量:4
3
作者 邢薇薇 仝磊鸣 +1 位作者 张毅 任程 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第4期1128-1136,共9页
对人体运动捕捉数据进行行为分割是人体运动数据分析与合成中的关键处理步骤,为此,提出一种新的人体运动数据行为分割算法。采用骨骼夹角直方图刻画人体运动统计特征,使用余弦相似度作为人体运动数据骨骼夹角直方图特征的相似性度量,实... 对人体运动捕捉数据进行行为分割是人体运动数据分析与合成中的关键处理步骤,为此,提出一种新的人体运动数据行为分割算法。采用骨骼夹角直方图刻画人体运动统计特征,使用余弦相似度作为人体运动数据骨骼夹角直方图特征的相似性度量,实现对运动行为的自动分割。对于给定的人体运动捕捉序列,首先定义滑动比较窗口,计算当前窗口范围内运动序列前、后2部分骨骼夹角直方图统计特征的余弦相似度,然后通过在运动序列上滑动该窗口,获得运动序列的余弦相似度曲线,曲线最小值位置即为不同类型行为的分割点。在CMU人体运动捕捉数据库上进行数值实验。研究结果表明:本文算法能够实现对人体运动捕捉数据的自动行为分割;与广泛采用的基于PPCA的行为分割方法相比,本文算法具有良好的性能。 展开更多
关键词 人体运动分割 运动捕捉数据 骨骼夹角 余弦距离 曲线简化
下载PDF
基于余弦距离的中文问答系统中问句相似度计算 被引量:4
4
作者 陈仕鸿 刘晓庆 《福建电脑》 2017年第2期31-32,共2页
构建一个Linux学习的FAQ问答系统。在比较用户提问和知识库中的问句相似度过程中,采用余弦相似度计算方法,将问句转换为向量空间中的向量,计算它们之间的余弦值作为相似度量值。测试结果表明,问句相似度的计算准确度基本满足系统要求,... 构建一个Linux学习的FAQ问答系统。在比较用户提问和知识库中的问句相似度过程中,采用余弦相似度计算方法,将问句转换为向量空间中的向量,计算它们之间的余弦值作为相似度量值。测试结果表明,问句相似度的计算准确度基本满足系统要求,具有一定的实用意义。 展开更多
关键词 问答系统 余弦距离 相似度计算 向量
下载PDF
余弦距离算法在固定资产管理系统中文本相似度查询的应用 被引量:1
5
作者 朱云峰 《无锡商业职业技术学院学报》 2013年第6期96-99,共4页
针对固定资产管理过程中,由于资产设备命名的不规范,导致资产名不匹配、资产找不到、资产设备重复统计等问题,提出了一个基于余弦距离算法的文本相似度查询方案。文章分析了资产设备命名不规范的原因,通过对聚类分析常用的几种距离算法... 针对固定资产管理过程中,由于资产设备命名的不规范,导致资产名不匹配、资产找不到、资产设备重复统计等问题,提出了一个基于余弦距离算法的文本相似度查询方案。文章分析了资产设备命名不规范的原因,通过对聚类分析常用的几种距离算法进行研究与比较,确定并通过程序实现了以余弦距离算法为基础的文本相似度查询的应用,对两种距离算法进行了测试,证明了余弦距离算法在固定资产管理系统中文本相似度查询中优势。 展开更多
关键词 文本相似度 样本距离算法 欧式距离算法 余弦距离算法
下载PDF
基于Lucene的余弦距离检测文档相似度方法的研究 被引量:6
6
作者 刘妍 《信息系统工程》 2014年第4期129-130,142,共3页
本文详细探讨了余弦距离的含义及计算公式,演示了通过余弦距离手工检测文档相似度的方法,并基于Lucene 4.7框架编写了验证程序,上述探讨及编程对有关的工程实践有着积极的借鉴意义。
关键词 余弦距离 文档 相似度
下载PDF
基于余弦距离和超限学习机的模拟电路故障预测方法 被引量:4
7
作者 刘张亮 邓芳明 +2 位作者 郝勇 吴翔 付智辉 《仪表技术与传感器》 CSCD 北大核心 2016年第8期84-86,共3页
文中提出了基于余弦距离和超限学习机的预测方法。通过提取被测电路电压信号,计算余弦距离,从而表征了电路元件的退化情况。同时,将超限学习机用于故障预测,预测各个时间点的元件退化情况并估计电路元件的剩余寿命。仿真实验表明,该方... 文中提出了基于余弦距离和超限学习机的预测方法。通过提取被测电路电压信号,计算余弦距离,从而表征了电路元件的退化情况。同时,将超限学习机用于故障预测,预测各个时间点的元件退化情况并估计电路元件的剩余寿命。仿真实验表明,该方法能够有效、准确预测电路元件的剩余寿命。 展开更多
关键词 余弦距离 超限学习机 模拟电路 故障预测 剩余寿命
下载PDF
基于余弦距离的多目标粒子群优化算法 被引量:4
8
作者 方欣欣 龚如宾 李大为 《电子科技》 2016年第3期48-52,57,共6页
针对粒子群优化算法具有的个体分布不均匀以及重复个体较多等缺陷,提出了一种基于余弦距离的多目标粒子群优化算法,该算法根据外部精英存储策略,利用余弦距离排挤机制来选取最分散的粒子,扩大Pareto最优解集的收敛性和多样性,增强算法... 针对粒子群优化算法具有的个体分布不均匀以及重复个体较多等缺陷,提出了一种基于余弦距离的多目标粒子群优化算法,该算法根据外部精英存储策略,利用余弦距离排挤机制来选取最分散的粒子,扩大Pareto最优解集的收敛性和多样性,增强算法的全局寻优能力。通过采用标准多目标优化问题ZDTl^ZDT3进行仿真实验与粒子群算法、混沌粒子群算法、基于拥挤距离的多目标优化算法对比表明,该算法在Pareto前沿的收敛性和多样性方面均优于基于拥挤距离排挤机制,并具有较高的效率。 展开更多
关键词 余弦距离 拥挤距离 多目标优化 粒子群 非支配解
下载PDF
余弦距离下保护型迁移学习聚类算法 被引量:1
9
作者 张焱凯 包芳 王士同 《计算机工程与应用》 CSCD 北大核心 2015年第23期131-138,225,共9页
以往研究者都从公式的合理性出发研究迁移学习和传统机器学习,但他们忽视了对问题的整体性考虑,致使在具体应用到文本分类问题时,无法实现彻底的分类。通过研究文本分类的整个过程,在k-均值算法中使用余弦距离,显著提高了实验结果;提出... 以往研究者都从公式的合理性出发研究迁移学习和传统机器学习,但他们忽视了对问题的整体性考虑,致使在具体应用到文本分类问题时,无法实现彻底的分类。通过研究文本分类的整个过程,在k-均值算法中使用余弦距离,显著提高了实验结果;提出保护型迭代思想,同时弃用传统的词特征空间,采用隐空间作为特征向量空间,实施归一化约束。以CCI算法为例,结合提出的改进思想,产生改进算法PCCI,在降低计算复杂度的同时显著提高迁移学习的分类正确率。通过在数据集20-News Groups和Reuters-21578上测试并与现有其他迁移学习算法进行比较,证明了该改进算法的优越性。 展开更多
关键词 迁移学习 欧式距离 余弦距离 保护型 归一化约束 过维数
下载PDF
基于余弦距离选取初始簇中心的文本聚类研究 被引量:22
10
作者 王彬宇 刘文芬 +1 位作者 胡学先 魏江宏 《计算机工程与应用》 CSCD 北大核心 2018年第10期11-18,共8页
文本聚类是文本信息进行有效组织、摘要和导航的重要手段,其中基于余弦相似度的K-means算法是最重要且使用最广泛的文本聚类算法之一。针对基于余弦相似度的K-means算法改进方案设计困难,且众多优异的基于欧氏距离的K-means改进方法无... 文本聚类是文本信息进行有效组织、摘要和导航的重要手段,其中基于余弦相似度的K-means算法是最重要且使用最广泛的文本聚类算法之一。针对基于余弦相似度的K-means算法改进方案设计困难,且众多优异的基于欧氏距离的K-means改进方法无法适用的问题,对余弦相似度与欧氏距离的关系进行探讨,得到标准向量前提下二者的转化公式,并在此基础上定义一种与欧氏距离意义相近关系紧密的余弦距离,使原有基于欧氏距离的K-means改进方法可通过余弦距离迁移到基于余弦相似度的K-means算法中。在此基础上理论推导出余弦K-means算法及其拓展算法的簇内中心点计算方法,并进一步改进了聚类初始簇中心的选取方案,形成新的文本聚类算法MCSKM++。通过实验验证,该算法在迭代次数减少、运行时间缩短的同时,聚类精度得到提高。 展开更多
关键词 文本聚类 K-MEANS算法 余弦相似度 余弦距离 初始点选取
下载PDF
基于余弦距离的智能拼图算法的应用研究
11
作者 吴娟 《信息与电脑》 2022年第2期56-58,73,共4页
由于智能拼图算法根据相邻块的相似度进行组装,如何计算拼图块之间的相似度度量至关重要。目前,大多数拼图算法侧重于单纯地计算碎片边缘相似性,对碎片内容相似度与边缘相似度结合的算法研究甚少。因此,本文提出一种计算两个拼图块之间... 由于智能拼图算法根据相邻块的相似度进行组装,如何计算拼图块之间的相似度度量至关重要。目前,大多数拼图算法侧重于单纯地计算碎片边缘相似性,对碎片内容相似度与边缘相似度结合的算法研究甚少。因此,本文提出一种计算两个拼图块之间的余弦距离的内容相似度评分的算法,研究内容相似度对智能拼图的重要性,并对部分网络图片以及笔者拍摄的图片进行实验。实验结果表明,本文算法具有更高的准确率。 展开更多
关键词 拼图 余弦距离 马氏梯度相似度度量 贪婪算法
下载PDF
融合交互性特征信息的余弦度量行人重识别
12
作者 郭业才 沈宇慧 《计算机工程与设计》 北大核心 2023年第11期3395-3401,共7页
针对行人重识别中难以表达特征间相关性信息,以及欧氏距离度量的损失函数忽略了特征向量角度影响的问题,提出一种融合交互性特征的余弦距离度量行人重识别网络。通过聚合分组注意力模块提取的特征,实现不同子特征跨通道的整合交互。训... 针对行人重识别中难以表达特征间相关性信息,以及欧氏距离度量的损失函数忽略了特征向量角度影响的问题,提出一种融合交互性特征的余弦距离度量行人重识别网络。通过聚合分组注意力模块提取的特征,实现不同子特征跨通道的整合交互。训练阶段采用余弦度量的三元组损失,结合特征空间的批量规一化操作,消除模长波动的影响,从角度维度判别行人差异。采用广义平均池化,保留更完整的特征信息。在Market-1501和DukeMTMC-reID两个数据集的实验结果表明,网络能有效提升行人重识别精度。 展开更多
关键词 机器视觉 行人重识别 注意力 度量学习 池化 余弦距离 损失函数
下载PDF
基于余弦角距离的主成分分析与核主成分分析 被引量:12
13
作者 殷俊 周静波 金忠 《计算机工程与应用》 CSCD 北大核心 2011年第3期9-12,共4页
PCA和KPCA都是基于欧氏距离提出的,这种距离对离群数据点比较敏感,而余弦角距离对离群数据更为鲁棒,在很多情况下具有更好的性能。充分利用余弦角距离的优势,提出两种新的特征抽取算法——基于余弦角距离的主成分分析(PCAC)和基于余弦... PCA和KPCA都是基于欧氏距离提出的,这种距离对离群数据点比较敏感,而余弦角距离对离群数据更为鲁棒,在很多情况下具有更好的性能。充分利用余弦角距离的优势,提出两种新的特征抽取算法——基于余弦角距离的主成分分析(PCAC)和基于余弦角距离的核主成分分析(KPCAC)。在YALE人脸数据库与PolyU掌纹数据库上的实验表明,PCAC比PCA取得了更好的效果,KPCAC也表现出了很好的性能。 展开更多
关键词 主成分分析 核主成分分析 欧氏距离 余弦距离
下载PDF
基于散布熵和余弦欧氏距离的滚动轴承性能退化评估方法 被引量:19
14
作者 杨潇谊 吴建德 马军 《电子测量与仪器学报》 CSCD 北大核心 2020年第7期15-24,共10页
针对传统特征指标评估轴承性能退化状态时可靠性、敏感性低的问题,提出一种基于散布熵和余弦欧氏距离的滚动轴承性能退化评估方法。首先,将待测滚动轴承振动信号分为健康数据和测试数据,分别对其进行集成经验模态分解(ensemble empirica... 针对传统特征指标评估轴承性能退化状态时可靠性、敏感性低的问题,提出一种基于散布熵和余弦欧氏距离的滚动轴承性能退化评估方法。首先,将待测滚动轴承振动信号分为健康数据和测试数据,分别对其进行集成经验模态分解(ensemble empirical mode decomposition, EEMD),得到若干本征模态分量(intrinsic mode function, IMF),计算各IMF分量与原信号的相关系数,并根据相关系数准则选择IMF分量重构信号;然后,计算重构信号的散布熵,通过结合欧氏距离和余弦距离得到健康数据和测试数据散布熵之间的余弦欧氏距离作为退化指标;最后,利用切比雪夫不等式计算余弦欧氏距离健康阈值,评估轴承性能退化状态。实验结果表明,利用散布熵之间的余弦欧氏距离可以有效、及时地判断轴承性能退化状态,并且与其他指标相比,其敏感性、鲁棒性更高,能够更好地刻画滚动轴承性能退化趋势,为滚动轴承性能退化评估提供新的解决方法。 展开更多
关键词 滚动轴承 性能退化评估 散布熵 余弦欧氏距离
下载PDF
基于共享近邻加权局部线性嵌入的轴承故障诊断
15
作者 刘庆强 孙艳茹 +1 位作者 刘远红 吴丽 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期85-91,118,共8页
针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on sha... 针对传统局部线性嵌入算法在挖掘局部流形结构时未充分考虑样本邻居分布信息,且在降维过程中默认样本具有相同的重要性导致提取鉴别特征不明显的问题,提出基于共享近邻的加权局部线性嵌入(weighted local linear embedding based on shared neighbors,SN-WLLE)算法,并用于滚动轴承故障诊断.该算法首先使用余弦距离划分样本邻域;其次计算样本邻域对相似度用以评估样本共享近邻信息,并结合样本的6种邻居分布修正局部结构挖掘,提高多共享近邻的k近邻重构准确性;接着从多流形的角度评估样本点与近邻点间的稀疏分布一致性,以获得样本的重要性指标,并在低维空间保持该信息,进而提取准确的鉴别特征;最后结合KNN分类器构建出完备的轴承故障诊断模型.采用凯斯西储大学轴承数据集和实验室测试平台轴承数据集,从可视化评估、定量聚类评估、故障识别精度评估及鲁棒性评估等方面进行分析.结果表明:SN-WLLE算法的F值保持在108以上水准,平均故障识别精度最低可达0.9734,不仅具有较好的类内紧致性与类间可分性,还对近邻参数k具有低敏感性. 展开更多
关键词 滚动轴承 特征提取 故障诊断 局部线性嵌入 余弦距离 共享近邻 稀疏分布
下载PDF
一种人脸表情分类的新方法——Manhattan距离 被引量:5
16
作者 李俊华 彭力 《计算机工程与应用》 CSCD 北大核心 2008年第2期74-75,79,共3页
提出了一种利用Manhattan距离进行人脸表情分类的新方法。Manhattan距离计算出具有不同模式的两个对象的距离更大。在实验中,比较了Manhattan距离、欧氏距离、余弦距离在人脸表情分类中的性能,得出Manhattan距离比另外两类距离有着更好... 提出了一种利用Manhattan距离进行人脸表情分类的新方法。Manhattan距离计算出具有不同模式的两个对象的距离更大。在实验中,比较了Manhattan距离、欧氏距离、余弦距离在人脸表情分类中的性能,得出Manhattan距离比另外两类距离有着更好的识别效果。 展开更多
关键词 Manhattan距离 人脸表情分类 欧氏距离 余弦距离
下载PDF
余弦度量的多流形最大间距鉴别保持嵌入 被引量:2
17
作者 林克正 王海燕 +1 位作者 林璇玑 李骜 《小型微型计算机系统》 CSCD 北大核心 2018年第4期836-841,共6页
针对LMMDE算法存在的缺陷,提出了余弦度量的多流形最大间距鉴别保持嵌入算法(Multi-manifold Maximal Margin Discriminant Preserving Embedding based on Cosine M easure,CM M M M DPE).该算法首先利用多流形思想将原始样本集中的每... 针对LMMDE算法存在的缺陷,提出了余弦度量的多流形最大间距鉴别保持嵌入算法(Multi-manifold Maximal Margin Discriminant Preserving Embedding based on Cosine M easure,CM M M M DPE).该算法首先利用多流形思想将原始样本集中的每个样本分成若干个局部小块样本,形成一个多流形的样本空间.在为流形内的每个局部小块样本确定类间邻域和类内邻域时,采用余弦距离代替欧式距离的度量方式.定义了加权的类间邻域散布矩阵和类内散布矩阵,来描述整个多流形空间中样本之间的相似度,通过相应的准则函数为每个样本流形找到最优投影矩阵,对每个样本流形降维到更低维流形空间中,最后通过计算测试样本流形与训练样本流形的距离来判定测试样本的类别归属.通过在多个人脸库上的实验,验证了本文方法的有效性. 展开更多
关键词 人脸识别 特征提取 余弦距离 多流形 局部最大间距嵌入
下载PDF
基于词覆盖率的语音数据集最小化方法
18
作者 朱治军 付磊 《软件导刊》 2024年第5期33-37,共5页
为解决高性能自动语音识别模型训练集采集成本高和训练成本高的问题,提出一种基于词覆盖率的语音训练集最小化方法,尽可能减少训练集所需的数据规模。该方法引入向量空间模型的概念,将所有语料文本映射到高维空间,通过计算向量之间的余... 为解决高性能自动语音识别模型训练集采集成本高和训练成本高的问题,提出一种基于词覆盖率的语音训练集最小化方法,尽可能减少训练集所需的数据规模。该方法引入向量空间模型的概念,将所有语料文本映射到高维空间,通过计算向量之间的余弦距离来筛选相似度最低的文本数据。然后,根据选择的文本数据收集音频,实现使用尽可能少的音频数据达到最佳的识别效果。最后,使用汉明重叠方式计算新增词汇量以评估贡献度,从而优化余弦距离的筛选方式。实验表明,所提方法相较于随机的语音训练集筛选方法,在节省21.31%训练数据量的情况下可达到相同词覆盖率,并且训练集的词覆盖率与训练集所得模型的推理性能存在极强的正相关性,证明了在保持推理性能接近的前提下,可有效节省语音训练集的采集和训练成本,进而促进自动语音识别技术的进一步发展。 展开更多
关键词 自动语音识别 向量空间模型 余弦距离 汉明重量 训练集最小化
下载PDF
基于余弦区分度的水体污染物分类方法
19
作者 李南忘 张维 +3 位作者 邵爽 程圭芳 何品刚 方禹之 《环境科学与技术》 CAS CSCD 北大核心 2016年第10期99-105,共7页
水体污染威胁着人类赖以生存的环境。污染物类型的快速分类识别能为水质预警及应急处理提供决策支持。通过测量水质参数:电导率(K)、温度(T)、酸碱度(pH)、氧化还原电位(ORP)、溶解氧(DO)和紫外吸光度(UV_(254)),以余弦距离比值定义的&q... 水体污染威胁着人类赖以生存的环境。污染物类型的快速分类识别能为水质预警及应急处理提供决策支持。通过测量水质参数:电导率(K)、温度(T)、酸碱度(pH)、氧化还原电位(ORP)、溶解氧(DO)和紫外吸光度(UV_(254)),以余弦距离比值定义的"区分度"作为相似性测度对3种类型的水体污染物进行分类。结果表明,采用区分度对污染物进行分类,正确率达95.9%,比采用余弦距离方法高近3%。该方法不仅增大了不同类别污染物之间的差异,而且具有耗时短、操作简便、准确率高等优点。 展开更多
关键词 水质参数 区分度 余弦距离 污染物分类
下载PDF
融合部分卷积和注意力机制对抗网络模型的地震数据重建
20
作者 冯永基 陈学华 《石油地球物理勘探》 EI CSCD 北大核心 2023年第1期21-30,共10页
以生成对抗网络(GAN)为代表的深度学习模型在地震数据重建中取得了较好效果,但普通GAN网络的重建结果常存在模糊、假频等缺点。主要原因是:普通卷积模型在对缺失较大的数据进行卷积时,其卷积结果主要受缺失区域的影响,而有效区域的影响... 以生成对抗网络(GAN)为代表的深度学习模型在地震数据重建中取得了较好效果,但普通GAN网络的重建结果常存在模糊、假频等缺点。主要原因是:普通卷积模型在对缺失较大的数据进行卷积时,其卷积结果主要受缺失区域的影响,而有效区域的影响较小;且普通卷积模型属于局部操作,卷积结果主要受卷积核内数据的影响,而相距较远的数据对其影响甚微。为此,文中提出了融合部分卷积和注意力模型的改进GAN网络。首先,在卷积过程中引入一个比例因子r实现部分卷积,从而强化有效区域对卷积结果的影响;然后,利用注意力机制选择余弦相似度高的有效(背景)数据,以突破卷积距离的限制,使更多背景数据参与缺失区域的重建。数据处理结果表明,所提方法显著改善了重建数据中的模糊、假频等现象。 展开更多
关键词 部分卷积 注意力机制 生成对抗网络 数据重建 余弦距离
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部