基于余切相似度和BP神经网络的相似度快速计算被引量：6

A Fast Similarity Calculation Method Based on Cotangent Similarity and BP Neural Network

下载PDF

导出

摘要相似性度量在大数据相关应用中具有重要的意义,然而传统余弦相似度遍历计算方法的准确性和时效性较差,具有较大局限性,无法为海量高维数据的质量评估提供有效依据。针对上述问题,利用余切三角函数和数据维度差值构造2种余切相似度公式,提高相似度计算的准确性;借助后向传播(BP)神经网络建立一个能够逼近数据集相似度映射关系的网络模型,降低相似度计算的时间复杂度。实验表明,改进的相似度快速计算方法具有良好的准确性和时效性,而且应用在大规模数据集时的性能提升更显著。 Similarity measurement is of great significance in big data related applications.However,the traditional cosine similarity traversal calculation method has a poor accuracy and timeliness,which cannot provide an effective basis for the quality assessment of massive highdimensional data.To improve the accuracy of similarity calculation,two types of cotangent similarity formulas with cotangent trigonometric function and data dimensional differences was constructed.Besides,a backpropagation(BP)neural network model approximating the similarity mapping relationship of datasets was established to reduce the time complexity.The experimental results demonstrate that the improved fast similarity calculation method has a good accuracy and timeliness.Moreover,it has a more significant performance improvement when applied to large-scale datasets.

作者乔非关柳恩王巧玲 QIAO Fei;GUAN Liuen;WANGE Qiaoling(College of Electronics and Information Engineering,Tongji University,Shanghai 201804,China)

机构地区同济大学电子与信息工程学院

出处《同济大学学报（自然科学版）》 EI CAS CSCD 北大核心 2021年第1期153-162,共10页 Journal of Tongji University:Natural Science

基金国家自然科学基金(71690230/71690234,61973237,61873191)。

关键词相似度计算神经网络大数据分析数据质量评估 similarity calculation neural network big data analysis data quality assessment

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1宋晓宁,徐勇.稀疏相似性度量的模糊鉴别分析方法[J].模式识别与人工智能,2014,27(3):199-205. 被引量：2
2蒋欣,王开军,陈黎飞.基于改进余弦相似度的粒子滤波故障预报[J].计算机系统应用,2015,24(1):98-103. 被引量：6

二级参考文献37

1莫以为,萧德云.进化粒子滤波算法及其应用[J].控制理论与应用,2005,22(2):269-272. 被引量：41
2胡士强,敬忠良.粒子滤波算法综述[J].控制与决策,2005,20(4):361-365. 被引量：293
3Yan S C, Xu O, Zhang BY, et al. Graph Embedding and Extensions: A General Framework for Dimensionality Reduction. IEEE Trans on Pattern Analysis and Machine Intelligence, 2007 , 29 ( 1 ) : 40-51.
4Yang J, Yang J Y. Why Can LOA Be Performed in PCA Transformed Space? Pattern Recognition, 2003, 36(2) : 563-566.
5Song X N, Yang J Y, Wu X J, et al. An Optimal Symmetrical Null Space Criterion of Fisher Discriminant for Feature Extraction and Recognition. Soft Computing, 2011, 15 (2) : 281-293.
6Xu Y, Zhang 0, Iin Z, et al. A Fast Kernel-Based Nonlinear Discriminant Analysis for Multi-class Problems. Pattern Recognition. 2006, 39( 6) : 1026-1033.
7Xu Y, Zhang 0, Yang J, et al. A Two-Phase Test Sample Sparse Representation Method for Use with Face Recognition. IEEE Trans on Circuits and Systems for Video Technology, 2011, 21 (9) : 1255-1262.
8Xu Y, Zhong A, Yang J, et al. LPP Solution Schemes for Use with Face Recognition. Pattern Recognition, 2010, 43 ( 12): 4165- 4176.
9an Z Z, Yong Xu, Zhang D. Local Linear Discriminant Analysis Framework Using Sample Neighbors. IEEE Trans on Neural Networks, 2011,22(7): 1119-1132.
10Xu Y, Zhang 0, Yang J Y. A Feature Extraction Method for Use with Bimodal Biometrics. Pattern Recognition, 2010, 43 (3 ) : 1106-1115.

共引文献6

1林品乐,王开军.基于模糊隶属度的粒子滤波故障预测[J].计算机系统应用,2016,25(6):119-124. 被引量：1
2林品乐,王开军.基于模糊贴近度的粒子滤波故障预测[J].计算机系统应用,2017,26(2):134-138.
3汪军,朱建军,刘小弟.兼顾形状-距离的正态云模型综合相似度测算[J].系统工程理论与实践,2017,37(3):742-751. 被引量：30
4王开军,林品乐.基于直觉模糊集的灰色模型故障预测[J].计算机系统应用,2017,26(4):29-34. 被引量：3
5夏修臣,王秀英.基于余弦相似度的改进C4.5决策树算法[J].计算机工程与设计,2018,39(1):120-125. 被引量：16
6胡成,王泽松.基于余弦相似度的音乐影响力研究[J].信息与电脑,2021,33(6):57-60. 被引量：1

同被引文献36

1闫召洪,仇小杰,黄金泉,鲁峰.航空发动机推力衰退缓解的神经网络控制[J].航空动力学报,2020,35(4):844-854. 被引量：9
2吴行健.非线性系统神经网络控制的现状与展望[J].临沂师范学院学报,2005,27(6):94-98. 被引量：2
3杨丽娟,李国勇.基于神经网络的发动机空燃比自校正控制系统[J].太原理工大学学报,2010,41(6):709-712. 被引量：1
4侯晓秋,陈志学.一类非线性随机系统的自适应预测控制[J].电气传动自动化,2012,34(1):14-18. 被引量：7
5焦在强.大规模风电接入的继电保护问题综述[J].电网技术,2012,36(7):195-201. 被引量：128
6黄涛,陆于平,凌启程,王业.撬棒电路对风电场侧联络线距离保护的影响及对策[J].电力系统自动化,2013,37(17):30-36. 被引量：36
7刘仕兵,武磊,朱雪龙.基于NARMA-L2模型的弓网系统振动主动控制[J].计算机测量与控制,2015,23(3):818-820. 被引量：4
8赵栎,张维存,楚天广.确定性多变量自校正控制的稳定性、收敛性和鲁棒性[J].工程科学学报,2019,41(9):1215-1221. 被引量：4
9刘素梅,毕天姝,王晓阳,杨国生,薛安成,杨奇逊.具有不对称故障穿越能力逆变型新能源电源故障电流特性[J].电力系统自动化,2016,40(3):66-73. 被引量：40
10段建东,崔帅帅,刘吴骥,孙磊,谭王景.基于电流频率差的有源配电网线路保护[J].中国电机工程学报,2016,36(11):2927-2934. 被引量：16

引证文献6

1侯小秋,李丽华.NARMA-L2模型的改进及其神经网络自校正控制器[J].黑龙江科技大学学报,2021,31(6):782-787. 被引量：5
2侯小秋,李丽华.实用随机NARMAX模型的无模型自校正控制器[J].中央民族大学学报（自然科学版）,2022,31(2):41-46. 被引量：2
3侯小秋.神经网络辨识的无模型自适应自校正控制器[J].陕西理工大学学报（自然科学版）,2022,38(3):9-14. 被引量：2
4王泽彭,刘素梅,张道农.基于余切相似度的风电场送出线路保护新原理[J].可再生能源,2023,41(7):925-933. 被引量：2
5刘奕,何成艳,刘陵轶,邹福,欧进永,杨洪.基于词库过滤与分布式词向量的安全生产风险问题智能匹配算法分析研究[J].科技创新与生产力,2023,44(6):1-3.
6侯小秋,李丽华.实用NARMAX-L2模型的神经网络自校正控制器[J].黄河科技学院学报,2023,25(8):74-78.

二级引证文献7

1侯小秋.改进NARMA-L2模型的无模型自校正控制器[J].黄河科技学院学报,2022,24(5):1-7. 被引量：1
2侯小秋,李丽华.实用NARMAX-L2模型的神经网络自校正控制器[J].黄河科技学院学报,2023,25(8):74-78.
3侯小秋,李丽华.实用随机多变量NARMAX模型的无模型自校正控制器[J].陕西理工大学学报（自然科学版）,2023,39(5):8-13.
4何帅,王景,邰晨凡,张泽银,丁岩.VT用流敏电阻型一次限流消谐器的研究及应用[J].自动化技术与应用,2024,43(2):153-155.
5侯小秋.对称NARMA-U模型及其神经网络自校正控制器[J].中央民族大学学报（自然科学版）,2024,33(1):54-60.
6王丹枫,刘素梅,郑燃,李伟,于子轩.新能源场站高比例接入下主流类型工频量距离保护比对[J].可再生能源,2024,42(5):655-663. 被引量：1
7侯小秋.多变量系统神经网络辨识的无模型自校正控制器研究[J].黄河科技学院学报,2024,26(5):1-5.

1刘辉,徐树兴,丁猛.医用电子加速器X射线剂量示值的线性检测数据的回归分析推理及快速计算方法[J].计量与测试技术,2021,48(1):6-7.
2岳超,王峰,袁堃,陈碧莲,刘柱,陈万勤.快速计算食用盐中氯化钠结果方法的建立[J].中国调味品,2021,46(2):116-117. 被引量：1
3宋定宇.基于三维动态激光成像技术的在线学习模型研究[J].激光杂志,2021,42(1):175-178.
4王小鹏,王庆圣,焦建军,梁金诚.快速自适应非局部空间加权与隶属度连接的模糊C-均值噪声图像分割算法[J].电子与信息学报,2021,43(1):171-178. 被引量：12

同济大学学报（自然科学版）

2021年第1期

浏览历史

内容加载中请稍等...

基于余切相似度和BP神经网络的相似度快速计算被引量：6

参考文献2

二级参考文献37

共引文献6

同被引文献36

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于余切相似度和BP神经网络的相似度快速计算 被引量：6

参考文献2

二级参考文献37

共引文献6

同被引文献36

引证文献6

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于余切相似度和BP神经网络的相似度快速计算被引量：6