期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
Face Recognition Based on Support Vector Machine and Nearest Neighbor Classifier 被引量:8
1
作者 Zhang Yankun & Liu Chongqing Institute of Image Processing and Pattern Recognition, Shanghai Jiao long University, Shanghai 200030 P.R.China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2003年第3期73-76,共4页
Support vector machine (SVM), as a novel approach in pattern recognition, has demonstrated a success in face detection and face recognition. In this paper, a face recognition approach based on the SVM classifier with ... Support vector machine (SVM), as a novel approach in pattern recognition, has demonstrated a success in face detection and face recognition. In this paper, a face recognition approach based on the SVM classifier with the nearest neighbor classifier (NNC) is proposed. The principal component analysis (PCA) is used to reduce the dimension and extract features. Then one-against-all stratedy is used to train the SVM classifiers. At the testing stage, we propose an al- 展开更多
关键词 Face recognition support vector machine nearest neighbor classifier Principal component analysis.
下载PDF
Support Vector Machine-Based Fault Diagnosis of Power Transformer Using k Nearest-Neighbor Imputed DGA Dataset 被引量:4
2
作者 Zahriah Binti Sahri Rubiyah Binti Yusof 《Journal of Computer and Communications》 2014年第9期22-31,共10页
Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting inc... Missing values are prevalent in real-world datasets and they may reduce predictive performance of a learning algorithm. Dissolved Gas Analysis (DGA), one of the most deployable methods for detecting and predicting incipient faults in power transformers is one of the casualties. Thus, this paper proposes filling-in the missing values found in a DGA dataset using the k-nearest neighbor imputation method with two different distance metrics: Euclidean and Cityblock. Thereafter, using these imputed datasets as inputs, this study applies Support Vector Machine (SVM) to built models which are used to classify transformer faults. Experimental results are provided to show the effectiveness of the proposed approach. 展开更多
关键词 MISSING VALUES Dissolved Gas Analysis support vector machine k-nearest neighborS
下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:2
3
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification Algorithms NON-PARAMETRIC K-nearest-neighbor Neural Networks Random Forest support vector machines
下载PDF
Improved scheme to accelerate support vector regression 被引量:1
4
作者 Zhao Yongping Sun Jianguo 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2009年第5期1086-1090,共5页
The computational cost of support vector regression in the training phase is O (N^3), which is very expensive for a large scale problem. In addition, the solution of support vector regression is of parsimoniousness,... The computational cost of support vector regression in the training phase is O (N^3), which is very expensive for a large scale problem. In addition, the solution of support vector regression is of parsimoniousness, which has relation to a part of the whole training data set. Hence, it is reasonable to reduce the training data set. Aiming at the scheme based on k-nearest neighbors to reduce the training data set with the computational complexity O (kMN^2), an improved scheme is proposed to accelerate the reducing phase, which cuts down the computational complexity from O (kMN^2) to O (MN^2). Finally, experimental results on benchmark data sets validate the effectiveness of the improved scheme. 展开更多
关键词 support vector regression parsimoniousness k-nearest neighbors computational complexity.
下载PDF
Machine Learning and Artificial Neural Network for Predicting Heart Failure Risk
5
作者 Polin Rahman Ahmed Rifat +3 位作者 MD.IftehadAmjad Chy Mohammad Monirujjaman Khan Mehedi Masud Sultan Aljahdali 《Computer Systems Science & Engineering》 SCIE EI 2023年第1期757-775,共19页
Heart failure is now widely spread throughout the world.Heart disease affects approximately 48%of the population.It is too expensive and also difficult to cure the disease.This research paper represents machine learni... Heart failure is now widely spread throughout the world.Heart disease affects approximately 48%of the population.It is too expensive and also difficult to cure the disease.This research paper represents machine learning models to predict heart failure.The fundamental concept is to compare the correctness of various Machine Learning(ML)algorithms and boost algorithms to improve models’accuracy for prediction.Some supervised algorithms like K-Nearest Neighbor(KNN),Support Vector Machine(SVM),Decision Trees(DT),Random Forest(RF),Logistic Regression(LR)are considered to achieve the best results.Some boosting algorithms like Extreme Gradient Boosting(XGBoost)and Cat-Boost are also used to improve the prediction using Artificial Neural Networks(ANN).This research also focuses on data visualization to identify patterns,trends,and outliers in a massive data set.Python and Scikit-learns are used for ML.Tensor Flow and Keras,along with Python,are used for ANN model train-ing.The DT and RF algorithms achieved the highest accuracy of 95%among the classifiers.Meanwhile,KNN obtained a second height accuracy of 93.33%.XGBoost had a gratified accuracy of 91.67%,SVM,CATBoost,and ANN had an accuracy of 90%,and LR had 88.33%accuracy. 展开更多
关键词 Heart failure prediction data visualization machine learning k-nearest neighbors support vector machine decision tree random forest logistic regression xgboost and catboost artificial neural network
下载PDF
基于沙地猫群优化–最小二乘支持向量机的动态NOx排放预测 被引量:4
6
作者 金秀章 史德金 乔鹏 《中国电机工程学报》 EI CSCD 北大核心 2024年第1期182-190,I0015,共10页
针对火电机组频繁调峰导致机组燃烧状态不稳,进而导致锅炉出口NOx浓度波动范围大的问题,提出一种基于沙地猫群优化(sand cat sarm optimization,SCSO)的最小二乘支持向量机(leastsquaressupportvectormachine,LSSVM) NOx动态预测模型。... 针对火电机组频繁调峰导致机组燃烧状态不稳,进而导致锅炉出口NOx浓度波动范围大的问题,提出一种基于沙地猫群优化(sand cat sarm optimization,SCSO)的最小二乘支持向量机(leastsquaressupportvectormachine,LSSVM) NOx动态预测模型。首先利用k近邻互信息计算时间延迟的同时筛选辅助变量。然后,基于SCSO算法进行输入变量阶次的选择。使用包含辅助变量时间延迟和阶次的信息作为模型的输入,SCSO算法优化最小二乘支持向量机参数,建立动态NOx排放最小二乘支持向量机预测模型(SCSO-LSSVM动态软测量模型)。最后将模型与未加入迟延的LSSVM模型,加入迟延的LSSVM模型和粒子群优化算法(particle swarm optimization,PSO)优化最小二乘支持向量机参数的动态软测量模型进行对比验证。结果表明,相较于其他模型,该文建立SCSO-LSSVM动态软测量模型均方根误差、平均绝对误差、平均绝对误差最小,预测精度最高,而且在NOx浓度剧烈波动时也能够较好地预测NOx浓度,具有很好的动态特性。 展开更多
关键词 NOx浓度 k近邻互信息 沙地猫群优化算法 最小二乘支持向量机 软测量模型
下载PDF
基于AVMD和排列熵的t分布邻域嵌入流形HHO-SVM模拟电路故障诊断方法
7
作者 陈晓梅 王行健 +1 位作者 蔡烨 周博 《电子测量与仪器学报》 CSCD 北大核心 2024年第6期233-240,共8页
随着信息大数据时代的到来,对于电子系统的依赖程度越来越高,因此模拟电路的故障诊断的准确度要求与日俱增。而模拟电路故障诊断困难,是电子系统诊断维修的瓶颈。本文提出基于自适应变分模态分解(AVMD)和排列熵(PE)的t分布邻域嵌入流形... 随着信息大数据时代的到来,对于电子系统的依赖程度越来越高,因此模拟电路的故障诊断的准确度要求与日俱增。而模拟电路故障诊断困难,是电子系统诊断维修的瓶颈。本文提出基于自适应变分模态分解(AVMD)和排列熵(PE)的t分布邻域嵌入流形哈里斯鹰优化支持向量机(HHO-SVM)模拟电路故障诊断方法。首先,利用AVMD对待测电路的观测信号进行自适应变分模态分解,得到多组IMF信号,不仅可以克服噪声干扰,而且可以来自适应地确定分解模式的数量,进一步提升分解精度;再对IMF计算排列熵,以充分体现IMF不同时段局部特征,二者相结合构建故障特征向量。并在此基础上,采用t分布式随机邻域嵌入(t-SNE)实现特征空间的流形学习和降维,构建具有良好区分度且保留原来的局部结构特征的故障特征向量;最后依靠哈里斯鹰优化支持向量机(HHO-SVM),使其具有良好的分类准确度,从而最终完成电路故障诊断。通过仿真验证,结果显示,本文方法故障诊断正确率可达100%,效果良好。 展开更多
关键词 自适应变分模态分解AVMD t分布邻域嵌入 故障诊断 哈里斯鹰优化支持向量机
下载PDF
机器学习和深度学习在遥感影像分类中的对比研究
8
作者 陈香 《测绘与空间地理信息》 2024年第7期72-75,共4页
遥感影像分类是遥感技术应用的一个重要环节;机器学习和深度学习能够实现精确、自动化、迅速、可定义和规模化的遥感影像分类。本文选取机器学习算法支持向量机和深度学习算法卷积神经网络、深度置信网络、栈式自编码网络共计4种分类算... 遥感影像分类是遥感技术应用的一个重要环节;机器学习和深度学习能够实现精确、自动化、迅速、可定义和规模化的遥感影像分类。本文选取机器学习算法支持向量机和深度学习算法卷积神经网络、深度置信网络、栈式自编码网络共计4种分类算法进行对比研究,并对支持向量机核函数的参数以及深度学习算法的神经元数量开展寻优以到达最高分类精度。实验结果表明,深度学习算法栈式自编码网络的总体分类精度最高,分类效果最好,在地物复杂多样地区开展遥感地物分类时具有较好的适用性和推广价值。 展开更多
关键词 遥感影像分类 支持向量机 卷积神经网络 深度置信网络 栈式自编码网络
下载PDF
煤矿井下钻进速度影响因素及其智能预测方法研究
9
作者 戴剑博 王忠宾 +6 位作者 张琰 司垒 魏东 周文博 顾进恒 邹筱瑜 宋雨雨 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第7期209-221,共13页
在煤矿井下钻探领域,钻进速度(DR)是评估钻探作业最有效的指标之一,钻速预测是实现煤矿钻进智能化的前提条件,对于优化钻机钻进参数、降低作业成本、实现安全高效钻探具有重要意义。为此,提出煤矿井下钻进速度影响因素及其智能预测方法... 在煤矿井下钻探领域,钻进速度(DR)是评估钻探作业最有效的指标之一,钻速预测是实现煤矿钻进智能化的前提条件,对于优化钻机钻进参数、降低作业成本、实现安全高效钻探具有重要意义。为此,提出煤矿井下钻进速度影响因素及其智能预测方法研究,探索基于钻压、转速、扭矩以及钻进深度等少量钻机参数采用机器学习算法实现钻进速度精准预测。首先通过实验室微钻试验,深入分析煤岩力学性能、钻压、转速和钻进深度对扭矩、钻进速度影响规律。研究结果显示,在煤矿井下钻进过程中,随着钻进压力增大,钻进速度呈逐渐升高趋势,在较高的转速条件下钻进压力对钻进速度影响更加明显,转速增加有利于提高钻进速度,但转速对硬度较低的煤层钻进速度影响更为显著;然后,根据煤矿井下防冲钻孔现场数据,采用K–近邻(KNN)、支持向量回归(SVR)和随机森林回归(RFR)3种不同的机器学习算法建立钻进速度预测模型,并结合粒子群算法(PSO)对3种模型超参数进行优化,最后对比分析PSO–KNN,PSO–SVR和PSO–RFR三种钻进速度预测模型预测结果。研究结果表明,PSO–RFR模型准确性最好,决定系数R2高达0.963,均方误差MSE仅有29.742,而PSO–SVR模型鲁棒性最好,在对抗攻击后评价指标变化率最小。本文研究有助于实现煤矿井下钻进速度的精准预测,为煤矿井下智能钻进参数优化提供理论支撑。 展开更多
关键词 钻机参数 K–近邻 随机森林回归 支持向量回归 粒子群算法 钻进速度预测
下载PDF
Enhancing Cancer Classification through a Hybrid Bio-Inspired Evolutionary Algorithm for Biomarker Gene Selection 被引量:1
10
作者 Hala AlShamlan Halah AlMazrua 《Computers, Materials & Continua》 SCIE EI 2024年第4期675-694,共20页
In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selec... In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selection.Themotivation for utilizingGWOandHHOstems fromtheir bio-inspired nature and their demonstrated success in optimization problems.We aimto leverage the strengths of these algorithms to enhance the effectiveness of feature selection in microarray-based cancer classification.We selected leave-one-out cross-validation(LOOCV)to evaluate the performance of both two widely used classifiers,k-nearest neighbors(KNN)and support vector machine(SVM),on high-dimensional cancer microarray data.The proposed method is extensively tested on six publicly available cancer microarray datasets,and a comprehensive comparison with recently published methods is conducted.Our hybrid algorithm demonstrates its effectiveness in improving classification performance,Surpassing alternative approaches in terms of precision.The outcomes confirm the capability of our method to substantially improve both the precision and efficiency of cancer classification,thereby advancing the development ofmore efficient treatment strategies.The proposed hybridmethod offers a promising solution to the gene selection problem in microarray-based cancer classification.It improves the accuracy and efficiency of cancer diagnosis and treatment,and its superior performance compared to other methods highlights its potential applicability in realworld cancer classification tasks.By harnessing the complementary search mechanisms of GWO and HHO,we leverage their bio-inspired behavior to identify informative genes relevant to cancer diagnosis and treatment. 展开更多
关键词 Bio-inspired algorithms BIOINFORMATICS cancer classification evolutionary algorithm feature selection gene expression grey wolf optimizer harris hawks optimization k-nearest neighbor support vector machine
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
11
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
基于原型优化方法的分类器设计
12
作者 柳新强 徐欢 王栋 《微型电脑应用》 2024年第8期1-3,共3页
常规分类器如k近邻、支持向量机等已经被广泛使用,但在大数据时代背景下,较多的训练量会大幅度降低分类器的训练效率和准确率。为了解决该问题,利用原型优化方法对已有训练数据进行筛选压缩,滤除大量冗余数据,将压缩后的数据集作为原型... 常规分类器如k近邻、支持向量机等已经被广泛使用,但在大数据时代背景下,较多的训练量会大幅度降低分类器的训练效率和准确率。为了解决该问题,利用原型优化方法对已有训练数据进行筛选压缩,滤除大量冗余数据,将压缩后的数据集作为原型来训练分类器,提高训练效率和分类准确率。在已有方法基础上做出改进,设计新的基于原型优化方法的分类器,可以大幅度减小训练量,并保证分类准确率,测试结果验证了所提方法的有效性。 展开更多
关键词 原型优化 分类器 K近邻 支持向量机
下载PDF
基于机器学习的DNA序列分类研究
13
作者 保志康 陈继璇 +4 位作者 刘印晓 张茂源 章洪博 刘振安 魏晓娟 《生物化工》 CAS 2024年第3期20-27,共8页
DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准... DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准确反映物种特性成为生物信息学中的一个重要问题。本研究从NCBI网站上下载序列登录号为CP021707和CP085300的两类DNA序列文件,基于碱基频率和数量特征提取方法进行单碱基、双碱基和三碱基的特征提取,构建出84维、168维和35维特征向量,分别基于K近邻(K-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)以及K近邻和支持向量机融合(KNN-SVM)算法模型进行分类预测。实验结果表明,在168维特征向量下,基于KNN-SVM算法模型的分类准确率比基于KNN或SVM算法模型的分类准确率高,对判断一个未知类的相关特性具有积极意义。 展开更多
关键词 支持向量机 DNA序列 特征提取 K近邻 分类准确率
下载PDF
近邻密度辅助模糊优化孪生支持向量机的钢板表面缺陷分类
14
作者 侯政通 胡鹰 +1 位作者 乔磊明 邓志飞 《计算机集成制造系统》 EI CSCD 北大核心 2024年第3期1115-1126,共12页
为提升钢板表面缺陷分类精度,提出一种选择性弱化样本的分类模型。首先,在图像预处理阶段引入显著性检测算法来减少二值化后图像出现失真的影响;其次,为了降低不利的边缘样本点对模型的影响,同时又能提高有利的边缘样本点对模型的贡献,... 为提升钢板表面缺陷分类精度,提出一种选择性弱化样本的分类模型。首先,在图像预处理阶段引入显著性检测算法来减少二值化后图像出现失真的影响;其次,为了降低不利的边缘样本点对模型的影响,同时又能提高有利的边缘样本点对模型的贡献,构造了一种新的密度模糊隶属度函数对样本进行权重赋值;最后,在孪生支持向量机(TWSVM)的基础上,将构造的密度模糊隶属度函数作为优化条件嵌入模型内,提出了近邻密度辅助模糊优化的TWSVM算法,以提高分类效果。在数据集NEU上的实验结果表明,引入显著性检测算法后,重新设计的特征在整体准确率上提高了1.66%,同时采用优化后的算法进行缺陷分类,准确率达到98.33%,进一步提高了分类性能。 展开更多
关键词 图像处理 显著性检测 缺陷分类 孪生支持向量机 密度函数 K近邻
下载PDF
基于机器学习的冠心病风险预测模型构建与比较
15
作者 岳海涛 何婵婵 +3 位作者 成羽攸 张森诚 吴悠 马晶 《中国全科医学》 CAS 北大核心 2025年第4期499-509,共11页
背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目... 背景冠状动脉粥样硬化性心脏病(以下简称冠心病)是全球重要的死亡原因之一。目前关于冠心病风险评估的研究在逐年增长。然而,在这些研究中常忽略了数据不平衡的问题,而解决该问题对于提高分类算法中识别冠心病风险的准确性至关重要。目的探索冠心病的影响因素,通过使用2种平衡数据的方法,基于5种算法建立冠心病风险相关的预测模型,比较这5种模型对冠心病风险的预测价值。方法基于2021年美国国家行为风险因素监测系统(BRFSS)横断面调查数据筛选出112606名研究对象的健康相关风险行为、慢性健康状况等24个变量信息,结局指标为自我报告是否患有冠心病并据此分为冠心病组和非冠心病组。通过进行单因素分析和逐步Logistic回归分析探索冠心病发生的影响因素并筛选出纳入预测模型的变量。随机抽取112606名受访者的10%(共计11261名),以8∶2的比例随机划分为训练与测试的数据集,采用随机过采样和合成少数过采样技术(SMOTE)两种过采样的方法处理不平衡数据,基于k最邻近算法(KNN)、Logistic回归、支持向量机(SVM)、决策树和XGBoost算法分别建立冠心病预测模型。结果两组年龄、性别、BMI、种族、婚姻状态、教育水平、收入水平、家里有几个孩子、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者、过去30 d内是否有体育锻炼、心理健康状况以及自我健康评价比较,差异有统计学意义(P<0.05)。逐步Logistic回归分析结果显示:年龄、性别、BMI、种族、教育水平、收入水平、是否被告知患高血压、是否被告知处于高血压前期、是否被告知患妊娠高血压、现在是否在服用高血压药物、是否被告知患有高脂血症、是否被告知患有糖尿病、吸烟情况、过去30 d内是否至少喝过1次酒、是否为重度饮酒者、是否为酗酒者以及自我健康评价为冠心病的影响因素(P<0.05)。风险模型构建的分析结果显示:k最邻近算法、Logistic回归、支持向量机、决策树和XGBoost采用SMOTE处理不平衡数据的总体分类精度分别为59.2%、67.4%、66.2%、69.2%和85.9%,召回率分别为75.2%、71.4%、70.5%、62.9%和34.8%,精确度分别为15.4%、18.2%、17.5%、17.6%和28.7%,F值分别为0.256、0.290、0.280、0.275和0.315,受试者工作特征曲线下面积分别为0.80、0.78、0.72、0.72和0.82;采用随机过采样处理不平衡数据的总体分类精度分别为62.5%、68.5%、69.0%、60.2%和70.1%,召回率分别为70.0%、69.5%、71.9%、69.0%和67.6%;精确度分别为15.8%、18.4%、19.1%、14.8%和19.0%,F值分别为0.258、0.291、0.302、0.244和0.297,受试者工作特征曲线下面积分别为0.80、0.77、0.72、0.72和0.83。结论本研究不仅确认了已知冠心病的影响因素,还发现了自我健康评价水平、收入水平和教育水平对冠心病具有潜在影响。在使用2种数据平衡方法后,5种算法的性能显著提高。其中XGBoost模型表现最佳,可作为未来优化冠心病预测模型的参考。此外,鉴于XGBoost模型的优异性能以及逐步Logistic回归的操作便捷和可解释性,推荐在冠心病风险预测模型中结合使用数据平衡后的XGBoost和逐步Logistic回归分析。 展开更多
关键词 冠心病 机器学习 风险预测模型 LOGISTIC回归 k最邻近算法 支持向量机 决策树 XGBoost
下载PDF
鲁棒的模糊最小二乘双参数间隔支持向量机算法
16
作者 杨贵燕 黄成泉 +3 位作者 罗森艳 蔡江海 王顺霞 周丽华 《河北大学学报(自然科学版)》 CAS 北大核心 2024年第6期653-665,共13页
针对最小二乘双参数间隔支持向量机(LSTPMSVM)对噪声敏感且在分类过程中易受异常值影响的问题,提出了一种鲁棒的模糊最小二乘双参数间隔支持向量机算法(RFLSTPMSVM).该算法利用松弛变量的2范数使得优化问题具有强凸性,再根据隶属度为每... 针对最小二乘双参数间隔支持向量机(LSTPMSVM)对噪声敏感且在分类过程中易受异常值影响的问题,提出了一种鲁棒的模糊最小二乘双参数间隔支持向量机算法(RFLSTPMSVM).该算法利用松弛变量的2范数使得优化问题具有强凸性,再根据隶属度为每个样本分配相应的权重,有效降低异常值带来的影响.同时,在目标函数中引入K-近邻加权,考虑样本之间的局部信息,提高模型的分类准确率.此外,通过求解简单的线性方程组来优化该算法,而不是求解二次规划问题,使模型具有较快的计算速度.在UCI(university of California irvine)数据集上对该算法进行性能评估,并与TWSVM、LSTSVM、LSTPMSVM和ULSTPMSVM 4种算法进行比较.数值实验结果表明,该算法具有更好的泛化性能. 展开更多
关键词 双参数间隔支持向量机 孪生支持向量机 模糊隶属度 K-近邻
下载PDF
基于机器学习算法的服装直播销量预测模型
17
作者 韩铂 李沛 《丝绸》 CAS CSCD 北大核心 2024年第7期109-117,共9页
为了完善直播销量预测的指标体系,提高直播销量预测的准确率,本文对比多种机器学习算法,分析服装直播销量的影响因素并预测服装直播销量。首先,通过文献分析选取直播销量的影响因素,并使用Spearman相关系数结合显著性进行筛选。其次,通... 为了完善直播销量预测的指标体系,提高直播销量预测的准确率,本文对比多种机器学习算法,分析服装直播销量的影响因素并预测服装直播销量。首先,通过文献分析选取直播销量的影响因素,并使用Spearman相关系数结合显著性进行筛选。其次,通过不同机器学习算法建立服装销量预测模型。选用R 2、MAE、RMSE及MAPE为评价指标,采用5折交叉验证的方法,测试各模型性能。研究结果表明:主播粉丝数、主播近30天场均观看人次、主播近30天场均坑产、产品价格、产品讲解时长、产品近30天历史销量、品牌粉丝数、品牌近30天历史销量、折扣这9个因素之间共线性较弱且与直播销量之间的相关性显著,可作为预测模型中的影响因素;预测算法中K近邻算法和随机森林算法的表现较好,R 2均大于0.98,MAPE均在30.5%以内。预测结果可帮助零售商规划库存,调整生产计划,为产品采购、定价、推广提供数据支持。 展开更多
关键词 直播销量预测 机器学习 随机森林 K近邻 SVM支持向量机 五折交叉验证
下载PDF
面向城市轨道交通智能运维的数据耦合性与独立一致性研究
18
作者 倪弘韬 胡佳乔 +2 位作者 吴强 李楠 陈君林 《城市轨道交通研究》 北大核心 2024年第5期6-10,共5页
[目的]智能运维背景下,现有算法准确度低,导致虚警率高,因此有必要开展列车运营数据的耦合性分析与独立一致性研究。[方法]从统计和数据驱动的角度对耦合性与独立一致性进行定义;根据加速度绝对值变化率将列车运行状态分为4个阶段:静止... [目的]智能运维背景下,现有算法准确度低,导致虚警率高,因此有必要开展列车运营数据的耦合性分析与独立一致性研究。[方法]从统计和数据驱动的角度对耦合性与独立一致性进行定义;根据加速度绝对值变化率将列车运行状态分为4个阶段:静止、平稳运行、起动加速及制动减速,并分别生成对应数据切片综合分位图、相关系数等方法;对牵引系统、制动系统累计正线运营数据进行分析,量化系统间的耦合关系;通过构建线性回归模型、支持向量机模型、LightGBM模型和K-近邻模型对于数据进行解耦处理,使牵引制动系统数据呈现正态性,相关变量服从独立性与一致性,以满足联合条件概率分布的前置条件。[结果及结论]数据解耦操作能够提升系统间原始数据的独立一致性;从工程实用角度出发,LightGBM模型在实时与离线状态下表现出最优的性能,在所有量化分析中均取得了50%及以上的优化率;采用解耦后的数据,能够在故障样本较少或者缺失的情况下,实现对潜在故障的预警功能,能有效降低智能运维的虚警率,同时提升故障预测的准确性。 展开更多
关键词 轨道交通 智能运维 故障预警 支持向量机 LightGBM模型 K-近邻模型
下载PDF
基于最大间隔和流形假设的半监督学习算法
19
作者 戴伟 柴晶 刘雅娇 《计算机科学》 CSCD 北大核心 2024年第2期259-267,共9页
半监督学习是一种介于监督学习和无监督学习之间的弱监督学习模式,其在学习过程中将少量标记示例和大量未标记示例结合起来构建模型,以期取得比监督学习仅使用标记示例更高的学习精度。在该学习模式下,文中提出了一种将最大间隔准则和... 半监督学习是一种介于监督学习和无监督学习之间的弱监督学习模式,其在学习过程中将少量标记示例和大量未标记示例结合起来构建模型,以期取得比监督学习仅使用标记示例更高的学习精度。在该学习模式下,文中提出了一种将最大间隔准则和示例空间的流形假设思想相结合的半监督学习算法。该算法在利用示例流形结构估计未标记示例标记置信度的同时利用最大间隔准则构建分类模型,并采用交叉优化方法以迭代的方式交替地求解分类模型参数和标记置信度。在12个UCI数据集和4个由MNIST手写数字集生成的数据集上的实验结果表明,采用半监督直推学习方式,该算法的性能优于其他对比算法的情况为60.5%;采用半监督归纳学习方式,该算法的性能优于其他对比算法的情况为42.6%。 展开更多
关键词 半监督学习 最大间隔 流形假设 标记置信度 支持向量机
下载PDF
基于DBN-MFSVM的玉米跨境供应链风险预警方法
20
作者 葛振林 《粮油食品科技》 CAS CSCD 北大核心 2024年第5期202-210,共9页
针对当前玉米跨境供应链系统中存在大量的非结构化数据,具备多源异构特点。传统的风险预警方法存在过度依赖人工决策、预警准确率偏低等缺陷。为解决上述问题,提出基于深度置信网络和多类模糊支持向量机的玉米跨境供应链系统风险预警方... 针对当前玉米跨境供应链系统中存在大量的非结构化数据,具备多源异构特点。传统的风险预警方法存在过度依赖人工决策、预警准确率偏低等缺陷。为解决上述问题,提出基于深度置信网络和多类模糊支持向量机的玉米跨境供应链系统风险预警方法。首先基于嵌入编码与归一化原理,预处理玉米跨境供应链系统中的大量非结构化数据,转化为结构化数据,便于后续计算;然后基于深度置信网络,提取数据高纬度特征,自适应挖掘出玉米跨境供应链系统中风险指标变化趋势与关联性;最后将提取出的高维度特征输入到多类模糊支持向量机模型中进行训练,实现玉米跨境供应链风险分级预警。所提算法能够在运行时间相近的情况下,准确率达到94.88%,较最差算法提升52.17%,综合性能较其他算法优越,能够为玉米跨境供应链系统风险监管应用提供理论支撑。 展开更多
关键词 玉米跨境供应链 深度置信网络 支持向量机 风险预警
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部