期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于KNN算法和10折交叉验证法的支持向量选取算法 被引量:18
1
作者 牛晓太 《华中师范大学学报(自然科学版)》 CAS 北大核心 2014年第3期335-338,共4页
经典支持向量机算法具有较高的时空复杂度,这导致其很难广泛被应用.为此,该文基于支持向量分布的先验知识,把KNN算法和10折交叉验证方法结合起来,提出了一个支持向量预选取算法.该算法从原始样本集中选取k个邻近样本,并计算出这k个邻近... 经典支持向量机算法具有较高的时空复杂度,这导致其很难广泛被应用.为此,该文基于支持向量分布的先验知识,把KNN算法和10折交叉验证方法结合起来,提出了一个支持向量预选取算法.该算法从原始样本集中选取k个邻近样本,并计算出这k个邻近样本中异类样本所占比例,如果该比例超过了所给定的阈值q,就选择这些异类样本作为预取的支持向量.在此过程中,采用10折交叉验证法来确定k与q的最佳值.两组仿真实验表明所提算法选择出的支持向量而形成的分类器分类准确率更高而且耗时还较少. 展开更多
关键词 机器学习 支持向量 K近邻算法 10折交叉验证法
下载PDF
具有10次对称性的准晶结构模型 被引量:1
2
作者 陈敬中 《地球科学(中国地质大学学报)》 EI CSCD 北大核心 1993年第S1期114-121,共8页
准晶体不同于晶体晶胞的选取原则,须先考虑选取两种或三种基本菱形单胞,再考虑如何由这类菱形生成的组合准晶胞,既要考虑组合准晶胞的对称性,又要考虑它们铺满2维平面的原则,考虑到三角二十面体分数维生长的优点,又考虑到36°,144&#... 准晶体不同于晶体晶胞的选取原则,须先考虑选取两种或三种基本菱形单胞,再考虑如何由这类菱形生成的组合准晶胞,既要考虑组合准晶胞的对称性,又要考虑它们铺满2维平面的原则,考虑到三角二十面体分数维生长的优点,又考虑到36°,144°菱形与72°,108°菱形生成Penrose拼图优点,更重要的是组合准晶胞多重分数维生长的优点,在此基础上我们提出一种新的10次对称性的准晶结构模型。(1)以36°,144°菱形与72°,108°菱形为基本单元生成组合准晶胞;(2)以组合准晶胞为单位操作;(3)以2.6180作准周期进行放大、缩小操作,即R_n=R_(n-1)×2.6180;(4)以高次对称轴(10次轴)作旋转操作;(5)生成10次准晶多重分数维结构模型。 展开更多
关键词 10次对称轴 2维准晶 Penrose拼图 准晶分数维结构模型 准晶多重分数维结构模型
下载PDF
IL-10、TGF-β1及iNOS在不同病理分型声带白斑中的表达及意义
3
作者 游永晶 马艳利 +1 位作者 刘婷 庄佩耘 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2022年第3期257-261,共5页
目的评估白介素-10(IL-10)、转化生长因子-β1(TGF-β1)及诱导型一氧化氮合酶(iNOS)在不同病理分级声带白斑中的表达,探讨其与声带白斑癌变的关系。方法通过免疫组织化学染色技术和计算机图像定量分析法,检测IL-10、TGF-β1及iNOS在40... 目的评估白介素-10(IL-10)、转化生长因子-β1(TGF-β1)及诱导型一氧化氮合酶(iNOS)在不同病理分级声带白斑中的表达,探讨其与声带白斑癌变的关系。方法通过免疫组织化学染色技术和计算机图像定量分析法,检测IL-10、TGF-β1及iNOS在40例临床诊断为声带白斑且病理分型分别为10例鳞状上皮单纯性增生、10例鳞状上皮轻度不典型增生、10例鳞状上皮中重度不典型增生、10例声门型喉癌及10例声带息肉中的表达,比较各组结果。结果随着声带上皮细胞异型程度的增加,IL-10表达量逐渐升高,在声带鳞状上皮单纯性增生、轻度不典型增生、中重度不典型增生与声门型喉癌间比较差异均有统计学意义(P<0.05),其表达在声带鳞状上皮单纯性增生和声带息肉间比较差异无统计学意义(P>0.05)。iNOS和TGF-β1的表达除在声带鳞状上皮单纯性增生和声带息肉间比较差异无统计学意义(P>0.05)外,其他各组间的表达比较差异均有统计学意义(P<0.05),两者的表达量在声带鳞状上皮单纯性增生、轻度不典型增生、中重度不典型增生中呈递增趋势,而中重度不典型增生进展为喉癌时,表达量降低。结论TGF-β1和iNOS的表达量改变可能为声带白斑癌变过程中的早期事件,IL-10可作为声带白斑早期癌变的分子标记物之一。 展开更多
关键词 声带白斑 白介素-10 转化生长因子-Β1 诱导型一氧化氮合酶
下载PDF
基于融合特征与GA-SVM算法的脑疾病基因预测 被引量:2
4
作者 谭卓昆 罗龙飞 王顺芳 《计算机工程与应用》 CSCD 北大核心 2023年第5期70-77,共8页
单一生物数据网络提供的特征信息是十分受限的,针对这一问题,提出了一种基于半监督自编码器的多网络特征融合方法,丰富特征信息。此外,为解决在人为设置模型的超参数时,易出现模型性能较低、陷入局部最优等问题,进一步提出了利用遗传算... 单一生物数据网络提供的特征信息是十分受限的,针对这一问题,提出了一种基于半监督自编码器的多网络特征融合方法,丰富特征信息。此外,为解决在人为设置模型的超参数时,易出现模型性能较低、陷入局部最优等问题,进一步提出了利用遗传算法优化支持向量机(GA-SVM算法)模型的方法,提高脑部疾病基因的预测性能。构建来自不同数据源的相似性数据网络,利用重启随机游走算法从四个数据网络中提取特征,通过半监督自编码器进行处理及融合,在十折交叉验证的策略下使用GA-SVM算法模型预测脑部疾病基因,并与其他算法进行比较。实验结果表明,在PD数据集上的AUC和AUPR值分别为0.805、0.792,而在MDD数据集上的AUC和AUPR值分别为0.825、0.823,均优于已有的预测模型,有效证明了该方法能够提高脑部疾病基因的预测效果。 展开更多
关键词 GA-SVM算法 多网络融合 半监督自编码器 脑部疾病基因 十折交叉验证
下载PDF
基于深度学习的完全填充型熔融沉积成型零件质量预测方法 被引量:2
5
作者 董海 高秀秀 魏铭琦 《计算机集成制造系统》 EI CSCD 北大核心 2023年第1期200-211,共12页
抗拉强度、翘曲度和表面粗糙度是衡量熔融沉积成型(FDM)零件质量的重要指标,对其准确、稳定的预测有助于FDM工艺的发展。为此,提出一种基于优化深度信念网络的完全填充型FDM零件质量预测方法。首先根据FDM的生产工艺选取影响零件质量指... 抗拉强度、翘曲度和表面粗糙度是衡量熔融沉积成型(FDM)零件质量的重要指标,对其准确、稳定的预测有助于FDM工艺的发展。为此,提出一种基于优化深度信念网络的完全填充型FDM零件质量预测方法。首先根据FDM的生产工艺选取影响零件质量指标的主要变量,利用相关性分析方法确定对产品质量影响最大的工艺参数组合,以获取预测模型的输入变量;其次以10—折交叉验证的验证误差作为适应度值,基于网格搜索确定稀疏约束深度信念网络(SDBN)的最佳超参数组合,采用自适应布谷鸟搜索(ACS)算法对SDBN进行优化,构建完全填充型FDM零件质量预测模型;最后,将所提的ACS-SDBN与ACS-DBN、深度信念网络(DBN)和BP的预测结果进行对比,结果表明基于ACS-SDBN模型的完全填充型FDM零件质量预测方法具有更好的预测精度和稳定性。 展开更多
关键词 熔融沉积成型零件 质量预测 10—折交叉验证 稀疏深度信念网络 自适应布谷鸟搜索算法 增材制造
下载PDF
基于不同机器学习的震后滑坡易发性建模研究 被引量:1
6
作者 周天游 刘畅 +2 位作者 薛鹏 杨豹 舒建冬 《自然灾害学报》 CSCD 北大核心 2023年第5期177-185,共9页
不同机器学习预测滑坡易发性的建模过程及其不确定性有所差异,高精度地评价震后滑坡灾害易发性是实现有效防灾减灾的关键。首先建立了九寨沟“8·8”地震震后滑坡数据库,通过开展因子共线性诊断,从14个初始滑坡影响因子中剔除了2个... 不同机器学习预测滑坡易发性的建模过程及其不确定性有所差异,高精度地评价震后滑坡灾害易发性是实现有效防灾减灾的关键。首先建立了九寨沟“8·8”地震震后滑坡数据库,通过开展因子共线性诊断,从14个初始滑坡影响因子中剔除了2个因子,最终选取了12个因子参与滑坡易发性建模。然后选取逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)和人工神经网络(ANN)4种机器学习模型和10折交叉验证数据取样方法,利用受试者特征ROC曲线和易发性指数分布特征(均值和标准差)等来探讨基于机器学习的滑坡易发性建模及其不确定性。结果表明,震后滑坡高易发区主要沿震中附近和沟谷发育分布;4种模型准确率AUC值均超过0.87,对于预测研究区潜在震后滑坡均具有良好的适用性;SVM易发性指数均值和标准差均较小,表明模型对滑坡有较好的识别能力,其预测精度均值CV_(mean)最高(0.925),其他模型依次为ANN(0.920)、LR(0.894)和RF(0.877)。研究结果对推广和促进机器学习模型在其他地区的易发性预测建模具有极其重要的意义。 展开更多
关键词 震后滑坡 滑坡易发性评价 机器学习 10折交叉验证 防灾减灾
下载PDF
基于图卷积神经网络和拓扑特征的微核糖核酸-疾病关联预测模型
7
作者 畅豫霄 董亚东 徐永涛 《生物医学工程研究》 2023年第2期122-130,共9页
针对在微核糖核酸(micro ribonucleic acid,miRNA)-疾病关联性研究中信息使用不充分,且过度依赖网络节点的相似度信息,预测准确率较低的问题,本研究提出了基于图卷积神经网络(graph convolutional neural networks,GCN)及拓扑特征的miRN... 针对在微核糖核酸(micro ribonucleic acid,miRNA)-疾病关联性研究中信息使用不充分,且过度依赖网络节点的相似度信息,预测准确率较低的问题,本研究提出了基于图卷积神经网络(graph convolutional neural networks,GCN)及拓扑特征的miRNA和疾病的关联预测计算模型GTMDA。该模型综合miRNA相似度矩阵、疾病语义相似度网络和miRNA-疾病关联关系矩阵,首先使用GCN和随机游走算法,分别获取miRNA和疾病的子图顶点嵌入特征及miRNA与疾病相似性网络的拓扑结构特征;然后将其输入多层感知器(multilayer perceptron,MLP),预测潜在关联性。结果表明,该模型的AUC值达到0.9475±0.0106,优于其他方法。此外,预测的前50个miRNA中,84%的乳腺恶性肿瘤、90%的食管癌和94%的肺癌得到了独立数据库的验证。因此,本研究模型可作为预测miRNA-疾病潜在关联的可靠模型。 展开更多
关键词 链路预测 高斯相互作用谱核相似性 卷积运算 分类特征 图迭代 无向图特征 十折交叉验证
下载PDF
县域尺度森林地上生物量遥感估测方法研究 被引量:12
8
作者 蒋云姣 胡曼 +1 位作者 李明阳 张向阳 《西南林业大学学报(自然科学)》 CAS 北大核心 2015年第6期53-59,共7页
以河南西峡县2013年Landsat 8影像及同期217块森林资源连续清查固定样地数据为信息源,以9个植被指数、3个地形指数为自变量,建立多元线性回归、决策与回归树、装袋算法、随机森林4种遥感估测模型;采用十折交叉验证,及相关系数、绝对误... 以河南西峡县2013年Landsat 8影像及同期217块森林资源连续清查固定样地数据为信息源,以9个植被指数、3个地形指数为自变量,建立多元线性回归、决策与回归树、装袋算法、随机森林4种遥感估测模型;采用十折交叉验证,及相关系数、绝对误差、均方根误差、相对误差、相对均方根误差5个指标,对遥感估测模型进行精度评价,在此基础上,对研究区域2013年的森林地上部分生物量进行遥感估测和空间分析。结果表明:在4种遥感估测模型中,随机森林综合性能最高,装袋法次之,多元线性回归最低;在12个自变量中,地形(海拔、坡度)、土壤(亮度指数、湿度指数)、植被生长状况(垂直植被指数、有效叶面积指数)6个因子是影响研究区域森林地上部分生物量的重要环境变量;2013年,研究区域单位面积森林生物量为38.56 t/hm^2,其中低(〈40 t/hm^2)、中(40-60 t/hm^2)、高(〉60 t/hm^2)的面积分别占59.92%、24.30%、15.78%;研究区域森林地上部分生物量较高的区域,主要分布在交通不便、森林茂密、人类干扰活动较少的北部石质山区,而较低的区域,主要分布在交通发达,人口密度大,坡度较为平缓的南部鹳河谷地。 展开更多
关键词 生物量 遥感估测 十折交叉验证 西峡县
下载PDF
基于用户的协同过滤算法的推荐效率和个性化改进 被引量:37
9
作者 王成 朱志刚 +1 位作者 张玉侠 苏芳芳 《小型微型计算机系统》 CSCD 北大核心 2016年第3期428-432,共5页
针对传统的基于用户的协同过滤算法存在的推荐效率、精度和个性化低的问题,提出一种改进方法.该方法在计算用户评分矩阵时,考虑到用户评分矩阵稀疏性,建立项目-用户的倒查表,只计算有相同评分项的用户之间的相似度,避免了传统方法中对... 针对传统的基于用户的协同过滤算法存在的推荐效率、精度和个性化低的问题,提出一种改进方法.该方法在计算用户评分矩阵时,考虑到用户评分矩阵稀疏性,建立项目-用户的倒查表,只计算有相同评分项的用户之间的相似度,避免了传统方法中对所有用户计算两两用户相似度的庞大工作量.该方法在计算用户相似度时,考虑到项目的热门程度不同,"惩罚"了用户共同兴趣列表中的热门项目,避免了传统方法中赋予所有项目相同权值对推荐结果个性化的负面影响.本文在详细分析了改进的用户协同过滤算法的原理和优点,给出了其推荐步骤流程图.在Movielens100K和HetRec2011-movielens-2k公开数据集上,十折交叉验证的结果表明,改进后的算法节约了运行时间,提高了推荐算法的效率和个性化. 展开更多
关键词 基于用户的协同过滤 个性化推荐 相似度计算 用户评分矩阵 数据稀疏性 项目-用户倒查表 十折交叉验证
下载PDF
光电容积脉搏波的睡眠呼吸暂停综合征筛查方法 被引量:5
10
作者 李肃义 姜珊 +2 位作者 刘丽佳 熊文激 倪维广 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2019年第6期1852-1857,共6页
睡眠呼吸暂停综合征(SAS)素有“睡眠杀手”之称。由于其诊断金标准多导睡眠监测仪(PSG)的限制,诊断率一直偏低。由于呼吸暂停发生时会引发心率节奏的变化,因此利用心电图(ECG)通过心率变异性(HRV)分析可以实现SAS的自动筛查。但是,ECG-... 睡眠呼吸暂停综合征(SAS)素有“睡眠杀手”之称。由于其诊断金标准多导睡眠监测仪(PSG)的限制,诊断率一直偏低。由于呼吸暂停发生时会引发心率节奏的变化,因此利用心电图(ECG)通过心率变异性(HRV)分析可以实现SAS的自动筛查。但是,ECG-SAS方法所用电极穿戴繁琐、材质致敏性较高,影响睡眠安适度。鉴于脉率变异性(PRV)分析与HRV分析高度相关,并且光电容积脉搏波(PPG)信号相对ECG信号获取方式更加简单,不仅电极不易致敏,而且更易于穿戴,对睡眠干扰小。由此,提出利用同步采集的PPG信号和ECG信号,应用相同的建模方法,比较二者的疾病识别能力。应用反向传播(BP)神经网络,分别建立PPG-SAS与ECG-SAS自动筛查模型,并采用十折交叉验证法及受试者工作特征(ROC)曲线对模型进行对比与评估。实验数据来源于MIT-BIH Polysomnographic Database,共8 248个样本,其中正常样本6 227例。首先采用三层BP神经网络,默认参数下建立PPG-SAS与ECG-SAS模型,使用十折交叉验证法及ROC曲线进行模型分类准确性的对比;然后依次改变影响分类性能的隐层节点数、训练函数以及传递函数,建立多个PPG-SAS与ECG-SAS模型,从中选取各自的最优模型再进行对比。通过比较识别率、预测率以及ROC曲线面积,采用默认参数的PPG-SAS模型优于ECG-SAS模型。通过比较平均分类准确率,隐层节点数为50、训练函数为一步正割算法、隐含层传递函数为双曲正切S型函数时,PPG-SAS模型得到的最高识别率与预测率分别为80.30%和80.13%;隐层节点数为50、训练函数为一步正割算法、隐含层传递函数为径向基时,ECG-SAS模型的最高识别率与预测率分别为77.60%和77.67%。以上实验结果均表明PPG信号的SAS分类能力较ECG信号更具优越性,由此证明了PPG信号筛查SAS的可行性及可靠性,为临床SAS病症的早期发现及诊断率提升奠定理论基础。 展开更多
关键词 睡眠呼吸暂停综合征 光电容积脉搏波 心电信号 神经网络 十折交叉验证法
下载PDF
基于朴素贝叶斯分类器的个人信用评估模型 被引量:7
11
作者 李旭升 郭耀煌 《计算机工程与应用》 CSCD 北大核心 2006年第30期197-201,共5页
个人信用评估是金融与银行界研究的重要内容。论文研究了三种朴素贝叶斯分类器信用评估模型的精度。在两个真实数据集上用10层交叉验证对朴素贝叶斯信用评估模型进行了测试,并与五种DavidWest的神经网络个人信用评估模型进行了对比。结... 个人信用评估是金融与银行界研究的重要内容。论文研究了三种朴素贝叶斯分类器信用评估模型的精度。在两个真实数据集上用10层交叉验证对朴素贝叶斯信用评估模型进行了测试,并与五种DavidWest的神经网络个人信用评估模型进行了对比。结果表明朴素贝叶斯分类器具有较低的分类误差,在信用评估中有优势。 展开更多
关键词 个人信用评估 朴素贝叶斯分类器 神经网络 10层交叉验证
下载PDF
基于边缘对称性和HOG的行人检测方法 被引量:22
12
作者 姚雪琴 李晓华 周激流 《计算机工程》 CAS CSCD 2012年第5期179-182,共4页
传统基于HOG特征的行人检测方法存在检测速度慢的问题。为此,提出一种基于边缘对称性和HOG的行人检测方法。利用对称差分提取输入窗口的垂直边缘,根据垂直边缘的对称性快速检测出行人候选区,采用HOG特征和线性支持向量机对行人候选区进... 传统基于HOG特征的行人检测方法存在检测速度慢的问题。为此,提出一种基于边缘对称性和HOG的行人检测方法。利用对称差分提取输入窗口的垂直边缘,根据垂直边缘的对称性快速检测出行人候选区,采用HOG特征和线性支持向量机对行人候选区进行验证。实验结果表明,该方法在保持传统方法检测率的同时,能提高检测速度。 展开更多
关键词 行人检测 对称差分 垂直边缘 边缘对称性 HOG特征 线性支持向量机 十折交叉验证
下载PDF
功耗分析攻击中机器学习模型选择研究 被引量:2
13
作者 段晓毅 陈东 +2 位作者 高献伟 范晓红 周玉坤 《计算机工程》 CAS CSCD 北大核心 2019年第11期144-151,158,共9页
根据密码芯片功耗曲线的特性,对支持向量机、随机森林、K最近邻、朴素贝叶斯4种机器学习算法进行分析研究,从中选择用于功耗分析攻击的最优算法。对于机器学习算法的数据选取问题,使用多组数量相同但组成元素不同的数据集的十折交叉验... 根据密码芯片功耗曲线的特性,对支持向量机、随机森林、K最近邻、朴素贝叶斯4种机器学习算法进行分析研究,从中选择用于功耗分析攻击的最优算法。对于机器学习算法的数据选取问题,使用多组数量相同但组成元素不同的数据集的十折交叉验证结果进行模型选择,提高测试公平性及测试结果的泛化能力。为避免十折交叉验证过程中出现测试集误差不足以近似泛化误差的问题,采用Friedman检验及Nemenyi后续检验相结合的方法对4种机器学习算法进行评估,结果表明支持向量机是适用于功耗分析攻击的最优机器学习算法。 展开更多
关键词 机器学习 十折交叉验证 Friedman检验 Nemenyi后续检验 功耗分析攻击
下载PDF
水下目标识别中的特征优化选择 被引量:1
14
作者 袁骏 张明敏 孙进才 《应用声学》 CSCD 北大核心 2005年第4期239-243,共5页
本文将模式识别中的特征选择方法用于水下目标特征的优化选择。用距离测度作为选择的准则,对提取的三类舰船噪声的高维组合特征进行自动选择,并用10-折交叉验证方法对选择出的特征子集进行评估,分析结果说明该方法能从原始的特征集中选... 本文将模式识别中的特征选择方法用于水下目标特征的优化选择。用距离测度作为选择的准则,对提取的三类舰船噪声的高维组合特征进行自动选择,并用10-折交叉验证方法对选择出的特征子集进行评估,分析结果说明该方法能从原始的特征集中选择出有利于分类的特征子集,提高了水下目标分类的正确率。 展开更多
关键词 优化选择 水下目标识别 水下目标分类 特征子集 目标特征 特征选择 模式识别 距离测度 自动选择 组合特征 舰船噪声 验证方法 分析结果 正确率
下载PDF
基于网格搜索和ELM的冲击地压危险等级预测 被引量:6
15
作者 王彦彬 孙韶光 《中国安全科学学报》 CAS CSCD 北大核心 2017年第8期97-101,共5页
为提高冲击地压危险等级预测模型的泛化性能及预测精度,采用网格搜索法结合十折交叉验证法对极限学习机(ELM)中的隐含层神经元个数及激活函数的类型进行组合优化,进而建立冲击地压危险等级预测模型;选取重庆砚石台煤矿36组实测数据进行... 为提高冲击地压危险等级预测模型的泛化性能及预测精度,采用网格搜索法结合十折交叉验证法对极限学习机(ELM)中的隐含层神经元个数及激活函数的类型进行组合优化,进而建立冲击地压危险等级预测模型;选取重庆砚石台煤矿36组实测数据进行试验,对影响因素数据进行标准化处理,选择其中26组样本对模型进行训练,采用该模型对后10组样本中冲击地压危险等级进行预测,并与其他方法作对比。结果显示:经过十折交叉验证,用该模型得到的正确识别率为84.615%,高于朴素贝叶斯及Adaboost M1的76.92%、61.54%,采用该模型对测试样本集中冲击地压危险等级进行预测,预测准确率为90%,高于朴素贝叶斯及Adaboost M1预测准确率80%。 展开更多
关键词 冲击地压 危险等级预测 极限学习机(ELM) 网格搜索法 十折交叉验证
下载PDF
基于自适应烟花算法和k近邻算法的特征选择算法 被引量:6
16
作者 黄欣 莫海淼 赵志刚 《计算机应用与软件》 北大核心 2020年第5期268-274,共7页
特征选择是从原始特征集中选取若干个特征子集,并降低数据维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,将自适应烟花算法进行离散化处理,使用k近邻算法作为分类器,并提出新的特征选择算法。将特征子集引入目标函... 特征选择是从原始特征集中选取若干个特征子集,并降低数据维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,将自适应烟花算法进行离散化处理,使用k近邻算法作为分类器,并提出新的特征选择算法。将特征子集引入目标函数,并使用惩罚因子来处理约束条件,采用十折交叉验证法来检验分类效果。使用机器学习常用的UCI数据集进行仿真实验,结果表明:与增强烟花算法、烟花算法、蝙蝠算法、粒子群算法和自适应粒子群算法相比,该算法的性能更优。 展开更多
关键词 自适应烟花算法 特征选择 分类 K近邻算法 十折交叉验证
下载PDF
基于GA-CFS属性选择的个人信用评估模型 被引量:2
17
作者 柳亚琴 石洪波 《计算机系统应用》 2011年第5期210-213,161,共5页
属性选择可以有效减少数据的冗余度和降低数据的维度,将GA-CFS属性选择方法引入个人信用评估中,利用CFS评价得到的启发式"价值"作为GA的适应度函数来对个人信用指标体系优化,建立了基于GA-CFS属性选择的个人信用评估模型。在A... 属性选择可以有效减少数据的冗余度和降低数据的维度,将GA-CFS属性选择方法引入个人信用评估中,利用CFS评价得到的启发式"价值"作为GA的适应度函数来对个人信用指标体系优化,建立了基于GA-CFS属性选择的个人信用评估模型。在Australian数据集上比较了ID3、NB、Logistic、SMO与GA-CFS属性选择方法和这四种分类算法分别结合执行的结果。实验结果表明,基于GA-CFS属性选择的个人信用评估模型降低了个人信用指标的维度,减少了学习所需的数据量,而且比基于单分类器的个人信用评估模型具有更高的分类准确率。 展开更多
关键词 个人信用评估 属性选择 遗传算法 CFS 1010重交叉验证
下载PDF
基于支持向量机的大学生毕业选择预测研究 被引量:1
18
作者 徐岩 石丽坤 王明蕙 《石家庄学院学报》 2008年第6期34-38,共5页
支持向量机(support vector machine,SVM)是在统计学习理论的基础上发展起来的一种新的机器学习方法,是数据挖掘的一项新技术;支持向量分类机(SVC)应用于解决各种实际分类问题,表现出很多优于已有方法的性能.经调查,临毕业大学生做出的... 支持向量机(support vector machine,SVM)是在统计学习理论的基础上发展起来的一种新的机器学习方法,是数据挖掘的一项新技术;支持向量分类机(SVC)应用于解决各种实际分类问题,表现出很多优于已有方法的性能.经调查,临毕业大学生做出的毕业方向选择会由其自身一些因素影响,可以根据这些指标来预测其最终选择.对大学生这些自身因素及毕业选择建立支持向量机分类模型进行研究.结果表明,支持向量机分类方法可以做出较好的分类,为预测高校临毕业学生选择提供了一种有效的方法. 展开更多
关键词 支持向量机 分类问题 十折交叉验证 核函数
下载PDF
基于CatBoost算法的硕士研究生就业能力预测模型 被引量:4
19
作者 巩红 陈阳 +2 位作者 周晨晖 李昊楠 喻小康 《西安邮电大学学报》 2021年第6期89-96,共8页
为了预测硕士研究生的就业能力,构建一种基于CatBoost算法的硕士研究生就业能力模型。首先,选取关于硕士研究生在校期间的图书阅读量、专利、技能证书等31项影响因素数据,采用SMOTE过采样方法处理数据集的不平衡问题。其次,通过机器学... 为了预测硕士研究生的就业能力,构建一种基于CatBoost算法的硕士研究生就业能力模型。首先,选取关于硕士研究生在校期间的图书阅读量、专利、技能证书等31项影响因素数据,采用SMOTE过采样方法处理数据集的不平衡问题。其次,通过机器学习方法挖掘学生个人培养数据与就业之间的关系,利用CatBoost算法构建硕士研究生就业预测模型,并使用10倍交叉法降低结果的偶然性。最后,将基于CatBoost算法的预测模型与随机森林、决策树及支持向量机等相关算法进行比较。研究结果表明,该预测模型在召回率、精确率、误判率、F_(1)值及对硕士研究生的就业能力预测效果方面均优于其他算法。 展开更多
关键词 就业预测 CatBoost算法 SMOTE过采样 10倍交叉验证
下载PDF
工厂实际煮茧方法辨异 被引量:1
20
作者 王小英 《丝绸》 CAS 北大核心 2008年第10期35-36,共2页
采用对比试验法,对真空渗透后直接缫丝与经煮熟、调整、保护三大过程煮茧后缫丝的质量与缫折进行比较,并对其利弊进行分析,指出优选煮茧工艺才是降低消耗、提高生丝产质量的关键。
关键词 煮茧方法 解舒 万米吊糙 清洁洁净 缫折
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部