期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于随机森林模型的城市非法营运车辆识别
1
作者 黄子璇 李桥兴 《电子科技》 2024年第1期66-71,共6页
区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC... 区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC数据的有效字段,采用随机森林算法建立非法营运车辆识别分类器,加入CART(Classification and Regression Tree)分类树模型分类器和二元逻辑回归模型分类器与之对比,并以西南某市高速公路自2022年2月6日~2022年3月8日的ETC指标数据进行实证分析。结果表明,随机森林模型分类器比CART分类树模型分类器和二元逻辑回归模型分类器预测效果更好,其准确性高达98.75%。 展开更多
关键词 非法营运车辆 随机森林模型 CART分类树模型 二元逻辑回归模型 分类算法 机器学习 深度学习 识别算法
下载PDF
基于信息量和逻辑回归耦合模型的黄土地震滑坡危险性分析 被引量:8
2
作者 钱紫玲 王平 +4 位作者 李娜 王会娟 许书雅 许世阳 王雅丽 《地震工程学报》 CSCD 北大核心 2023年第3期706-715,共10页
黄土地震滑坡危险性分析对黄土地区城镇化、工程建设的规划和地震灾害预防具有重要意义。以甘肃省定西市岷县—漳县交界处为研究区域,通过统计分析该区历史地震滑坡灾害数据,归纳并建立包含地震、坡度、坡高、坡向、地层岩性、年平均降... 黄土地震滑坡危险性分析对黄土地区城镇化、工程建设的规划和地震灾害预防具有重要意义。以甘肃省定西市岷县—漳县交界处为研究区域,通过统计分析该区历史地震滑坡灾害数据,归纳并建立包含地震、坡度、坡高、坡向、地层岩性、年平均降雨量、河流流域和地貌类型等8个影响因子的评价指标体系,采用信息量模型、逻辑回归模型和信息量-逻辑回归耦合模型分别分析该区域黄土地震滑坡危险性。结果表明:(1)地震、河流和降雨是诱发黄土滑坡灾害发生的主要因素,其中地震因子贡献率最大;(2)研究区可划分为高、较高、中、低和极低危险区五个等级,其中高危险区主要集中于岷县、漳县与陇西县等地;(3)根据受试者工作特性(ROC)曲线精度检验结果,三种模型的AUC值分别为0.889、0.617和0.898,信息量-逻辑回归耦合模型结果的精确性相比其他两个模型更高。 展开更多
关键词 黄土地震滑坡 信息量模型 逻辑回归模型 信息量-逻辑回归耦合模型 危险性区划
下载PDF
基于信息量、加权信息量与逻辑回归耦合模型的云南罗平县崩滑灾害易发性评价对比分析 被引量:7
3
作者 杨得虎 朱杰勇 +2 位作者 刘帅 马博 代旭升 《中国地质灾害与防治学报》 CSCD 2023年第5期43-53,共11页
以罗平县崩滑地质灾害为研究对象,选取工程岩组、坡度、坡向、高程、起伏度、曲率、地貌类型、距河流距离、距断裂距离9个评价因子,基于共线性诊断和相关性分析对其进行独立性检验。然后采用信息量法计算各评价因子分类分级的信息量值,... 以罗平县崩滑地质灾害为研究对象,选取工程岩组、坡度、坡向、高程、起伏度、曲率、地貌类型、距河流距离、距断裂距离9个评价因子,基于共线性诊断和相关性分析对其进行独立性检验。然后采用信息量法计算各评价因子分类分级的信息量值,采用层次分析法和逻辑回归法对各评价因子进行权重的定量计算,从而构建信息量、加权信息量和信息量-逻辑回归耦合易发性评价模型并进行对比分析。基于GIS的自然断点法将评价结果划分为非、低、中和高4个等级,并采用ROC曲线对其精度进行检验。结果表明:3种评价模型的AUC值分别为0.757、0.723和0.852,信息量-逻辑回归耦合模型的精度最高,模型结果分区与崩滑地质灾害点的分布较吻合,其非、低、中和高的面积(分级比)分别为771.1 km^(2)(25.55%)、836.6 km^(2)(27.73%)、864.36 km^(2)(28.64%)和545.94 km^(2)(18.08%)。 展开更多
关键词 崩塌 滑坡 地质灾害 信息量模型 加权信息量模型 信息量-逻辑回归耦合模型 易发性评价
下载PDF
乳腺良恶性病变鉴别的MRI影像组学预测模型构建:基于随机森林、支持向量机、逻辑回归分类器 被引量:12
4
作者 吴佩琪 杨雅俪 +2 位作者 周妍璐 郭粉玲 毛小明 《分子影像学杂志》 2021年第5期764-770,共7页
目的构建基于随机森林、支持向量机和逻辑回归分类器的MRI影像组学预测模型,对乳腺良恶性病变进行鉴别,并评估上述模型的诊断价值。方法回顾性分析在南方科技大学盐田医院进行MRI影像检查并获得手术病理的34例乳腺病变患者的动态增强MR... 目的构建基于随机森林、支持向量机和逻辑回归分类器的MRI影像组学预测模型,对乳腺良恶性病变进行鉴别,并评估上述模型的诊断价值。方法回顾性分析在南方科技大学盐田医院进行MRI影像检查并获得手术病理的34例乳腺病变患者的动态增强MRI图像。按0.8∶0.2的比例将病例分为训练集(n=27)和测试集(n=7)。采用3D Slicer软件勾画乳腺病灶靶区并生成3D感兴趣体积,对每个感兴趣体积提取1037个影像组学特征,使用LASSO进行影像组学特征降维,然后在训练集中采用随机森林、支持向量机和逻辑回归等3种分类器分别构建乳腺良恶性病变的预测模型,并在测试集中进行评估。结果经LASSO降维后共选出6个影像组学特征标签进行建模,3种模型在训练集中的分类效果均非常好(曲线下面积>0.90),其中稳定性最高的是基于逻辑回归分类器建立的乳腺良恶性病变影像组学预测模型。结论基于随机森林、支持向量机和逻辑回归的MRI影像组学预测模型在诊断乳腺良恶性病变方面都具有较好的诊断效能,其中逻辑回归模型更为稳定。影像组学方法可为乳腺良恶性病变的预测提供新的手段。 展开更多
关键词 乳腺癌 核磁共振 影像组学 预测模型 随机森林 支持向量机 逻辑回归
下载PDF
基于信息量-随机森林耦合模型的山地丘陵县滑坡灾害易发性空间预测 被引量:1
5
作者 陈博 王洋 +1 位作者 黄信 黄精涛 《江西科学》 2022年第5期914-919,964,共7页
为解决传统评价模型中精度不高、容易出现过拟合问题,提出基于信息量-随机森林(IV-RF)耦合模型对山地丘陵县滑坡灾害进行易发性评价。在关联性分析基础上,构建含有高程、坡向、坡度、工程地质岩组、距道路距离、平面曲率6个指标在内的... 为解决传统评价模型中精度不高、容易出现过拟合问题,提出基于信息量-随机森林(IV-RF)耦合模型对山地丘陵县滑坡灾害进行易发性评价。在关联性分析基础上,构建含有高程、坡向、坡度、工程地质岩组、距道路距离、平面曲率6个指标在内的评价体系,借助ArcGIS的空间分析功能,建立基于信息量-随机森林耦合模型进行滑坡灾害易发性分区评价,并通过信息量模型进行对比分析与验证,最后以新干县为研究区进行实例分析。结果表明:影响滑坡的6个评价指标中,距道路距离这一指标对其影响最大;滑坡高易发区和较高易发区呈线性分布在道路附近;信息量-随机森林耦合模型较信息量模型的预测精度高了20.7%,说明信息量-随机森林耦合模型更适用于山地丘陵区的滑坡易发性评价。 展开更多
关键词 信息量-随机森林耦合模型 信息量模型 易发性评价 ARCGIS
下载PDF
融合情境感知与随机森林的旅游景点推荐模型
6
作者 吴霞 杨晓霞 朱锋 《现代电子技术》 2023年第6期154-160,共7页
情境是指一切可以用来描述某个对象情形和特征的信息,包括时间、位置、社会关系、自然状况以及项目特征等。旅游景点的选择受多种类型情境要素的影响,而传统的旅游景点推荐模型中未考虑或只考虑单一的情境要素,忽略了多方面情境要素对... 情境是指一切可以用来描述某个对象情形和特征的信息,包括时间、位置、社会关系、自然状况以及项目特征等。旅游景点的选择受多种类型情境要素的影响,而传统的旅游景点推荐模型中未考虑或只考虑单一的情境要素,忽略了多方面情境要素对用户在选择出行目的地的综合影响。为此,文中通过归纳11种情境要素对景点推荐的影响并探讨它们影响程度的差异,提出一种融合情境感知和随机森林算法的旅游景点推荐模型,将情境要素作为随机森林中决策树分裂时要考虑的特征属性进行建模。实验结果表明:在众多情境要素中,相比于温度、季节等其他情境要素,景点自身的情境要素对旅游景点的选择影响更大,在进行推荐时,对各类情境要素按照重要性程度赋予相应的权重能够提高推荐的准确率;与逻辑回归模型相比,随机森林模型在不同数据抽样比下的预测精度更高,当训练数据集与测试数据集的比值为7∶3时精度最高。 展开更多
关键词 情境感知 随机森林 决策树 逻辑回归 情境要素 旅游景点预测 模型构建 实验验证
下载PDF
基于信息量和逻辑回归耦合模型的滑坡易发性评价 被引量:18
7
作者 田钦 张彪 +4 位作者 郭建飞 刘华赞 常志璐 李怡静 黄发明 《科学技术与工程》 北大核心 2020年第21期8460-8468,共9页
目前,滑坡易发性评价大多只采用单一模型进行研究,而单一模型存在缺陷,如只采用信息量模型则不能反映各因子对滑坡发生的权重。通过将两个模型进行耦合分析可以很好地发挥各模型的优点和弥补各模型的不足,从而达到模型优化的目的。针对... 目前,滑坡易发性评价大多只采用单一模型进行研究,而单一模型存在缺陷,如只采用信息量模型则不能反映各因子对滑坡发生的权重。通过将两个模型进行耦合分析可以很好地发挥各模型的优点和弥补各模型的不足,从而达到模型优化的目的。针对滑坡易发性常用的信息量模型和逻辑回归模型,提出信息量-逻辑回归耦合模型。以江西省宁都地区为例,获取研究区共297个滑坡,提取高程、坡向、坡度、平面曲率、剖面曲率、地形起伏度、距水系距离、岩性、植被覆盖率、地表建筑物指数共10个因子建立评价指标体系,再分别采用上述3个模型开展易发性评价,最后采用预测率曲线(the prediction rate curve,ROC)评价各模型精度。结果表明:信息量模型、逻辑回归模型和信息量-逻辑回归耦合模型预测率曲线与坐标轴围成的面积(area under ROC,AUC)值分别为0.838、0.864和0.876,可见信息量-逻辑回归耦合模型的评价精度更高,建模更为合理。研究区内滑坡主要沿水系两侧分布,高程和岩性对滑坡的发生起主要作用。 展开更多
关键词 滑坡易发性评价 信息量模型 逻辑回归模型 信息量-逻辑回归耦合模型
下载PDF
基于信息量-逻辑回归模型的泥石流易发性评价——以四川省石棉县为例 被引量:8
8
作者 于淼 邢会歌 胡士瑜 《人民长江》 北大核心 2021年第12期107-114,共8页
泥石流是中国西南地区常见的地质灾害,通常会造成巨大破坏和人员伤亡,泥石流易发性评价可以为地区防灾减灾及工程选址规划提供理论依据。以四川省石棉县为研究区,获取该县288个历史泥石流作为泥石流数据集,选取高程、坡度、坡向、水系... 泥石流是中国西南地区常见的地质灾害,通常会造成巨大破坏和人员伤亡,泥石流易发性评价可以为地区防灾减灾及工程选址规划提供理论依据。以四川省石棉县为研究区,获取该县288个历史泥石流作为泥石流数据集,选取高程、坡度、坡向、水系密度、地层岩性等13个评价因子,使用信息量模型、逻辑回归模型和信息量-逻辑回归耦合模型对石棉县进行泥石流易发性评价,并利用受试者工作特征曲线(ROC)对模型进行对比和评估。结果表明:四川省石棉县泥石流高易发区集中分布在该县纵向中部地区,多处于河流、道路及断层附近;信息量模型、逻辑回归模型和信息量-逻辑回归耦合模型的ROC曲线下面积(AUC)分别为0.917,0.928和0.931,可见耦合模型的精度最高,分区结果更加合理可靠。因此,信息量-逻辑回归耦合模型在泥石流易发性评价上具有优越性,其分区结果对泥石流防治具有实践意义。 展开更多
关键词 泥石流 易发性评价 信息量模型 逻辑回归模型 信息量-逻辑回归耦合模型 ROC曲线
下载PDF
基于随机森林模型的山体滑坡空间预测研究 被引量:25
9
作者 余坤勇 姚雄 +1 位作者 邱祈荣 刘健 《农业机械学报》 EI CAS CSCD 北大核心 2016年第10期338-345,共8页
滑坡灾害空间分布的准确预测是实现防灾减灾的重要途径。以2010年福建省顺昌地区滑坡资料为基础数据,分别应用随机森林模型和逻辑回归模型对福建顺昌地区山体滑坡发生与滑坡因子之间的关系进行实证分析,通过模型变量筛选、模型精度分析... 滑坡灾害空间分布的准确预测是实现防灾减灾的重要途径。以2010年福建省顺昌地区滑坡资料为基础数据,分别应用随机森林模型和逻辑回归模型对福建顺昌地区山体滑坡发生与滑坡因子之间的关系进行实证分析,通过模型变量筛选、模型精度分析,探讨了随机森林模型在我国南方山体滑坡空间预测中的适应性。结果表明:随机森林模型对滑坡发生数据的拟合效果比逻辑回归模型好,其对顺昌地区滑坡发生数据的预测精度为90.8%,而逻辑回归模型的预测精度为81.8%;随机森林模型对研究区滑坡发生的泛化能力比逻辑回归模型好,其预测出高危险区和较高危险区所包含的滑坡比总和为66.05%,而逻辑回归模型为63.34%。研究结果表明随机森林模型的性能优于逻辑回归模型,可用于顺昌地区基于滑坡因子的未来滑坡发生的预测预报。 展开更多
关键词 山体滑坡 随机森林模型 逻辑回归模型 空间预测
下载PDF
基于模型融合的上市公司财务造假的预测
10
作者 仪梦 吴丽丽 《电子商务评论》 2024年第2期1991-2006,共16页
我国上市公司财务报告造假的问题一直伴随着市场的发展。针对此问题,构造了基于分类模型的上市公司财务造假的预测研究。通过数据的预处理和机器学习算法模型,以及统计学的一些方法,建立了一套完整的分析预测模型。首先按照行业分为大类... 我国上市公司财务报告造假的问题一直伴随着市场的发展。针对此问题,构造了基于分类模型的上市公司财务造假的预测研究。通过数据的预处理和机器学习算法模型,以及统计学的一些方法,建立了一套完整的分析预测模型。首先按照行业分为大类,将年数据中缺失率达到50%以上的指标剔除,剩下缺失的数据选用0来填充。对于日数据提取每股指标,并按年进行均值化,将均值化后的日数据整合为年数据并且提取出特征因子,最终通过降维的思想筛选出对上市财务造假有较大影响的因子。通过确定的因子,将特征因子初步处理,并且进行标准化,通过使用三大类特征选择的方法,使系统的特定指标进一步优化,接着用主成分降维,正则化特征提取,最终用决策树分类模型、线性判别模型、梯度提升分类模型、支持向量机模型四种分类模型进行分类预测。 展开更多
关键词 财务造假 随机森林 组合决策树 逻辑回归模型 曲线下面积
下载PDF
四川省滑坡灾害危险性评价模型比较研究
11
作者 刘亚彬 刘云腾 +3 位作者 朱真梅 刘志红 范智高 史红人 《成都信息工程大学学报》 2024年第1期101-107,共7页
为探讨四川省滑坡灾害分布状况及对滑坡灾害危险性评价建模效果进行比较,以四川省为研究区,分析地质灾害尤其是滑坡灾害的时空分布,运用信息量法、基于信息量的逻辑回归法、随机森林法3种方法,取坡度、植被覆盖率、地震烈度、断层密度... 为探讨四川省滑坡灾害分布状况及对滑坡灾害危险性评价建模效果进行比较,以四川省为研究区,分析地质灾害尤其是滑坡灾害的时空分布,运用信息量法、基于信息量的逻辑回归法、随机森林法3种方法,取坡度、植被覆盖率、地震烈度、断层密度及年累计降雨量5个因子建立危险性评价模型,结合ROC曲线和AUC值对模型性能进行精度比较。研究结果表明:(1)坡度因子对滑坡灾害的贡献最大,3种评价模型中坡度、地震烈度及降雨3个因子均有较大贡献。(2)滑坡灾害主要分布于地震带附近,在成都平原处灾害发生几率最小。(3)3种评价方法均适用于滑坡危险性区划工作,具有良好的建模效果。相对于其他两种模型,逻辑回归模型在实际情况下更加适合四川省滑坡灾害的危险性评价工作。 展开更多
关键词 滑坡灾害 信息量方法 随机森林方法 逻辑回归方法 模型评价
下载PDF
基于LR-RF模型的滑坡易发性评价——以铜川市耀州区为例 被引量:12
12
作者 穆柯 谢婉丽 +5 位作者 刘琦琦 严明 杨惠 李嘉昊 黄煜 朱荣森 《灾害学》 CSCD 北大核心 2022年第3期212-218,共7页
耀州区是陕西省重要的交通枢纽与矿业基地,长期对资源的开发导致滑坡灾害频繁发生,如何对滑坡的易发性进行科学合理地划分是滑坡防治与管理工作的重要组成部分。以耀州区为研究区,基于R语言与ArcGIS平台,选取坡度等8个评价因子,在逻辑回... 耀州区是陕西省重要的交通枢纽与矿业基地,长期对资源的开发导致滑坡灾害频繁发生,如何对滑坡的易发性进行科学合理地划分是滑坡防治与管理工作的重要组成部分。以耀州区为研究区,基于R语言与ArcGIS平台,选取坡度等8个评价因子,在逻辑回归(Logistic Regression,简称LR)的基础上引入随机森林(Random Forest,简称RF)模型对研究区发生滑坡的概率进行预测,完成滑坡易发性评价和分区。LR-RF模型易发性分区结果表明滑坡高、较高易发区覆盖了研究区东南部的漆水河河谷区域,包含了73.23%的滑坡点,在预测成功率上高于LR模型。使用ROC曲线对LR和LR-RF模型的结果精度进行对比,LR-RF模型评价结果的AUC值为0.9123,优于LR模型的评价结果。研究结果表明采用LR-RF模型对研究区进行易发性评价拥有更好的评价精度和预测能力。 展开更多
关键词 易发性评价 逻辑回归模型 随机森林模型 逻辑回归-随机森林耦合模型 受试者特征曲线
下载PDF
大别山区宜居-宜业-宜商城市建设水平测度及时空分异 被引量:1
13
作者 程启先 张旭 +1 位作者 王子羽 郭浩 《南阳师范学院学报》 CAS 2023年第6期10-17,共8页
以大别山区为研究区域,运用指数变换法、熵权TOPSIS法、耦合协调模型以及随机森林回归模型对区域内宜居-宜业-宜商城市建设水平测度及其时空分异进行实证研究。结果表明:研究时段内各地市的宜居性、宜业性和宜商性评价值均呈现增长趋势... 以大别山区为研究区域,运用指数变换法、熵权TOPSIS法、耦合协调模型以及随机森林回归模型对区域内宜居-宜业-宜商城市建设水平测度及其时空分异进行实证研究。结果表明:研究时段内各地市的宜居性、宜业性和宜商性评价值均呈现增长趋势;宜居-宜业-宜商城市协调度的发展趋势稳步增长,省域和市域的地域分异、时空演化趋势也较为显著;随机森林分析结果表明主要指标为经济密度(地均GDP)、人均财政支出和批发零售业商品销售总额。 展开更多
关键词 宜居-宜业-宜商城市 熵权TOPSIS法 耦合协调模型 随机森林回归模型 大别山区
下载PDF
浙江省高技术产业与经济社会协调发展影响因素研究
14
作者 姚笑秋 《统计科学与实践》 2024年第6期14-17,共4页
本文利用耦合协调模型对浙江省高技术产业与经济社会的耦合协调发展水平进行测算,并利用随机森林回归法分析探究影响高技术产业和经济社会协调发展的影响因素。研究发现:从综合发展水平看,2015年之前经济社会综合发展水平略高于高技术产... 本文利用耦合协调模型对浙江省高技术产业与经济社会的耦合协调发展水平进行测算,并利用随机森林回归法分析探究影响高技术产业和经济社会协调发展的影响因素。研究发现:从综合发展水平看,2015年之前经济社会综合发展水平略高于高技术产业,2015年之后高技术产业发展势头强劲;协调发展方面,1995—2004年高技术产业和经济社会发展处于失调状态,2005—2020年从勉强协调状态发展到了良好协调状态,2021年以后,两者处于优质协调状态;影响因素方面,人力资本和物质资本是影响高技术产业和经济社会协调发展的核心因素。 展开更多
关键词 高技术产业 协调发展 耦合协调模型 随机森林回归
下载PDF
基于脉搏波特征的吸毒人员甄别模型的研究
15
作者 顾海艳 王权 袁明 《东南大学学报(医学版)》 CAS 2019年第3期485-489,共5页
目的:为实现基于脉搏波的吸毒人员的快速甄别,对脉搏波甄别模型的构建进行研究。方法:应用采集、筛选的102例吸毒人员样本和138例非吸毒人员样本构建样本库,对从脉搏波中提取的数据进行分析,选择年龄、性别及slopeU、PWTT、AWX、WaveWid... 目的:为实现基于脉搏波的吸毒人员的快速甄别,对脉搏波甄别模型的构建进行研究。方法:应用采集、筛选的102例吸毒人员样本和138例非吸毒人员样本构建样本库,对从脉搏波中提取的数据进行分析,选择年龄、性别及slopeU、PWTT、AWX、WaveWidth6项作为模型特征,分别建立逻辑回归模型、支持向量机模型、随机森林模型。结果:逻辑回归模型、支持向量机模型、随机森林模型都可以较好地实现吸毒人员的甄别,其中随机森林模型性能相对更好。结论:通过采集脉搏波信息,运用数据挖掘技术,可以实现吸毒人员的甄别,今后可通过扩大样本容量、完善甄别模型,提高其应用可靠性。 展开更多
关键词 吸毒人员 脉搏波 甄别模型 逻辑回归 支持向量机 随机森林
下载PDF
冠心病风险因素识别及其预测模型构建 被引量:10
16
作者 李婕 向菲 《中华医学图书情报杂志》 CAS 2020年第6期7-13,共7页
目的:利用逻辑回归分析识别冠心病发作的危险因素,使用常见机器学习算法构建冠心病风险预测模型,为冠心病的早期预防与筛查提供理论参考。方法:通过对Kaggle发布的冠心病数据进行预处理和特征筛选后进行逻辑回归分析识别主要危险因素,... 目的:利用逻辑回归分析识别冠心病发作的危险因素,使用常见机器学习算法构建冠心病风险预测模型,为冠心病的早期预防与筛查提供理论参考。方法:通过对Kaggle发布的冠心病数据进行预处理和特征筛选后进行逻辑回归分析识别主要危险因素,选用逻辑回归、支持向量机、线性判别分析、决策树和随机森林5种常见机器学习算法进行冠心病发病预测。结果:性别、年龄、平均每日吸烟量、总胆固醇水平、收缩压和血糖水平是10年内冠心病发作的主要危险因素;选用的5种机器学习算法准确率与稳定性良好;与基于统计的线性判别分析相比,决策树与随机森林并未表现出明显的优越性。结论:机器学习技术适用于冠心病发作风险的预测,能够为冠心病的防控提供参考依据。 展开更多
关键词 冠心病 风险预测模型 多因素逻辑回归分析 机器学习 随机森林
下载PDF
基于模型融合的互联网信贷信用风险预测研究 被引量:4
17
作者 费鸿雁 黄浩 《统计学与应用》 2019年第5期823-834,共12页
互联网信贷信用风险的预测是互联网金融可持续发展的关键因素,在放贷前准确预估借款人的信用风险,能有效较低企业可能的风险损失。随着机器学习的发展,机器学习的算法模型在互联网信贷信用风险方面的应用也越来越多。为了探究树模型和... 互联网信贷信用风险的预测是互联网金融可持续发展的关键因素,在放贷前准确预估借款人的信用风险,能有效较低企业可能的风险损失。随着机器学习的发展,机器学习的算法模型在互联网信贷信用风险方面的应用也越来越多。为了探究树模型和线性模型融合在互联网信贷信用风险预测的效果,本文采用Stacking模型融合方法设计了信用风险预测模型,其中第一层模型为随机森林、XGBoost、LightGBM,第二层模型为逻辑回归。并且在拍拍贷的真实数据上进行实验,对比了融合后的模型和单模型在AUC、准确率和耗时上的表现,结果表明融合后的模型虽然耗时长一些,但是在AUC和准确率方面都比单模型的效果要好,为互联网金融信贷风险预测模型的构建提供了一个新的思路。 展开更多
关键词 逻辑回归 信用风险 随机森林 XGBoost模型 LightGBM模型
下载PDF
多域识别构建监督学习模型检测网页暗链 被引量:2
18
作者 孟雷 《信息安全与通信保密》 2019年第10期63-71,共9页
网页被植入暗链是企事业网站上常见的攻击行为,攻击手法变化多样,传统方法基于规则检测已经无法高效检出。本文使用域识别机制提取风险文本和安全文本,通过LDA模型和Doc2vec模型计算主题异样度、风险文本异常概率、风险文本向量等特征,... 网页被植入暗链是企事业网站上常见的攻击行为,攻击手法变化多样,传统方法基于规则检测已经无法高效检出。本文使用域识别机制提取风险文本和安全文本,通过LDA模型和Doc2vec模型计算主题异样度、风险文本异常概率、风险文本向量等特征,分别选用SVM模型、逻辑回归模型、随机森林模型构建监督学习模型检测网页暗链并对比模型效果。实验结果表明,该方法具有较好的检出效果和运行效率,其中随机森林模型检出准确率达到了0.999。 展开更多
关键词 多域识别 LDA SVM 逻辑回归模型 随机森林模型 暗链
下载PDF
自动代客泊车接受度及停车选择行为影响因素分析 被引量:1
19
作者 赵传林 靳思缘 +1 位作者 武海娟 丁力 《科学技术与工程》 北大核心 2023年第35期15259-15268,共10页
自动代客泊车是无人驾驶系统的重要组成部分,对于缓解城市交通拥堵具有重要作用。为了探讨自动代客泊车接受度及选择行为影响因素,首先基于技术接受模型,选取感知易用性、感知有用性、行为态度、行为意向、感知风险、信任六个心理潜变... 自动代客泊车是无人驾驶系统的重要组成部分,对于缓解城市交通拥堵具有重要作用。为了探讨自动代客泊车接受度及选择行为影响因素,首先基于技术接受模型,选取感知易用性、感知有用性、行为态度、行为意向、感知风险、信任六个心理潜变量构建自动代客泊车结构方程模型。随后基于线上调查问卷数据,采用随机森林算法构建考虑心理潜变量模型与不考虑心理潜变量模型,研究发现考虑心理潜变量的随机森林模型拟合优度更高,更适合用于分析自动代客泊车选择行为的影响因素。通过袋外估算误差率对考虑心理潜变量的随机森林模型进行变量筛选,结果表明当变量个数为9时,该模型的袋外估算误差率最小,筛选后的变量分别为停车费用、受教育程度、感知风险、出行总成本、行为意向、信任、月收入水平、感知易用性、年龄。最后将筛选后的9个变量纳入逻辑回归中进一步分析各变量对选择行为的影响程度,参数标定结果表明停车费用、受教育程度、感知风险、出行总成本、行为意向、信任、月收入水平、年龄变量均对选择行为具有显著影响。 展开更多
关键词 自动代客泊车 结构方程模型 接受度 停车选择行为 随机森林 逻辑回归
下载PDF
应用数据挖掘技术构建无机钙磷制剂相容性效应面预测模型
20
作者 解根育 杨丝露 +1 位作者 田绍武 徐帆 《中国医院药学杂志》 CAS 北大核心 2024年第6期714-719,共6页
目的:为安全合理使用无机钙、磷制剂组方肠外营养液,有效评判肠外营养处方中是否存在产生钙磷沉淀的风险,提供实验室数据及预测计算模型支持。方法:应用自研动态法微粒监测装置对无机钙、磷浓度、温度、pH值、复方氨基酸种类及浓度、葡... 目的:为安全合理使用无机钙、磷制剂组方肠外营养液,有效评判肠外营养处方中是否存在产生钙磷沉淀的风险,提供实验室数据及预测计算模型支持。方法:应用自研动态法微粒监测装置对无机钙、磷浓度、温度、pH值、复方氨基酸种类及浓度、葡萄糖浓度7个影响因素全部水平相互组合实验,并运用R软件建立逻辑回归、随机森林算法和支持向量机3种肠外营养液中无机钙磷制剂相容性效应面预测模型,对比评价3种算法,优选模型并验证拟合度。结果:(1)实验共获取14 400组有效数据集。(2)通过对3种模型的评价对比,随机森林算法构建的肠外营养液中无机钙磷制剂相容性效应面模型准确率最高、预测效果最好。(3)基于随机森林算法的模型分析显示钙浓度、磷浓度、pH值、温度、葡萄糖浓度与无机钙磷沉淀的产生呈正相关,其中钙浓度对沉淀的产生影响最大,2类复方氨基酸的浓度与无机钙磷沉淀的产生呈负相关。(4)基于随机森林算法构建的效应面模型进行实验分析验证,预测结果与实验结果拟合度高。结论:该研究应用现代分析技术研发了可动态监测无机钙磷制剂配伍后沉淀产生的装置,并构建了肠外营养液中无机钙磷制剂相容性效应面模型。应用该模型,输入相应参数,便可预测出该配方组合是否会有无机钙磷沉淀产生,为临床医务人员安全合理开具肠外营养处方提供实验室依据及计算模型支持。 展开更多
关键词 肠外营养液 无机钙磷沉淀 逻辑回归 随机森林算法 支持向量机 效应面 效应面模型
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部