期刊文献+
共找到286篇文章
< 1 2 15 >
每页显示 20 50 100
Machine learning prediction of methane,ethane,and propane solubility in pure water and electrolyte solutions:Implications for stray gas migration modeling
1
作者 Ghazal Kooti Reza Taherdangkoo +4 位作者 Chaofan Chen Nikita Sergeev Faramarz Doulati Ardejani Tao Meng Christoph Butscher 《Acta Geochimica》 EI CAS CSCD 2024年第5期971-984,共14页
Hydraulic fracturing is an effective technology for hydrocarbon extraction from unconventional shale and tight gas reservoirs.A potential risk of hydraulic fracturing is the upward migration of stray gas from the deep... Hydraulic fracturing is an effective technology for hydrocarbon extraction from unconventional shale and tight gas reservoirs.A potential risk of hydraulic fracturing is the upward migration of stray gas from the deep subsurface to shallow aquifers.The stray gas can dissolve in groundwater leading to chemical and biological reactions,which could negatively affect groundwater quality and contribute to atmospheric emissions.The knowledge oflight hydrocarbon solubility in the aqueous environment is essential for the numerical modelling offlow and transport in the subsurface.Herein,we compiled a database containing 2129experimental data of methane,ethane,and propane solubility in pure water and various electrolyte solutions over wide ranges of operating temperature and pressure.Two machine learning algorithms,namely regression tree(RT)and boosted regression tree(BRT)tuned with a Bayesian optimization algorithm(BO)were employed to determine the solubility of gases.The predictions were compared with the experimental data as well as four well-established thermodynamic models.Our analysis shows that the BRT-BO is sufficiently accurate,and the predicted values agree well with those obtained from the thermodynamic models.The coefficient of determination(R2)between experimental and predicted values is 0.99 and the mean squared error(MSE)is 9.97×10^(-8).The leverage statistical approach further confirmed the validity of the model developed. 展开更多
关键词 Gas solubility Hydraulic fracturing Thermodynamic models regression tree Boosted regression tree Groundwater contamination
下载PDF
Using Boosted Regression Trees and Remotely Sensed Data to Drive Decision-Making
2
作者 Brigitte Colin Samuel Clifford +2 位作者 Paul Wu Samuel Rathmanner Kerrie Mengersen 《Open Journal of Statistics》 2017年第5期859-875,共17页
Challenges in Big Data analysis arise due to the way the data are recorded, maintained, processed and stored. We demonstrate that a hierarchical, multivariate, statistical machine learning algorithm, namely Boosted Re... Challenges in Big Data analysis arise due to the way the data are recorded, maintained, processed and stored. We demonstrate that a hierarchical, multivariate, statistical machine learning algorithm, namely Boosted Regression Tree (BRT) can address Big Data challenges to drive decision making. The challenge of this study is lack of interoperability since the data, a collection of GIS shapefiles, remotely sensed imagery, and aggregated and interpolated spatio-temporal information, are stored in monolithic hardware components. For the modelling process, it was necessary to create one common input file. By merging the data sources together, a structured but noisy input file, showing inconsistencies and redundancies, was created. Here, it is shown that BRT can process different data granularities, heterogeneous data and missingness. In particular, BRT has the advantage of dealing with missing data by default by allowing a split on whether or not a value is missing as well as what the value is. Most importantly, the BRT offers a wide range of possibilities regarding the interpretation of results and variable selection is automatically performed by considering how frequently a variable is used to define a split in the tree. A comparison with two similar regression models (Random Forests and Least Absolute Shrinkage and Selection Operator, LASSO) shows that BRT outperforms these in this instance. BRT can also be a starting point for sophisticated hierarchical modelling in real world scenarios. For example, a single or ensemble approach of BRT could be tested with existing models in order to improve results for a wide range of data-driven decisions and applications. 展开更多
关键词 Boosted regression trees Remotely Sensed DATA BIG DATA modelLING Approach MISSING DATA
下载PDF
A Recursive Binary Tree Model for the Analysis of the Response to Antiretroviral Therapy of HIV Infected Adults in Burkina Faso
3
作者 Simon Tiendrébéogo Séni Kouanda +1 位作者 Blaise Somé Simplice Dossou-Gbeté 《Open Journal of Statistics》 2019年第6期643-656,共14页
In this paper we aim to analyse temporal variation of CD4 cell counts for HIV-infected individuals under antiretroviral therapy by using statistical methods. This is achieved by resorting to recursive binary regressio... In this paper we aim to analyse temporal variation of CD4 cell counts for HIV-infected individuals under antiretroviral therapy by using statistical methods. This is achieved by resorting to recursive binary regression tree approach [1]?[2]. This approach has made it possible to highlight the existence of several segments of the population of interest described by the interactions between the predictive covariates of the response to the treatment regimen. 展开更多
关键词 model-Based CONDITIONAL regression tree CD4 Cell COUNT Prediction Linear Mixed model Stability ANALYSIS ANTIRETROVIRAL Therapy
下载PDF
Building a Tree Adjusted Logistic Classification Model in Biomarker Data Analyses
4
作者 Dion Chen 《Journal of Mathematics and System Science》 2014年第6期433-438,共6页
Researchers in bioinformatics, biostatistics and other related fields seek biomarkers for many purposes, including risk assessment, disease diagnosis and prognosis, which can be formulated as a patient classification.... Researchers in bioinformatics, biostatistics and other related fields seek biomarkers for many purposes, including risk assessment, disease diagnosis and prognosis, which can be formulated as a patient classification. In this paper, a new method of using a tree regression to improve logistic classification model is introduced in biomarker data analysis. The numerical results show that the linear logistic model can be significantly improved by a tree regression on the residuals. Although the classification problem of binary responses is discussed in this research, the idea is easy to extend to the classification of multinomial responses. 展开更多
关键词 BIOINFORMATICS BIOMARKER tree regression logistic model CLASSIFICATION
下载PDF
Modelling the dead fuel moisture content in a grassland of Ergun City,China
5
作者 CHANG Chang CHANG Yu +1 位作者 GUO Meng HU Yuanman 《Journal of Arid Land》 SCIE CSCD 2023年第6期710-723,共14页
The dead fuel moisture content(DFMC)is the key driver leading to fire occurrence.Accurately estimating the DFMC could help identify locations facing fire risks,prioritise areas for fire monitoring,and facilitate timel... The dead fuel moisture content(DFMC)is the key driver leading to fire occurrence.Accurately estimating the DFMC could help identify locations facing fire risks,prioritise areas for fire monitoring,and facilitate timely deployment of fire-suppression resources.In this study,the DFMC and environmental variables,including air temperature,relative humidity,wind speed,solar radiation,rainfall,atmospheric pressure,soil temperature,and soil humidity,were simultaneously measured in a grassland of Ergun City,Inner Mongolia Autonomous Region of China in 2021.We chose three regression models,i.e.,random forest(RF)model,extreme gradient boosting(XGB)model,and boosted regression tree(BRT)model,to model the seasonal DFMC according to the data collected.To ensure accuracy,we added time-lag variables of 3 d to the models.The results showed that the RF model had the best fitting effect with an R2value of 0.847 and a prediction accuracy with a mean absolute error score of 4.764%among the three models.The accuracies of the models in spring and autumn were higher than those in the other two seasons.In addition,different seasons had different key influencing factors,and the degree of influence of these factors on the DFMC changed with time lags.Moreover,time-lag variables within 44 h clearly improved the fitting effect and prediction accuracy,indicating that environmental conditions within approximately 48 h greatly influence the DFMC.This study highlights the importance of considering 48 h time-lagged variables when predicting the DFMC of grassland fuels and mapping grassland fire risks based on the DFMC to help locate high-priority areas for grassland fire monitoring and prevention. 展开更多
关键词 dead fuel moisture content(DFMC) random forest(RF)model extreme gradient boosting(XGB)model boosted regression tree(BRT)model GRASSLAND Ergun City
下载PDF
决策树和Logistic回归模型对体外受精-胚胎移植患者妊娠结局的预测价值比较
6
作者 李娜 苗聪秀 +2 位作者 苗卉 李丹 李敏 《暨南大学学报(自然科学与医学版)》 CAS 北大核心 2024年第5期493-501,共9页
目的:比较决策树和Logistic回归模型对体外受精-胚胎移植(in vitro fertilization and embryo transfer,IVF-ET)患者妊娠结局的预测价值。方法:纳入2021年1月至2022年10月在长治医学院附属和平医院接受IVF-ET的患者350例为研究对象,根... 目的:比较决策树和Logistic回归模型对体外受精-胚胎移植(in vitro fertilization and embryo transfer,IVF-ET)患者妊娠结局的预测价值。方法:纳入2021年1月至2022年10月在长治医学院附属和平医院接受IVF-ET的患者350例为研究对象,根据妊娠结局分为妊娠成功组(215例)和妊娠失败组(135例)。收集患者临床资料,建立IVF-ET患者妊娠结局Logistic回归和决策树预测模型,并在是否基于Logistic回归结果条件下建立决策树分析模型(决策树1和决策树2),采用受试者工作特征(receiver operating characteristic,ROC)曲线对模型预测效果进行评价。结果:350例患者中,妊娠成功患者占61.43%,妊娠失败者占38.57%。妊娠失败组年龄≥35岁、不孕年限≥5年、周期次数≥1次、有心理精神障碍的患者比例及HCG日血清孕酮水平均高于妊娠成功组,获卵数≥10枚、受精率≥75%的患者比例及HCG日子宫内膜厚度、优质胚胎数小于妊娠成功组(P<0.05)。多因素Logistic回归分析结果显示,年龄、HCG日血清孕酮水平、优质胚胎数及心理精神障碍均是IVF-ET患者妊娠结局的影响因素(P<0.05)。决策树模型显示,年龄、HCG日血清孕酮水平、优质胚胎数为IVF-ET患者妊娠结局的影响因素。Logistic回归模型曲线下面积(area under curve,AUC)为0.832,预测敏感度、特异度和准确度分别为87.3%、71.4%、83.5%;决策树1的AUC为0.859,预测敏感度、特异度和准确度分别为85.1%、76.8%、85.6%;决策树2的AUC为0.820,预测敏感度、特异度和准确度分别为83.7%、73.2%、82.4%。决策树1的AUC大于决策树2(P<0.05),但与Logistic回归模型的AUC比较差异无统计学意义(P>0.05)。结论:Logistic回归模型和决策树模型对于IVF-ET患者妊娠结局均有一定的预测价值。 展开更多
关键词 体外受精-胚胎移植 妊娠结局 决策树 LOGISTIC回归模型
下载PDF
基于梯度提升回归树的气井油管积液高度预测
7
作者 向华 夏文龙 +3 位作者 刘波涛 孔梦婷 张玉祥 杨浩波 《长江大学学报(自然科学版)》 2024年第5期94-101,共8页
气井油管积液高度预测是气藏开发的重要环节,更是排水采气不可或缺的一部分。气井开采后期,气井底部会出现积液聚集现象,积液过多会造成气井停产,为了避免停产问题,必须对气井油管积液高度进行预测,但传统石油工程模型预测气井油管积液... 气井油管积液高度预测是气藏开发的重要环节,更是排水采气不可或缺的一部分。气井开采后期,气井底部会出现积液聚集现象,积液过多会造成气井停产,为了避免停产问题,必须对气井油管积液高度进行预测,但传统石油工程模型预测气井油管积液高度,存在着具体计算需要大量经验参数等问题。提出一个基于梯度提升回归树模型预测气井油管积液高度的方法,以气井的套压、油压、油管下深、油层中深、日产气、日产水、井口温度7种生产数据为特征,采用集成学习方法,结合多个决策树的预测结果,以迭代逐步改进的方式来提高模型的整体性能,从而精确预测气井油管积液高度。通过与32口井仪器探测实测值、回归决策树和随机森林对比分析,梯度提升回归树模型预测值与实测值相符,预测效果也最好,平均相对误差仅3.87%,调整后的相关系数R2为0.85。梯度提升回归树模型与现有的油管内积液量和环空积液量预测模型相比较,平均相对误差降低了1.9%。 展开更多
关键词 气井积液 预测模型 机器学习 梯度提升回归树
下载PDF
腰椎间盘突出症病人术后发生恐动症的影响因素
8
作者 李晓红 陈娟娟 《循证护理》 2024年第14期2610-2615,共6页
目的:探讨腰椎间盘突出症(LDH)病人术后发生恐动症的危险因素,并基于Logistic回归模型和决策树模型建立LDH病人术后发生恐动症的风险预测模型。方法:回顾性分析2021年3月—2022年8月在我院行手术治疗的355例LDH病人的临床资料,根据病人... 目的:探讨腰椎间盘突出症(LDH)病人术后发生恐动症的危险因素,并基于Logistic回归模型和决策树模型建立LDH病人术后发生恐动症的风险预测模型。方法:回顾性分析2021年3月—2022年8月在我院行手术治疗的355例LDH病人的临床资料,根据病人术后是否发生恐动症分为恐动症组和非恐动症组,采用多因素Logistic回归分析筛选LDH病人术后发生恐动症的危险因素,运用SPSS Modeler软件建立预测LDH病人术后发生恐动症的决策树模型,并分析模型的预测效能。结果:本研究恐动症发生率为37.46%;恐动症组和非恐动症组病人受教育程度、疼痛视觉模拟评分(VAS)、医院焦虑抑郁量表(HADS)评分、自我效能、家庭人均月收入以及医疗费用支付方式比较,差异有统计学意义(P<0.05)。多因素Logistic回归分析结果显示,受教育程度、VAS评分、HADS评分、自我效能、家庭人均月收入以及医疗费用支付方式均为LDH病人术后发生恐动症的独立危险因素(P<0.05)。决策树结果显示,自我效能是LDH病人术后发生恐动症的主要危险因素,其次为医疗费用支付方式、VAS评分、HADS评分以及家庭人均月收入;受试者工作特征曲线(ROC)显示,决策树模型的预测能力高于多因素Logistic回归分析(P<0.05)。结论:受教育程度、VAS评分、HADS评分、自我效能、家庭人均月收入以及医疗费用支付方式为LDH病人术后发生恐动症的独立危险因素,医务人员可结合上述模型从不同层面发现LDH病人术后发生恐动症的影响因素,有助于评估病人病情,及时给予相应的干预指导。 展开更多
关键词 腰椎间盘突出症 恐动症 多因素Logistic回归模型 决策树模型 影响因素
下载PDF
基于混合效应和分位数回归的温带针阔混交林树高与胸径关系研究 被引量:2
9
作者 程雯 武晓昱 +3 位作者 叶尔江·拜克吐尔汉 王娟 赵秀海 张春雨 《北京林业大学学报》 CAS CSCD 北大核心 2024年第2期28-39,共12页
【目的】基于非线性回归和广义模型构建不同分位数回归和混合效应的树高预测方程,并对比分析非线性模型、不同分位点(τ=0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9)模型、广义模型及非线性混合效应模型的拟合效果和预测精度,为研究林分生长... 【目的】基于非线性回归和广义模型构建不同分位数回归和混合效应的树高预测方程,并对比分析非线性模型、不同分位点(τ=0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9)模型、广义模型及非线性混合效应模型的拟合效果和预测精度,为研究林分生长和收获提供理论依据。【方法】本研究以吉林蛟河地区针阔混交林的主要树种(红松、色木槭、紫椴和水曲柳)为研究对象,基于21.12 hm2样地数据,首先在11个广泛使用的树高方程基础模型中选定基础模型;其次探究林分变量对树高的影响并构建含林分变量的广义模型;最后在基础模型和广义模型的基础上,构建分位数模型,同时考虑样方效应对树高的影响,构建混合效应模型。【结果】(1)各树种均以Richards模型拟合精度更高,且具有生物学意义,选定为基础模型;考虑林分变量与树高的相关性以及模型收敛性,加入优势木高建立的广义模型能显著提高拟合效果。(2)各树种均为中位数τ=0.5时模型拟合效果最佳,且与非线性回归预测精度相近,红松、色木槭、紫椴和水曲柳最高R^(2)值分别为0.811、0.809、0.724和0.617,广义中位数回归预测能力得到进一步提高,R^(2)值分别为0.891、0.874、0.858和0.627。(3)混合效应模型相对其他模型能显著提高预测精度,其中基础混合模型略优于广义混合模型,4个树种R^(2)值达到0.937、0.919、0.906和0.643,表明包含样方效应的混合模型能得到更准确更稳定的预测结果。【结论】与传统方法建立的基础模型和广义模型以及两者的中位数回归模型相较,基于非线性混合效应构建的树高-胸径模型预测精度更高,其中基于基础混合效应构建的吉林蛟河地区混交林树高-胸径模型更具优越性和稳定性。 展开更多
关键词 分位数回归 树高-胸径模型 混合效应模型 广义模型 针阔混交林
下载PDF
住院老年患者轻度认知功能障碍风险预测模型的构建 被引量:2
10
作者 吴瑞凯 马龙 +1 位作者 周晓辉 韩正风 《医学新知》 CAS 2024年第1期14-24,共11页
目的 探讨住院老年患者轻度认知功能障碍(mild cognitive impairment,MCI)的影响因素,构建并比较多组MCI相对风险预测模型。方法 采用方便抽样法,选择2023年1月至2023年9月在新疆医科大学第一附属医院老年医学科住院的老年患者,构建Logi... 目的 探讨住院老年患者轻度认知功能障碍(mild cognitive impairment,MCI)的影响因素,构建并比较多组MCI相对风险预测模型。方法 采用方便抽样法,选择2023年1月至2023年9月在新疆医科大学第一附属医院老年医学科住院的老年患者,构建Logistic回归预测模型、决策树预测模型、神经网络预测模型并分析MCI的影响因素,采用受试者工作特征曲线(receiver operating characteristic,ROC)下面积(area under curve,AUC)比较三组预测模型的效能。结果 共纳入住院老年患者992例,MCI检出率为21.17%。多因素Logistic回归模型、决策树模型、神经网络模型分析结果均显示年龄、脑血管病、文化程度为MCI的主要影响因素,多因素Logistic回归模型和神经网络模型还显示日常生活能力也是MCI的影响因素。多因素Logistic回归预测模型预测正确率为89.1%,ROC曲线下面积AUC为0.933[95%CI(0.916,0.950)],灵敏度为0.881,特异度为0.852,约登指数为0.733。决策树预测模型预测正确率为86.1%,AUC为0.908[95%CI(0.888,0.927)],灵敏度为0.919,特异度为0.753,约登指数为0.672。神经网络预测模型预测正确率为88.7%,AUC为0.933[95%CI(0.915,0.950)],灵敏度为0.876,特异度为0.861,约登指数为0.737。三组模型预测结果均>70%,预测效能较好。结论 年龄增加,受教育年限短,患有脑血管病,日常生活能力下降会增加老年患者发生MCI的风险。多因素Logistic回归、决策树、神经网络多组模型可从不同层面挖掘MCI的影响因素,多模型的有效结合能更充分的了解不同因素之间的相互作用,为MCI的早期筛查和干预提供参考。 展开更多
关键词 轻度认知功能障碍 多因素Logistic回归模型 决策树模型 神经网络模型 预测模型 老年人
下载PDF
基于随机森林算法的桉树人工林单木生物量预估模型 被引量:1
11
作者 宋杰 赵俊 +3 位作者 何普林 成雅君 黄润霞 竹万宽 《桉树科技》 2024年第2期11-16,共6页
单木生物量模型是估测森林生物量的基础。通过标准木法实测雷州半岛地区90株桉树单株生物量数据,随机划分60个样本数据作为训练集,30个样本数据作为验证集。以林龄、树高和胸径为自变量,单木生物量为因变量,使用岭回归模型、异速生长模... 单木生物量模型是估测森林生物量的基础。通过标准木法实测雷州半岛地区90株桉树单株生物量数据,随机划分60个样本数据作为训练集,30个样本数据作为验证集。以林龄、树高和胸径为自变量,单木生物量为因变量,使用岭回归模型、异速生长模型和随机森林算法构建模型,采用决定系数(R^(2))、均方根误差(RMSE)和平均绝对误差(MAE)对模型进行评价。结果表明:随机森林模型的R~2、RMSE和MAE无论在训练集还是验证集均高于岭回归模型和异速生长模型。由随机森林模型的因子重要值可知,胸径是影响单木生物量的主要因子。引入林龄因子后的随机森林模型可以提高单木生物量的预测精度,为碳汇计量提供基础数据和模型支撑。 展开更多
关键词 桉树 单木生物量 岭回归模型 异速生长模型 随机森林算法
下载PDF
基于Logistic回归与决策树模型的老年多重慢病及影响因素分析 被引量:2
12
作者 董海颖 梁笑笑 何燕 《中国卫生事业管理》 北大核心 2024年第2期208-211,共4页
目的:应用决策树模型和Logistic回归对老年多重慢病影响因素进行分析,为多重慢病的管理和防控提供依据。方法:采用多阶段分层随机抽样方法于青岛、广州、苏州抽取1273名老年人,进行老年多重慢病的问卷调查,分别建立Logistic回归模型和... 目的:应用决策树模型和Logistic回归对老年多重慢病影响因素进行分析,为多重慢病的管理和防控提供依据。方法:采用多阶段分层随机抽样方法于青岛、广州、苏州抽取1273名老年人,进行老年多重慢病的问卷调查,分别建立Logistic回归模型和决策树模型,分析并比较两种分析方法结果的差异性。结果:Logistic回归结果显示年龄、婚姻状况、医疗保险、吸烟是老年多重慢病的影响因素,其中年龄是保护因素(OR<1)。决策树模型显示医疗保险是老年多重慢病的最主要影响因素,其次是吸烟、年龄和婚姻状况。两种模型分析比较结果显示,Logistic回归模型的灵敏度为74.3%,特异度为55.3%;决策树模型的灵敏度为57.2%,特异度为73.3%。结论:研究显示年龄、婚姻状况、医疗保险、吸烟是老年多重慢病的影响因素。结合运用Logistic回归模型和CHAID模型,可以有效筛选老年多重慢病的危险因素,有助于制定针对性措施,加强管理和防控。 展开更多
关键词 LOGISTIC回归 决策树模型 老年多重慢病 影响因素
下载PDF
3种机器学习算法对维持性血液透析病人衰弱风险预测性能比较 被引量:1
13
作者 汪丹丹 姚侃斐 祝雪花 《护理研究》 北大核心 2024年第1期8-16,共9页
目的:应用Logistic回归、决策树CART和随机森林3种机器学习算法分别构建维持性血液透析病人衰弱风险预测模型,比较3种模型的预测效果。方法:选取2021年10月—2022年3月在杭州市2家三级甲等医院接受维持性血液透析治疗的病人485例,按照7... 目的:应用Logistic回归、决策树CART和随机森林3种机器学习算法分别构建维持性血液透析病人衰弱风险预测模型,比较3种模型的预测效果。方法:选取2021年10月—2022年3月在杭州市2家三级甲等医院接受维持性血液透析治疗的病人485例,按照7∶3的比例随机分为训练集(n=341)和测试集(n=144),运用Logistic回归、决策树CART和随机森林建立维持性血液透析病人衰弱风险预测模型,采用准确率、灵敏度、特异度、阳性预测值、阴性预测值、Kappa系数和受试者工作特征(ROC)曲线下面积(AUC)对3种模型的预测性能进行比较。结果:训练集中,Logistic回归、决策树CART和随机森林的准确率分别为91.79%、91.50%、97.95%,特异度为96.84%、92.11%、96.91%,灵敏度为85.43%、90.73%、99.32%,阳性预测值为95.56%、90.13%、96.05%,阴性预测值为89.32%、92.59%、99.47%,Kappa值为0.832,0.828,0.958,AUC值为0.971,0.954,0.998。对3种模型的AUC值进行检验,结果发现随机森林模型与其余两种模型差异有统计学意义(P<0.05)。年龄、性别、查尔森合并疾病指数和营养风险筛查评分为3种预测模型的共同预测因子。结论:随机森林模型对维持性血液透析病人衰弱风险的预测性能优于Logistic回归和决策树CART。 展开更多
关键词 维持性血液透析 衰弱 预测模型 LOGISTIC回归 决策树 随机森林
下载PDF
中国耕地补充与撂荒的空间关系识别及其失衡归因
14
作者 郭维红 陈浮 +3 位作者 杨斌 蒋非非 马静 朱新华 《中国土地科学》 CSSCI CSCD 北大核心 2024年第7期120-132,共13页
研究目的:探究耕地补充与耕地撂荒的空间匹配关系,为耕地保护和开发提供科学依据。研究方法:遥感监测、空间自相关分析、空间失衡指数、地理探测器和增强回归树模型。研究结果:(1)近20年中国耕地年均补充263.22×10^(4) hm^(2),年... 研究目的:探究耕地补充与耕地撂荒的空间匹配关系,为耕地保护和开发提供科学依据。研究方法:遥感监测、空间自相关分析、空间失衡指数、地理探测器和增强回归树模型。研究结果:(1)近20年中国耕地年均补充263.22×10^(4) hm^(2),年均补充率为1.39%,集中分布于西北、东北和西南地区。耕地年均撂荒226.68×10^(4) hm^(2),年均撂荒率为1.19%,主要分布于黄河中游和西南地区。(2)耕地补充和耕地撂荒之间以轻度失衡和不失衡为主,但极度失衡和重度失衡的单元数量逐年增加。至2020年,中度、重度和极度失衡的单元占16.87%,主要分布在西北、黄河中游、西南和南部沿海地区。(3)高—高集聚和低—低集聚是耕地补充和撂荒失衡的主要空间集聚模式。其中,高—高集聚区集中在西北、黄河中游、西南和南部沿海地区,低—低集聚区集中在东北、长江中游、西南和北部沿海地区。(4)坡度和年平均降水量为耕地补充与撂荒空间失衡主要的自然资源驱动因子,非农从业人数、农业机械总动力是主要的社会经济驱动因子。研究结论:耕地补充和撂荒之间空间失衡具有复杂性且受当地自然条件和经济社会因素的交互影响,未来应基于不同的情景和目标综合确定最优的利用模式,为高质量耕地保护提供科学依据。 展开更多
关键词 耕地补充 耕地撂荒 空间关系 失衡指数 增强回归树模型
下载PDF
石羊河流域生态系统服务相互作用的时空变化及驱动机制研究
15
作者 胡飞鹏 赵军 +2 位作者 孙紫云 刘坚 托瑞 《干旱区地理》 CSCD 北大核心 2024年第10期1755-1766,共12页
了解生态系统服务的时空变化及其内部复杂关系对管理生态系统服务是至关重要的。以石羊河流域为研究区,评估流域2010、2015年和2020年6种生态系统服务,分析栅格和乡镇尺度上生态系统服务权衡协同及生态系统服务簇的时空变化,利用增强回... 了解生态系统服务的时空变化及其内部复杂关系对管理生态系统服务是至关重要的。以石羊河流域为研究区,评估流域2010、2015年和2020年6种生态系统服务,分析栅格和乡镇尺度上生态系统服务权衡协同及生态系统服务簇的时空变化,利用增强回归树模型探讨研究区生态系统服务簇的驱动机制。结果表明:(1)各类服务空间分异明显,产水量、碳储量、土壤保持和生境质量呈“西南高-东北低”的空间格局,粮食供应主要集中于流域中部和北部的耕地区,休闲娱乐高值区分布于流域南部及中部和北部人口密集地区;研究期间内各类服务均有不同程度提高,其中土壤保持的增幅最大,碳储量和生境质量增幅较小。(2) 2个尺度上生态系统服务权衡协同作用呈相似性,但权衡协同作用强度不同,总体上表现为12对协同关系,3对权衡关系。(3) 2个尺度上生态系统服务簇的空间格局相似,流域南部分布除粮食供应外其他5种服务为主的服务簇,流域中部和北部民勤绿洲地区分布与粮食供应和休闲娱乐为主的服务簇,其他地区的生态环境相对恶劣,分布其中的服务簇内各项服务供应较低;研究期间内服务簇存在明显的空间和数量转移变化。(4)多种因素在研究区生态系统服务簇的变化中起着重要作用,影响因子在不同年份的影响程度略不相同,其中土地利用类型、归一化植被指数、年降水量和海拔是生态系统服务簇变化的重要驱动因子。 展开更多
关键词 生态系统服务簇 权衡协同 增强回归树模型 石羊河流域
下载PDF
机器学习对H.pylori感染患者的特征变量及预测模型研究
16
作者 袁一鸣 杜结玲 +2 位作者 洪慧斯 韦翠花 卢苑香 《胃肠病学和肝病学杂志》 CAS 2024年第8期958-965,共8页
目的 分析H.pylori感染患者感染的危险因素,建立H.pylori感染患者预测模型,为防治H.pylori感染提供参考。方法 选取2021年7至2022年5月在中山市中医院、中山市东凤人民医院、中山市南区医院共1 477例接受H.pylori检测者为研究对象,依据... 目的 分析H.pylori感染患者感染的危险因素,建立H.pylori感染患者预测模型,为防治H.pylori感染提供参考。方法 选取2021年7至2022年5月在中山市中医院、中山市东凤人民医院、中山市南区医院共1 477例接受H.pylori检测者为研究对象,依据胃镜和~(14)C、~(13)C呼气试验的检测结果,将H.pylori受检人群分为感染组和无感染组,分别进行问卷调查,调查内容包括受检者基本情况、临床表征、慢性基础病、生活和饮食习惯等,共计63个变量。采用单因素及机器学习中的Logistic回归、决策树分析及添加交互项的Logistic回归对H.pylori感染进行多因素分析,并比较3个模型的ROC曲线下的面积、灵敏度、特异度,验证模型的准确性,建立H.pylori感染预测模型,将特征和危险因素建立森林图。结果 Logistic回归分析的AUC为0.7361,灵敏度为0.7615,特异度为0.6034。决策树分析的AUC为0.6528,灵敏度为0.6801,特异度为0.5773。添加交互项后的Logistic回归分析的AUC为0.7388,灵敏度为0.7588,特异度为0.6034。添加交互项的多因素Logistic回归结果显示,有胃胀,口气、口臭,在家煮食午餐,在家无而外出有使用公筷习惯,同居家人有感染,疫情后才使用公筷,居住4~10层楼,同时有胃胀及口气、口臭为模型的显著性变量。结论 胃胀,有口气、口臭,同时有胃胀及口气、口臭,在家煮食午餐,居住的楼层数,外出居家是否使用公筷,是否有使用公筷习惯,家人是否感染H.pylori是感染H.pylori的特征因素,用Logistic回归模型作为主模型进行变量筛选,添加交互后的模型,AUC有所提升,交互项的预测模型对H.pylori感染者预判能力好,运算容易,使用经济、便利,适合区域性推广。 展开更多
关键词 幽门螺杆菌 二元Logistic回归模型 决策树 森林图 交互项
下载PDF
基于3种机器学习算法构建宫颈癌术后尿潴留风险预测模型
17
作者 陆宇 江会 《护理研究》 北大核心 2024年第1期24-30,共7页
目的:运用决策树、逻辑回归和支持向量机构建宫颈癌根治性切除术后尿潴留风险预测模型并比较性能,为评估及预防宫颈癌术后尿潴留提供参考依据。方法:回顾性收集459例宫颈癌根治性切除术病人的临床资料,采用决策树、支持向量机和逻辑回归... 目的:运用决策树、逻辑回归和支持向量机构建宫颈癌根治性切除术后尿潴留风险预测模型并比较性能,为评估及预防宫颈癌术后尿潴留提供参考依据。方法:回顾性收集459例宫颈癌根治性切除术病人的临床资料,采用决策树、支持向量机和逻辑回归3种机器学习方法构建宫颈癌根治性切除术后尿潴留风险预测模型,采用准确性、召回率、精确率、F1指数和受试者工作特征(ROC)曲线下面积(AUC)评价模型性能。结果:共纳入病人的年龄、疾病分期、体质指数等8个变量。选择80%的数据集(367例)作为训练集,20%的数据集(92例)作为验证集,结果显示,决策树在训练集和验证集中准确率、召回率、精确率、F1指数和AUC都比支持向量机和逻辑回归更优,说明决策树在构建宫颈癌术后尿潴留风险预测模型中具有较高的准确率及较好的泛化性能;支持向量机在训练集中准确率、召回率、精确率、F1指数和AUC都比逻辑回归更优。同时,在验证集中,支持向量机的召回率和F1指数比逻辑回归更优,但是支持向量机的准确率、精确率和AUC却比逻辑回归差,说明支持向量机在宫颈癌术后尿潴留数据集中的泛化能力比逻辑回归差。结论:决策树在构建宫颈癌根治性切除术后尿潴留风险预测模型中具有较高的性能及较好的泛化能力,可为相关临床决策提供指导建议。 展开更多
关键词 宫颈癌 尿潴留 危险因素 机器学习 预测模型 决策树 支持向量机 逻辑回归
下载PDF
中老年慢性肌肉骨骼疼痛患者恐动症的影响因素分析 被引量:1
18
作者 阿依布塔·吾哈甫 董正惠 +1 位作者 韩欣悦 骆朝辉 《现代临床护理》 2024年第3期9-15,共7页
目的调查中老年慢性肌肉骨骼疼痛(chronic musculoskeletal pain,CMP)患者恐动症发生现状,并采用Logistic回归分析模型与决策树模型分析其影响因素。方法于2023年1月—6月采用方便抽样法,选取在新疆乌鲁木齐市某三级甲等骨科专科医院住... 目的调查中老年慢性肌肉骨骼疼痛(chronic musculoskeletal pain,CMP)患者恐动症发生现状,并采用Logistic回归分析模型与决策树模型分析其影响因素。方法于2023年1月—6月采用方便抽样法,选取在新疆乌鲁木齐市某三级甲等骨科专科医院住院的370例中老年CMP患者为调查对象,采用一般情况调查表、恐动症评分表、一般自我效能感量表、医学应对方式问卷、社会支持评定量表进行调查,采用Logistic回归分析模型与决策树模型分析老年CMP患者恐动症的影响因素,并评价两种模型的预测效果。结果352例中老年CMP住院患者完成研究。恐动症发生率为67.3%。Logistic回归分析模型与决策树模型均显示,自我效能感、社会支持是中老年CMP住院患者恐动症发生的影响因素。两种模型分析结果比较显示,Logistic回归分析模型的敏感度(99.2%)、特异度(89.5%),均高于决策树模型(96.6%、87.8%)。Logistic回归分析模型的曲线下面积(area under curve,AUC)为0.971(95%CI:0.952~0.990),标准误为0.010,决策树模型的AUC为0.948(95%CI:0.921~0.974),标准误为0.013,两种模型的预测价值良好。结论中老年CMP住院患者恐动症发生率高,Logistic回归分析模型与决策树模型相结合,能充分挖掘中老年CMP住院患者恐动症影响因素,建议将两种模型联合使用,为中老年CMP住院患者恐动症的评估与干预提供依据。 展开更多
关键词 慢性肌肉骨骼疼痛 恐动症 中老年 Logistic回归分析模型 决策树模型 横断面研究
下载PDF
基于随机森林模型的城市非法营运车辆识别
19
作者 黄子璇 李桥兴 《电子科技》 2024年第1期66-71,共6页
区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC... 区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC数据的有效字段,采用随机森林算法建立非法营运车辆识别分类器,加入CART(Classification and Regression Tree)分类树模型分类器和二元逻辑回归模型分类器与之对比,并以西南某市高速公路自2022年2月6日~2022年3月8日的ETC指标数据进行实证分析。结果表明,随机森林模型分类器比CART分类树模型分类器和二元逻辑回归模型分类器预测效果更好,其准确性高达98.75%。 展开更多
关键词 非法营运车辆 随机森林模型 CART分类树模型 二元逻辑回归模型 分类算法 机器学习 深度学习 识别算法
下载PDF
Predicting plant disease epidemics using boosted regression trees
20
作者 Chun Peng Xingyue Zhang Weiming Wang 《Infectious Disease Modelling》 CSCD 2024年第4期1138-1146,共9页
Plant epidemics are often associated with weather-related variables.It is difficult to identify weather-related predictors for models predicting plant epidemics.In the article by Shah et al.,to predict Fusarium head b... Plant epidemics are often associated with weather-related variables.It is difficult to identify weather-related predictors for models predicting plant epidemics.In the article by Shah et al.,to predict Fusarium head blight(FHB)epidemics of wheat,they explored a functional approach using scalar-on-function regression to model a binary outcome(FHB epidemic or non-epidemic)with respect to weather time series spanning 140 days relative to anthesis.The scalar-on-function models fit the data better than previously described logistic regression models.In this work,given the same dataset and models,we attempt to reproduce the article by Shah et al.using a different approach,boosted regression trees.After fitting,the classification accuracy and model statistics are surprisingly good. 展开更多
关键词 Plant disease epidemics Scalar-on-function model Boosted regression trees
原文传递
上一页 1 2 15 下一页 到第
使用帮助 返回顶部