期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
套索回归模型在中医临床研究数据的统计应用与R语言实践 被引量:1
1
作者 卓于迪 朱陵群 +9 位作者 张立山 戴雁彦 杨晓明 程潞瑶 苑艺 甘叶娜 周询 邬倩颖 郭烨 李多多 《世界中医药》 CAS 2023年第7期1033-1038,共6页
目的:构建简洁且易于解释的模型,为同类研究提高模型预测的准确率提供参考。方法:从国家自然科学基金项目在研课题(81673904)中选取200例肺纤维化合并心力衰竭患者心力衰竭分级与其可能的相关因素,运用套索回归从患者的“性别”“年龄... 目的:构建简洁且易于解释的模型,为同类研究提高模型预测的准确率提供参考。方法:从国家自然科学基金项目在研课题(81673904)中选取200例肺纤维化合并心力衰竭患者心力衰竭分级与其可能的相关因素,运用套索回归从患者的“性别”“年龄”“体质量指数”“收缩压”“舒张压”“血清总胆固醇”“空腹血糖”“舌质颜色”“舌苔颜色”“中医体质”等自变量中筛选特征变量,构建回归模型以探讨其与心力衰竭严重程度之间的关系。结果:剔除高维数据中的混杂因素,筛选特征变量,模型中包含6个特征变量,体质量指数=0.006357091,收缩压=0.219695622,血清总胆固醇=0.229324833,舌色红=0.004216705,苔色薄白=-0.825660057,苔色黄厚=0.356499153。肺纤维化合并心力衰竭出现严重心力衰竭的概率为P=-33.632+0.006×BMI+0.220×SBP+0.229×TC+0.004×是否红舌-0.826×是否薄白苔+0.356×是否黄厚苔。结论:得到的模型可用以解释严重心力衰竭发病的相关因素并推广到总体中进行预测。套索回归模型适用于中医临床研究的高维数据分析,可能具有推广价值。 展开更多
关键词 套索回归 模型 弹性网络 R语言 正则化 中医临床研究 高维数据 降维
下载PDF
套索回归模型在教师评分系统中的应用研究
2
作者 张戈 朱俭 《网络安全技术与应用》 2019年第12期52-54,共3页
本文主要探讨了LI正则化模型和L2正则化模型在大学教师评分系统中的应用.对教师评分已有数据进行分析,建立拟合预测模型,采用岭回归和套索回归两种线性回归方法建模,在此基础上对模型的优化方案进行了深入研究.
关键词 回归 套索回归 过拟合 调整参数
原文传递
纤维肌痛综合征生物标记物的筛选及免疫细胞浸润分析
3
作者 刘雅妮 杨静欢 +5 位作者 陆慧慧 易玉芳 李智翔 欧阳福 吴璟莉 魏兵 《中国组织工程研究》 CAS 北大核心 2025年第5期1091-1100,共10页
背景:纤维肌痛综合征作为常见风湿病,其发病与中枢敏化及免疫异常有关,但具体过程尚未阐明,缺乏特异性诊断标志物,不断探索该病的发病机制具有重要的临床意义。目的:基于加权基因共表达网络分析(WGCNA)等生物信息学方法和机器学习算法... 背景:纤维肌痛综合征作为常见风湿病,其发病与中枢敏化及免疫异常有关,但具体过程尚未阐明,缺乏特异性诊断标志物,不断探索该病的发病机制具有重要的临床意义。目的:基于加权基因共表达网络分析(WGCNA)等生物信息学方法和机器学习算法筛选纤维肌痛综合征潜在的诊断相关标志基因,并分析其免疫细胞浸润特征。方法:对来自基因表达综合数据库(GEO)的纤维肌痛综合征数据集转录谱进行差异分析和WGCNA分析,整合筛选出差异共表达基因,进一步采用机器学习套索回归(LASSO)算法、支持向量机递归特征消除(SVM-RFE)机器学习算法来识别核心生物标志物,并绘制受试者工作特征(ROC)曲线以评估诊断价值。最后,采用单样本基因集富集分析(ssGSEA)和基因集富集分析(GSEA)评估纤维肌痛综合征的免疫细胞浸润情况及通路富集。结果与结论:①对GSE67311数据集按照log2|(FC)|>0,P<0.05的条件进行差异分析后获得8个下调的差异表达基因;进行WGCNA分析后获得正相关性最高(r=0.22,P=0.04)的模块(MEdarkviolet)内含基因497个,负相关性最高(r=-0.41,P=6×10-5)的模块(MEsalmon2)内含基因19个;将差异表达基因与WGCNA的2个高相关性模块基因取交集,获得7个基因。②对上述7个基因进行LASSO回归算法筛选出4个基因,进行SVM-RFE机器学习算法筛选出5个基因,两者取交集后确定了3个核心基因,分别为重组1号染色体开放阅读框150蛋白(germinal center associated signaling and motility like,GCSAML)、整合素β8(Integrin beta-8,ITGB8)和羧肽酶A3(carboxypeptidase A3,CPA3);绘制3个核心基因的ROC曲线下面积分别为0.744,0.739,0.734,提示均具有很好的诊断价值,可作为纤维肌痛综合征的生物标志物。③免疫浸润分析结果显示,与对照组相比纤维肌痛综合征患者记忆B细胞、CD56 bright NK细胞和肥大细胞显著下调(P<0.05),且与上述3个生物标志物显著正相关(P<0.05)。④富集分析结果提示,纤维肌痛综合征的富集途径包括9条,主要与嗅觉传导、神经活性配体-受体相互作用及感染等通路密切相关。⑤上述结果显示,纤维肌痛综合征的发生发展与多基因参与、免疫调节异常及多个通路失调有关,但这些基因与免疫细胞之间的相互作用,以及它们与各通路之间的关系尚需进一步研究。 展开更多
关键词 纤维肌痛综合征 生物信息学 机器学习 免疫浸润 加权基因共表达网络分析 套索回归 支持向量机递归特征消除算法 单样本基因集富集分析 基因集富集分析
下载PDF
基于多基因SNP的LASSO回归模型预测高危人群缺血性脑卒中发生风险的价值
4
作者 田齐 贾海莉 +2 位作者 庞永鹏 赵刚 陈玺龙 《中西医结合心脑血管病杂志》 2023年第11期2077-2082,共6页
目的:探讨基于多基因单核苷酸多态性(SNP)的套索(LASSO)回归模型预测高危人群脑缺血性脑卒中(IS)发生风险的价值。方法:选取2018年7月—2019年12月于我院就诊的存在颈动脉粥样硬化且改良的弗明汉卒中量表评分≥15分的350例病人作为研究... 目的:探讨基于多基因单核苷酸多态性(SNP)的套索(LASSO)回归模型预测高危人群脑缺血性脑卒中(IS)发生风险的价值。方法:选取2018年7月—2019年12月于我院就诊的存在颈动脉粥样硬化且改良的弗明汉卒中量表评分≥15分的350例病人作为研究对象。所有病人均完善实验室及影像学检查,并针对性完善外周血CD137(rs161827)、RNLS(rs10887800)、ALOX5AP(rs4073259)位点基因分型检测。对病人进行24个月的随访,于随访结束后统计随访期间IS发生情况并分组。采用LASSO回归模型、十折交叉验证法获得IS的最佳风险预测因子,并采用Cox回归分析模型建立IS发生的预测模型并分析其效能。结果:共332例病人完成随访,完成随访率为94.86%,其中发生IS病人103例,发生率为31.02%。将332例病人分为IS组(103例)和非IS组(229例),IS组吸烟史、饮酒史、收缩压高于非IS组(P<0.05);IS组病人同型半胱氨酸(Hcy)、血糖(Glu)、总胆固醇(TC)、颈部斑块不稳定占比及合并冠心病占比明显高于非IS组(P<0.05);IS组病人CD137基因(rs161827)CC型占比及等位基因C分布占比、RNLS基因(rs10887800)AA型占比及等位基因A分布频率、ALOX5AP基因(rs4073259)TT型占比及等位基因T分布频率高于非IS组(P<0.05)。LASSO回归分析共筛选出9个风险预测因子;Hcy、Glu、TC、收缩压、饮酒史、颈部斑块不稳定、CD137(rs161827)、RNLS(rs10887800)、ALOX5AP(rs4073259)是IS的影响因素(P<0.05);模型对于IS发生具有较好的预测价值[AUC=0.901,95%CI(0.864,0.936),P<0.05],模型对IS发生预测的敏感度74.75%,特异度为87.55%。结论:基于多基因SNP的LASSO回归模型对高危人群两年内IS发生风险预测具有一定的价值。 展开更多
关键词 缺血性脑卒中 单核苷酸多态性 套索回归模型 风险预测
下载PDF
基于回归方法的学生学习成绩影响因素分析
5
作者 周旭东 马朝珉 刘淇文 《科技创新与应用》 2022年第23期103-106,共4页
该文首先从UCL数据库收集UCL-Math和UCL-Portuguese数据集以及从某大学收集NEAU-stu数据集,然后利用Python对3类数据集分别进行岭回归和套索回归。通过得到的回归系数表,对3类数据集中的学生进行成绩影响因素分析,最后,通过得出的学生... 该文首先从UCL数据库收集UCL-Math和UCL-Portuguese数据集以及从某大学收集NEAU-stu数据集,然后利用Python对3类数据集分别进行岭回归和套索回归。通过得到的回归系数表,对3类数据集中的学生进行成绩影响因素分析,最后,通过得出的学生成绩影响因素结论,对不同数据集下学生的学习生活给出相应的指导建议。 展开更多
关键词 回归 套索回归 成绩 影响因素 数据
下载PDF
血清CD38水平与心力衰竭患者生活质量评估的临床研究
6
作者 端家豪 王茹婷 +5 位作者 冯钦文 黄凯 应杭峰 杨春 朱滨 杨玲 《医学研究杂志》 2024年第3期72-77,共6页
目的 研究心力衰竭患者血清白细胞分化抗原38(CD38)水平的表达情况,并据此构建用于心力衰竭患者活动耐量与生活质量的预测模型。方法 应用酶联免疫吸附试验(enzyme-linked immunosorbent assay, ELISA)检测51例心力衰竭患者(心力衰竭组)... 目的 研究心力衰竭患者血清白细胞分化抗原38(CD38)水平的表达情况,并据此构建用于心力衰竭患者活动耐量与生活质量的预测模型。方法 应用酶联免疫吸附试验(enzyme-linked immunosorbent assay, ELISA)检测51例心力衰竭患者(心力衰竭组)及8例健康受试者(对照组)的血清CD38水平。根据入院后堪萨斯城心肌病调查问卷(Kansas City Cardiomyopathy Questionnaire-12,KCCQ-12)评分的中位数进一步将心力衰竭患者分为低KCCQ-12评分组及高KCCQ-12评分组。通过套索回归(LASSO)筛选预测变量,建立心力衰竭患者活动耐量与生活质量的预测模型。采用受试者工作特征曲线、校准曲线及决策曲线评价模型,自举重采样(bootstrap-resampling)进行模型的内部验证。结果 与对照组比较,心力衰竭组的血清CD38水平明显升高(0.09±0.08ng/ml vs 0.30±0.37ng/ml,P=0.025)。心力衰竭组患者血清CD38水平与白细胞数量的相关性系数为0.253(P=0.073)。高KCCQ-12评分组的血清CD38水平较低KCCQ-12评分组明显升高(0.42±0.49分vs 0.20±0.17分,P=0.035)。通过LASSO筛选预测变量,最终纳入血清CD38水平等8个变量建立用于心力衰竭患者的活动耐量与生活质量的预测模型,该模型的曲线下面积为0.939,具有良好的区分度及校准度。经Bootstrap内部验证(取样次数500次),一致性指数(C-index)为0.918。结论 心力衰竭患者的血清CD38水平显著升高。基于血清CD38水平构建的预测模型有利于协助评估心力衰竭患者的活动耐量与生活质量。 展开更多
关键词 心力衰竭 CD38 生活质量 套索回归 预测模型
下载PDF
深层煤层气直丛井产能影响因素确定新方法
7
作者 黄力 熊先钺 +8 位作者 王峰 孙雄伟 张艺馨 赵龙梅 石石 张稳 赵浩阳 季亮 邓琳 《油气藏评价与开发》 CSCD 北大核心 2024年第6期990-996,共7页
深层煤层气直丛井生产解吸规律、游离气与解吸气的转换时机尚不明确,产能差异的主控因素仍不确定,影响产能的提高。为进一步评价产能主控因素,基于36口直丛井的生产动态参数,结合神经网络预测井底流压,形成了以初期米采气指数为核心,综... 深层煤层气直丛井生产解吸规律、游离气与解吸气的转换时机尚不明确,产能差异的主控因素仍不确定,影响产能的提高。为进一步评价产能主控因素,基于36口直丛井的生产动态参数,结合神经网络预测井底流压,形成了以初期米采气指数为核心,综合多种机器学习算法的产能影响因素评价新方法。结果表明:(1)Beggs&Bill模型和Gray模型对深层煤层气井底流压预测适用性差。单相气体模型随着产水量下降,整体误差变小。采用神经网络方法预测效果较好,与实测相对误差小于10%。(2)采用Kendall’s tau-b(肯德尔相关系数)分析,离散型主控因素为微构造位置,主要位于抬升区正向构造区;其次为裂缝发育程度,以较发育和发育为主。(3)联合套索回归-随机森林-决策树逐步剔除非相关影响因素,确定影响产能的连续型主控因素从大到小排序为:灰分含量、平均施工排量、入地总砂量、见气时返排率、垂厚、声波时差、伽马、平均施工压力、百目砂占比、气测平均值,工程因素对气井产能影响不能忽视。该方法结合多种机器学习算法的优点,操作性强,提高煤层气动态预测精确度,有助于优化压裂设计参数,为提高煤层气压后的产能提供科学依据。 展开更多
关键词 深层煤层气 套索回归-随机森林-决策树 地质-工程因素 相关性分析 产能
下载PDF
基于主成分分析和LS、Lasso对高血压患者脉诊信息特征分析研究 被引量:8
8
作者 薛利媛 汪南玥 +6 位作者 于友华 黄大威 林谦 闪增郁 李同达 陈燕萍 陈岩 《中国中医基础医学杂志》 CAS CSCD 北大核心 2013年第6期660-663,共4页
目的:分析高血压患者的脉诊信息特征。方法:分别采集高血压患者的脉诊信息并与正常人对照进行分析。在对脉诊信息预处理后选取连续多个周期的脉搏波作为研究对象,建立数学模型并获取193个特征参数进行特征分析,分别进行主成分分析和LS、... 目的:分析高血压患者的脉诊信息特征。方法:分别采集高血压患者的脉诊信息并与正常人对照进行分析。在对脉诊信息预处理后选取连续多个周期的脉搏波作为研究对象,建立数学模型并获取193个特征参数进行特征分析,分别进行主成分分析和LS、Lasso分类判决,并获得高血压患者脉诊信息的变化特征。结果:高血压患者的脉诊信息与正常人比较有较明显的差异,主成分分析的判决准确率为81%,7参数的LS回归判决准确率为93%。Lasso识别准确率为82%。其特征参数为时域参数h1和左关与右尺的频域参数中。结论:高血压患者机体的病理变化可以在桡动脉脉诊信息的时域与频域参数中得到体现并在诊脉的不同部位呈现较强的特征性。本研究为中医"独取寸口"的诊脉方法提供了一定的科学依据,并在一定程度上为中医分寸、关、尺不同部位的诊脉方式提供了科学基础。 展开更多
关键词 高血压 脉诊信息 分类判决 主成分分析 最小二乘回归 套索回归
下载PDF
基于转录组异常表达构建结直肠癌特征基因预后风险评分模型 被引量:2
9
作者 包汝娟 陈慧芳 +2 位作者 董宇 叶幼琼 苏冰 《上海交通大学学报(医学版)》 CAS CSCD 北大核心 2021年第3期285-294,共10页
目的·构建结直肠癌(colorectal cancer,CRC)预后风险评分模型,分析不同评分CRC患者间显著差异的肿瘤特征信号通路或生物过程,并预测该模型对其他癌症患者的免疫治疗效果。方法·从公共数据库中收集8个独立的CRC微阵列数据集和2... 目的·构建结直肠癌(colorectal cancer,CRC)预后风险评分模型,分析不同评分CRC患者间显著差异的肿瘤特征信号通路或生物过程,并预测该模型对其他癌症患者的免疫治疗效果。方法·从公共数据库中收集8个独立的CRC微阵列数据集和2个CRC RNA-seq数据集,筛选每个CRC数据集中的差异表达基因(differentially expressed genes,DEGs)。基于数据集共有的DEGs,采用单因素Cox回归模型筛选与不良预后相关的基因,采用套索(LASSO)回归和多因素Cox回归模型构建CRC预后风险评分模型。依据风险评分,将患者分为高风险组和低风险组。使用受试者操作特征曲线的曲线下面积(area under the curve,AUC)和Kaplan-Meier(KM)生存分析对模型性能进行评价。采用多因素Cox回归模型分析风险评分是否为CRC的独立预后因素。利用基因集富集分析(gene set enrichment analysis,GSEA)探究高、低风险组CRC患者在肿瘤特征基因集相关通路中的差异。通过KM生存分析和χ2检验预测其他癌症患者的免疫治疗效果,以评估模型的应用价值。结果·单因素Cox回归分析,从不同数据集共有的DEGs中获得16个与不良预后相关的基因;以此为基础,构建了包含8个特征基因的CRC预后风险评分模型。该模型在训练集(AUC_(max)=0.788)、内外部验证集(AUC均值>0.600)中展现了中等程度的准确性,其低风险组患者的生存率均高于高风险组。多因素Cox回归分析显示,风险评分可作为CRC的独立预后因素。GSEA结果显示,肿瘤特征基因集相关通路在高风险组患者中显著富集。KM生存分析和χ^(2)检验结果显示,低风险组的其他癌症患者具有更高的生存率及更好的免疫治疗效果。结论·成功构建了含8个特征基因的CRC风险评分预后模型,可为改善CRC患者预后、预测其他癌症患者的免疫治疗效果提供参考。 展开更多
关键词 结直肠癌 套索回归 COX回归模型 特征基因 预后模型
下载PDF
同辈补习与青少年的情绪健康和学业表现:“双重威胁”何以发生? 被引量:3
10
作者 李适源 《教育与经济》 CSSCI 北大核心 2023年第4期72-81,共10页
本文基于中国教育追踪调查(CEPS)的两期数据,考察班级同辈补习参与对青少年个体情绪健康和学业表现带来的因果效应。在实证方法上,本文用“双重筛选的套索回归”等机器学习的方法来减少模型设定偏误,以更加稳健地估计出同辈补习的外部... 本文基于中国教育追踪调查(CEPS)的两期数据,考察班级同辈补习参与对青少年个体情绪健康和学业表现带来的因果效应。在实证方法上,本文用“双重筛选的套索回归”等机器学习的方法来减少模型设定偏误,以更加稳健地估计出同辈补习的外部性。研究发现:其一,同辈补习参与对青少年具有情绪健康和学业成绩的双重威胁。伴随班级内同辈补习率的上升,个体的负向情绪将会显著增加,百分位成绩将显著下降。其二,同辈的补习参与通过“情绪传染”和“行为模仿”两条渠道影响青少年的情绪健康。其三,同辈补习率对个体教育结果的双重威胁,不会因个体自身加入或退出补习而得到明显缓解。本研究的现实意涵是,“双减”政策不仅意在实现青少年个体层面的教育减负,而且还可通过对青少年同辈群体的减负,进而为个体减负发挥“乘数效应”。 展开更多
关键词 课外补习 同辈效应 套索回归
下载PDF
超短期热负荷预测在发电机组厂级供热调度的应用 被引量:2
11
作者 齐结红 钱虹 吴文军 《电力系统保护与控制》 EI CSCD 北大核心 2023年第18期117-124,共8页
对于火力发电厂的综合能源应用,存在供热蒸汽调度控制和管道延迟导致的供热蒸汽不能及时满足供热用户需求的问题。根据所延时的时间长度提出采用对供热用户需求的预测值取代实时供热需求值作为供热调度的约束条件,基于Informer建立一个... 对于火力发电厂的综合能源应用,存在供热蒸汽调度控制和管道延迟导致的供热蒸汽不能及时满足供热用户需求的问题。根据所延时的时间长度提出采用对供热用户需求的预测值取代实时供热需求值作为供热调度的约束条件,基于Informer建立一个热负荷多步时序预测模型。构建的Informer模型采用的概率稀疏自注意力机制能够有效获取热负荷时序数据中的信息,并建立热负荷与相关气象因素之间的非线性关系,进而提高热负荷预测精确度。通过实际现场数据验证表明,建立的基于Informer的热负荷多步时序预测模型能够与未来一段时间内的热负荷有很强的拟合度,并满足实际调度控制延迟对热负荷的需求。 展开更多
关键词 套索回归 INFORMER 热负荷流量预测 供热调度
下载PDF
基于机器学习算法筛选鼻咽癌诊断基因标志物的研究 被引量:1
12
作者 王艺任 刘艾艾 +2 位作者 詹翔 罗颜 周平 《实用临床医药杂志》 CAS 2023年第7期6-11,共6页
目的基于最小绝对收缩和选择算子(LASSO)算法与支持向量机递归特征消除(SVM-RFE)算法筛选用于鼻咽癌(NPC)诊断的特征基因标志物。方法从GEO数据库下载基因表达微阵列数据集GSE53819、GSE13597作为训练集,从GTEx数据库、ICGC数据库分别... 目的基于最小绝对收缩和选择算子(LASSO)算法与支持向量机递归特征消除(SVM-RFE)算法筛选用于鼻咽癌(NPC)诊断的特征基因标志物。方法从GEO数据库下载基因表达微阵列数据集GSE53819、GSE13597作为训练集,从GTEx数据库、ICGC数据库分别下载转录组测序数据集GTEx-NPC、ICGC-NPC作为训练集、验证集。通过基因表达差异分析筛选NPC相关差异表达基因(DEGs),再通过LASSO算法和SVM-RFE算法分别筛选3个训练集中的NPC诊断特征基因。结合外部验证集,通过受试者工作特征(ROC)曲线的曲线下面积(AUC)评估特征基因对NPC的诊断效能。结果本研究共筛选出582个NPC相关DEGs,包括156个高表达DEGs和426个低表达DEGs;基于LASSO算法与SVM-RFE算法,GSE53819、GSE13597、GTEx-NPC数据集均筛选出3个关键诊断特征基因HOXA10、AFF3、SHISA3,且GTEx-NPC数据集另有1个特征基因PLAU;ROC曲线分析结果显示,特征基因HOXA10、AFF3、SHISA3、PLAU在各数据集中诊断NPC的AUC均大于0.7,具有良好的诊断效能。结论基于LASSO算法和SVM-RFE算法可筛选出4个潜在的NPC诊断特征基因标志物,且外部验证结果显示这些基因标志物在诊断NPC方面具有良好效能,这为NPC的早期诊断和相关基因的分子机制研究提供了有价值的参考。 展开更多
关键词 鼻咽癌 基因组学 机器学习 生物信息学 支持向量机递归特征消除 套索回归
下载PDF
基于Lasso-Wiener模型的埋地腐蚀管道可靠性评价 被引量:2
13
作者 徐恒元 高翔 +4 位作者 许小勤 李洪明 姬伟强 刘天峰 喻彦民 《油气田地面工程》 2022年第2期68-72,共5页
为研究埋地腐蚀管道的可靠性,通过套索回归算法对影响管道腐蚀的关键因素进行数据提取和降维,建立基于维纳退化模型和加速应力方程的可靠性分析模型,并利用马尔科夫链-蒙特卡洛方法对未知参数进行估值。以某腐蚀管道为例,选取5个因素作... 为研究埋地腐蚀管道的可靠性,通过套索回归算法对影响管道腐蚀的关键因素进行数据提取和降维,建立基于维纳退化模型和加速应力方程的可靠性分析模型,并利用马尔科夫链-蒙特卡洛方法对未知参数进行估值。以某腐蚀管道为例,选取5个因素作为土壤腐蚀代表因素,管道可靠性先保持平稳后急剧减小,可靠度为90%的时长为12.5年,剩余寿命为14.7年,与实际情况相符。该模型是通过产品性能退化过程建立的可靠性模型,具有较好的适应性和准确性,研究结果为小样本数据的利用提供了实际参考。 展开更多
关键词 埋地管道 腐蚀 可靠性 套索回归算法 维纳退化模型
下载PDF
基于密集采样波场重建的三维地震数据鬼波压制
14
作者 张庆淮 王明星 +2 位作者 吴安楚 朱立彬 陈吴金 《石油物探》 CSCD 北大核心 2023年第4期623-632,共10页
海上三维地震数据采集中,地震数据的欠采样问题使得目前大多数的鬼波压制方法的效果受到限制。针对欠采样三维海上地震数据,通过波场外推原稀疏采集的地震波场来重建指定位置的密集地震波场,利用不同位置密集波场,通过回响分离方法求解... 海上三维地震数据采集中,地震数据的欠采样问题使得目前大多数的鬼波压制方法的效果受到限制。针对欠采样三维海上地震数据,通过波场外推原稀疏采集的地震波场来重建指定位置的密集地震波场,利用不同位置密集波场,通过回响分离方法求解水面密集鬼波波场,进而求解原始位置的稀疏鬼波波场来解决鬼波压制问题。该方法能够兼顾三维数据欠采样问题和鬼波压制问题,从三维意义上遵循地震波的传播规律,目标是最小化实际数据与模拟波场之间的差异,解决密集采样波场稀疏外推问题的不确定性,最终达到压制鬼波、改善地震资料品质的目的。理论数据试算和实际数据处理结果表明,基于密集采样波场重建的三维地震数据鬼波压制方法可以很好地解决三维海上地震数据的欠采样问题对鬼波压制效果的影响,从而很好地压制鬼波,改善地震资料波场品质,提高地震资料分辨率。 展开更多
关键词 波场重建 波场外推 回响分离 套索回归 鬼波压制 欠采样问题 提高分辨率
下载PDF
基于影像组学的非小细胞肺癌淋巴结转移预测 被引量:14
15
作者 王超 刘侠 +4 位作者 董迪 臧丽亚 刘再毅 梁长虹 田捷 《自动化学报》 EI CSCD 北大核心 2019年第6期1087-1093,共7页
在非小细胞肺癌的临床诊疗中,淋巴结是否转移对于医生制定手术方案有重要指导意义.但是目前临床上缺乏能够安全准确地预测非小细胞肺癌淋巴结转移的方法.本文应用影像组学方法对肺部CT影像进行定量分析来实现对非小细胞肺癌淋巴结是否... 在非小细胞肺癌的临床诊疗中,淋巴结是否转移对于医生制定手术方案有重要指导意义.但是目前临床上缺乏能够安全准确地预测非小细胞肺癌淋巴结转移的方法.本文应用影像组学方法对肺部CT影像进行定量分析来实现对非小细胞肺癌淋巴结是否转移的预测.从广东省人民医院收集了564例满足分析要求的非小细胞肺癌病例数据,并从每例CT影像中提取了386个定量影像特征,包括肿瘤的三维形状特征,表面纹理特征, Gabor特征以及小波特征:然后利用Lasso logistic regression (LLR)来构造非小细胞肺癌淋巴结转移的影像组学标签(Rad-score),并结合临床信息进行多元分析,构造了诺模图个性化预测模型.其中, LLR淋巴结转移预测模型性能在训练集上AUC为0.710,测试集AUC为0.712:在个性化诺模图上,用所有数据进行预测,得到C-index为0.724 (95%CI:0.678~0.770),在一致性曲线上表现较佳,可为临床决策提供有价值的信息. 展开更多
关键词 影像组学 淋巴结转移 套索逻辑斯特回归 诺模图 一致性曲线
下载PDF
WGCNA联合LASSO-COX方法筛选甲状腺癌预后关键基因及其临床价值分析
16
作者 张澍漾 郭松雪 +3 位作者 项承 支飞虎 谢立江 赵萍 《中国现代医生》 2023年第32期1-5,36,共6页
目的筛选甲状腺癌(thyroid cancer,THCA)的关键预后基因并构建预后预测模型。方法从癌症基因组图谱(The Cancer GenomeAtlas,TCGA)数据库中获取THCA和正常样本的基因表达谱,采用Limma算法筛选THCA组织与正常组织间差异表达基因(differen... 目的筛选甲状腺癌(thyroid cancer,THCA)的关键预后基因并构建预后预测模型。方法从癌症基因组图谱(The Cancer GenomeAtlas,TCGA)数据库中获取THCA和正常样本的基因表达谱,采用Limma算法筛选THCA组织与正常组织间差异表达基因(differentially expressed genes,DEGs),再进行权重基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)和套索联合COX回归分析(least absolute shrinkage and selection operator regression COX analysis,LASSO-COX)获得与其预后相关基因,然后根据关键基因构建预后预测模型,基于风险评分进行生存分析和受试者工作特征(receiver operating characteristic,ROC)曲线分析,最后基于基因表达谱和风险评分进行基因集富集分析(gene set enrichment analysis,GSEA)以评估相关途径和分子机制。结果本研究筛选出5个THCA预后关键基因,即LINC02550、STEAP2、ATP2C2、PLEKHG4B和SALL4。通过这5个基因构建的预后评估模型表明,风险评分越高,预后越差。ROC曲线分析结果表明该模型对患者生存率具有优良的预测性能,结合THCA患者的主要临床特性建立的列线图具有良好的预测性能。GSEA分析发现mTOR信号通路、Hedgehog信号通路、细胞自噬调节、转化生长因子-β信号通路富集在高风险评分组。结论基于筛选出的5个关键基因构建的预后预测模型有助于预测THCA患者的预后,这5个基因是潜在的靶向治疗基因。 展开更多
关键词 甲状腺癌 基因集富集分析 权重基因共表达网络分析 套索联合COX回归分析
下载PDF
基于双重群组套索的高维空间多值处置效应估计
17
作者 马键 胡毅 林建浩 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2018年第11期2750-2761,共12页
罗宾因果推断模型在非实验数据分析中具有重要地位,但对高维数据分析,古典低维空间处置效应估计量往往表现欠佳.本文结合高维空间下的双重选择估计与群组套索回归,提出一种估计高维稀疏空间下多值处置效应的双重群组套索估计方法.数值... 罗宾因果推断模型在非实验数据分析中具有重要地位,但对高维数据分析,古典低维空间处置效应估计量往往表现欠佳.本文结合高维空间下的双重选择估计与群组套索回归,提出一种估计高维稀疏空间下多值处置效应的双重群组套索估计方法.数值模拟发现,对于因果参数估计,双重群组套索估计的经验功效接近理论值,而预测性套索回归则存在较大的功效偏差.对教育生产函数的案例研究发现,该方法可以有效地从多个备选控制变量中选出正确的控制变量,仅有一个噪声变量被错误选择. 展开更多
关键词 罗宾因果推断模型 高维稀疏性 群组套索回归
原文传递
社会学习与消费升级——来自中国电影市场的经验证据 被引量:27
18
作者 方娴 金刚 《中国工业经济》 CSSCI 北大核心 2020年第1期43-61,共19页
文化服务产业消费“扩容”与“提质”对于中国当前消费升级至关重要。以2012—2016年中国1854部电影为研究对象,本文将每日电影院层面票房数据汇总至全国层面,构建“电影—日”全国票房数据。为避免弱工具变量问题,采用新近发展的套索(L... 文化服务产业消费“扩容”与“提质”对于中国当前消费升级至关重要。以2012—2016年中国1854部电影为研究对象,本文将每日电影院层面票房数据汇总至全国层面,构建“电影—日”全国票房数据。为避免弱工具变量问题,采用新近发展的套索(LASSO)回归选择最优的天气与空气污染变量作为电影首映周非预期票房的工具变量,识别了社会学习对电影跨期消费增长的影响。研究发现:受外生冲击影响的电影首映周非预期票房变化对于后续周票房存在显著的正向跨期溢出效应,且该溢出效应随着时间推移而逐渐减小。进一步地,制作质量越高、事前质量信息不确定性越高以及市场偏好越集中,电影消费的跨期溢出效应就越明显。这一结果表明,社会学习是引致电影消费跨期溢出效应的主要机制,观察学习与社会网络外部性等机制并未得到实证证据的支持。总体而言,本文揭示了社会学习是影响电影消费“扩容”与“提质”的关键因素,从个体间微观互动机制这一全新视角为激发中国新一轮消费升级提供了可行的实践路径。 展开更多
关键词 社会学习 消费升级 电影消费 套索回归
原文传递
TPE-XGBOOST与LassoLars组合下PM2.5浓度分解集成预测模型研究 被引量:14
19
作者 翁克瑞 刘淼 刘钱 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2020年第3期748-760,共13页
在我国当前大气重污染的环境下,PM2.5浓度的预警预报工作显得尤为重要.由于PM2.5浓度时间序列具有高度复杂性与随机性等特点,且传统的PM2.5浓度分解集成预测方法没有考虑空气质量因素与气象因素的信息,仅靠PM2.5浓度的历史值难以准确对... 在我国当前大气重污染的环境下,PM2.5浓度的预警预报工作显得尤为重要.由于PM2.5浓度时间序列具有高度复杂性与随机性等特点,且传统的PM2.5浓度分解集成预测方法没有考虑空气质量因素与气象因素的信息,仅靠PM2.5浓度的历史值难以准确对其精准预测.本文在对历史数据的分解下,对高频数据引入TPE-XGBOOST模型,对低频数据引入LassoLars模型,结合空气质量因素与气象因素反映分解特征的变化趋势,对PM2.5浓度时间序列展开预测研究.通过实验,该组合模型显示出了良好的预测效果,且相对于单一分解集成预测模型有较大的预测精度提升. 展开更多
关键词 PM2.5浓度值预测 集成经验模态分解 贝叶斯优化算法 极限梯度提升树 套索回归 多元因素
原文传递
基于LASSO-GWO-KELM的工业碳排放预测方法研究 被引量:5
20
作者 张新生 魏志臻 +1 位作者 陈章政 韩轶伟 《环境工程》 CAS CSCD 北大核心 2023年第10期141-149,共9页
针对工业碳排放系统的总量预测问题,建立基于套索回归(LASSO)、灰狼优化算法(GWO)和核极限学习机(KELM)相结合的模型提高碳排放量预测精度。首先根据IPCC公式法与电热分摊法核算2000—2020年工业直接与间接碳排放量,运用STIRPAT模型选... 针对工业碳排放系统的总量预测问题,建立基于套索回归(LASSO)、灰狼优化算法(GWO)和核极限学习机(KELM)相结合的模型提高碳排放量预测精度。首先根据IPCC公式法与电热分摊法核算2000—2020年工业直接与间接碳排放量,运用STIRPAT模型选取国内生产总值、能源结构、固定资产投资等指标;然后通过灰色关联分析、LASSO回归模型筛选出7个显著影响因素;再接着对工业碳排放系统的参数数据进行预处理并输入至KELM模型,使用GWO算法优化KELM正则化系数(C)和核函数参数(γ);最后将预测结果集成汇总,并对比分析LASSO-GWO-KELM、LASSO-SSA-KELM、LASSO-SFO-KELM、LASSO-KELM和LASSO-ELM预测结果。结果显示:LASSO-GWO-KELM模型预测值与实际值拟合,其均方误差、平均绝对误差、均方根误差、平均绝对百分比误差分别为0.02%、1.09%、1.33%和1.17%,均优于其他模型,证明该模型能够更为准确地预测工业碳排放量,为我国尽早实现“双碳”目标提供参考。 展开更多
关键词 工业 套索回归 核极限学习机 灰狼优化算法 碳排放预测
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部