随着互联网和广告平台的飞速发展,面对海量的广告信息,为了提升用户点击率,提出一种改进的基于组合结构的逻辑回归点击预测算法LRCS(Logical Regression of Combination Structure)。该算法基于不同类别特征广告受众可能不同的特点,首先...随着互联网和广告平台的飞速发展,面对海量的广告信息,为了提升用户点击率,提出一种改进的基于组合结构的逻辑回归点击预测算法LRCS(Logical Regression of Combination Structure)。该算法基于不同类别特征广告受众可能不同的特点,首先,采用FM进行特征组合,产生两类组合特征;其次,将一类特征组合作为聚类算法的输入进行聚类;最后,将另一类特征组合输入由聚类产生的分段GBDT+逻辑回归组合的模型中进行预测。在两个公开数据集中进行了多角度验证,结果表明与其他几类常用的点击预测算法相比,LRCS在点击预测上有一定的性能提升。展开更多
目的基于特征筛选算法探索利用胸腔积液和血清中CEA、CA125、CA153和CA199四种肿瘤标志物的组合与筛选对鉴别良、恶性胸腔积液的诊断价值。方法收集北京朝阳医院和武汉某医院收治的胸腔积液患者共452例,其中恶性胸腔积液患者143例、良...目的基于特征筛选算法探索利用胸腔积液和血清中CEA、CA125、CA153和CA199四种肿瘤标志物的组合与筛选对鉴别良、恶性胸腔积液的诊断价值。方法收集北京朝阳医院和武汉某医院收治的胸腔积液患者共452例,其中恶性胸腔积液患者143例、良性胸腔积液患者309例;取胸腔积液及配对血清标本,用化学发光法检测CEA、CA125、CA153和CA199浓度,辅以患者性别、年龄和医院所在城市三项人口学变量,首先应用独立性检验进行变量初筛,而后应用带惩罚项的逻辑回归和基于逻辑回归的模拟退火算法和遗传算法进行标志物筛选,根据受试者工作特征曲线下面积(area under the curve,AUC)和DeLong检验进行模型诊断效果的评估和比较。结果特征筛选结果以及回归系数和SHAP(shapley additive explanations)值一致表明胸腔积液CA199、CA153联合血清CEA为最优肿瘤标志物组合;在测试数据集上,该指标组合达到最高诊断精度(AUC=0.923),显著高于最优单标志物模型(AUC=0.877,P<0.001)和全标志物模型(AUC=0.906,P=0.044),灵敏度和特异度分别达到0.811和0.939。结论多项肿瘤标志物的联合应用相较单一标志物能够显著提升模型诊断精度,且合理的标志物筛选策略对提升诊断精度和简化模型有进一步帮助;本文推荐联合胸腔积液中CA199和CA153以及血清中CEA来建立诊断模型,并提供了该模型的列线图和实用化的网页计算器,为辅助临床诊断提供便利。展开更多
文摘随着互联网和广告平台的飞速发展,面对海量的广告信息,为了提升用户点击率,提出一种改进的基于组合结构的逻辑回归点击预测算法LRCS(Logical Regression of Combination Structure)。该算法基于不同类别特征广告受众可能不同的特点,首先,采用FM进行特征组合,产生两类组合特征;其次,将一类特征组合作为聚类算法的输入进行聚类;最后,将另一类特征组合输入由聚类产生的分段GBDT+逻辑回归组合的模型中进行预测。在两个公开数据集中进行了多角度验证,结果表明与其他几类常用的点击预测算法相比,LRCS在点击预测上有一定的性能提升。
文摘目的基于特征筛选算法探索利用胸腔积液和血清中CEA、CA125、CA153和CA199四种肿瘤标志物的组合与筛选对鉴别良、恶性胸腔积液的诊断价值。方法收集北京朝阳医院和武汉某医院收治的胸腔积液患者共452例,其中恶性胸腔积液患者143例、良性胸腔积液患者309例;取胸腔积液及配对血清标本,用化学发光法检测CEA、CA125、CA153和CA199浓度,辅以患者性别、年龄和医院所在城市三项人口学变量,首先应用独立性检验进行变量初筛,而后应用带惩罚项的逻辑回归和基于逻辑回归的模拟退火算法和遗传算法进行标志物筛选,根据受试者工作特征曲线下面积(area under the curve,AUC)和DeLong检验进行模型诊断效果的评估和比较。结果特征筛选结果以及回归系数和SHAP(shapley additive explanations)值一致表明胸腔积液CA199、CA153联合血清CEA为最优肿瘤标志物组合;在测试数据集上,该指标组合达到最高诊断精度(AUC=0.923),显著高于最优单标志物模型(AUC=0.877,P<0.001)和全标志物模型(AUC=0.906,P=0.044),灵敏度和特异度分别达到0.811和0.939。结论多项肿瘤标志物的联合应用相较单一标志物能够显著提升模型诊断精度,且合理的标志物筛选策略对提升诊断精度和简化模型有进一步帮助;本文推荐联合胸腔积液中CA199和CA153以及血清中CEA来建立诊断模型,并提供了该模型的列线图和实用化的网页计算器,为辅助临床诊断提供便利。