期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
核典型关联性分析相关特征提取与核逻辑斯蒂回归域自适应学习 被引量:5
1
作者 刘建伟 孙正康 +1 位作者 刘泽宇 罗雄麟 《电子学报》 EI CAS CSCD 北大核心 2016年第12期2908-2915,共8页
本文提出了一种利用核典型关联性分析提取源域目标域最大相关特征,使用核逻辑斯蒂回归模型进行域自适应学习的算法,该算法称为KCCA-DAML(Kernel Canonical Correlation Analysis for Domain Adaptation Learning).该算法基于特征集关联... 本文提出了一种利用核典型关联性分析提取源域目标域最大相关特征,使用核逻辑斯蒂回归模型进行域自适应学习的算法,该算法称为KCCA-DAML(Kernel Canonical Correlation Analysis for Domain Adaptation Learning).该算法基于特征集关联性分析,有效的减小源域和目标域的概率分布差异性,利用提取的最大相关特征通过核逻辑斯蒂回归模型实现源域到目标域的跨域学习.实验比较源域数据上核逻辑斯蒂学习模型、目标域上核逻辑斯蒂学习模型、源域和目标域上核逻辑斯蒂学习模型和KCCA-DAML模型,结果显示KCCA-DAML在真实数据集上成功的实现了跨域学习. 展开更多
关键词 域自适应 概率布差异 相关 逻辑回归 正则化模型
下载PDF
应用地理加权逻辑斯蒂回归模型分析浙江区域野火的相关因子 被引量:2
2
作者 彭徐剑 靳全锋 +1 位作者 詹庆斌 郭福涛 《东北林业大学学报》 CAS CSCD 北大核心 2021年第3期57-66,共10页
野火是森林生态系统重要干扰因子,维持生物多样性和生态系统结构关键因子,也是对森林资源、大气环境和人类生命财产安全造成威胁主要因子。以2001—2018年浙江区域MODIS野火数据为研究基础,运用地理加权逻辑斯蒂回归方法,结合气象、植... 野火是森林生态系统重要干扰因子,维持生物多样性和生态系统结构关键因子,也是对森林资源、大气环境和人类生命财产安全造成威胁主要因子。以2001—2018年浙江区域MODIS野火数据为研究基础,运用地理加权逻辑斯蒂回归方法,结合气象、植被和地形等自然因素,分析浙江野火时间变化特征及相关因子。结果表明:浙江区域野火时间变化不均匀,导致防火期提前,当年10月至次年4月野火发生占全年总火点的95.28%,其它月份仅占4.72%。防火期对野火的发生影响显著的因子主要有日最高地表气温、日平均风速、日降水量、日平均气压、日最低温度、日最小相对湿度、年平均降水量、海拔、坡度和植被覆盖度;非防火期对野火发生影响显著的因子主要有日最高地表气温、日降水量、日照时间、年平均降水量、年平均气温、海拔、坡向指数和前一年植被覆盖度。防火期和非防火期的高火险区域主要集中在温州中部和东部、温州与丽水市交汇区域、绍兴市与宁波市交汇区域,说明不同时期、不同区域可以采取不同的野火管理政策。 展开更多
关键词 浙江 地理加权逻辑回归模型 野火 气象因子 地形因子
下载PDF
基于逻辑斯蒂回归的恶意请求分类识别模型 被引量:10
3
作者 陈春玲 吴凡 余瀚 《计算机技术与发展》 2019年第2期124-128,共5页
为了解决针对Web应用层的攻击,有效分类识别恶意请求,深入研究有监督的学习方法,针对请求文本内容不足、特征稀疏的缺陷,提出了一种基于非重复多N-Gram的TF-IDF分词策略和逻辑斯蒂回归方法构建的恶意请求分类模型。通过从Secrepo安全数... 为了解决针对Web应用层的攻击,有效分类识别恶意请求,深入研究有监督的学习方法,针对请求文本内容不足、特征稀疏的缺陷,提出了一种基于非重复多N-Gram的TF-IDF分词策略和逻辑斯蒂回归方法构建的恶意请求分类模型。通过从Secrepo安全数据样本库等来源采集到的大量样本数据进行特征提取后对模型进行训练,以最大似然估计作为模型的优化目标,利用梯度下降的方法得到最优分类模型,并在测试集上验证模型的可靠性。实验结果表明,短文本、低语义的请求内容通过字母形式在多N-Gram的分词下构造的分类模型,相对于单词和单倍N-Gram分词的分类模型具有较高的分类准确率和得分,并且训练模型所耗时间相差不大。该方法训练出的最终模型在测试集上的准确率、召回率和F1值都达到了99%以上。 展开更多
关键词 Web请求 逻辑回归 最大似然估计 TF-IDF 类模型
下载PDF
价格、折扣和评分对在线酒店销售成功率的影响研究——基于两分逻辑斯蒂模型的回归分析
4
作者 王铁 李梅 +1 位作者 孙德健 高仟惠 《电子商务》 2019年第12期5-7,11,共4页
价格和口碑是影响在线酒店销售的两个关键因素。本研究收集了6188件在线酒店产品的相关数据,采用两分逻辑斯蒂回归的研究方法,从总体和消费层次两个维度,分析了价格、降价幅度和评分对销售成功率的有用性和作用程度。结果显示,对于全部... 价格和口碑是影响在线酒店销售的两个关键因素。本研究收集了6188件在线酒店产品的相关数据,采用两分逻辑斯蒂回归的研究方法,从总体和消费层次两个维度,分析了价格、降价幅度和评分对销售成功率的有用性和作用程度。结果显示,对于全部产品,这三个因子对提高销售成功率有确定的作用,其中最重要的是价格,其次是评分和降价幅度。然而,不同层次产品(经济型、中档型、舒适型、高档型和豪华型)的影响因子在构成及其重要性上存在明显差异。研究结论刻画出价格、折扣和评分对在线酒店产品销售成功率的影响特点,有利于酒店提高其产品的销售成功率。 展开更多
关键词 价格 折扣 销售成功率 在线酒店产品 逻辑回归
下载PDF
基于非线性降维多项式逻辑斯蒂回归的图像/非图像数据的分类与识别(英文) 被引量:1
5
作者 Mudasser NASEER 秦世引 《智能系统学报》 2010年第1期85-93,共9页
在面向大规模复杂数据的模式分类和识别问题中,绝大多数的分类器都遇到了维数灾难这一棘手的问题.在进行高维数据分类之前,基于监督流形学习的非线性降维方法可提供一种有效的解决方法.利用多项式逻辑斯蒂回归方法进行分类预测,并结合... 在面向大规模复杂数据的模式分类和识别问题中,绝大多数的分类器都遇到了维数灾难这一棘手的问题.在进行高维数据分类之前,基于监督流形学习的非线性降维方法可提供一种有效的解决方法.利用多项式逻辑斯蒂回归方法进行分类预测,并结合基于非线性降维的非监督流形学习方法解决图像以及非图像数据的分类问题,因而形成了一种新的分类识别方法.大量的实验测试和比较分析验证了本文所提方法的优越性. 展开更多
关键词 非线性降维 数据 多项式逻辑回归 图像/非图像数据
下载PDF
比较逻辑斯蒂与地理加权逻辑斯蒂回归模型在福建林火发生的适用性 被引量:19
6
作者 梁慧玲 王文辉 +2 位作者 郭福涛 林芳芳 林玉蕊 《生态学报》 CAS CSCD 北大核心 2017年第12期4128-4141,共14页
林火预测预报是科学有效进行林火管理的前提,是林业管理部门和科研工作者的广泛关注的领域。逻辑斯蒂回归(Logistic Regression,LR)是目前国内外广泛应用于森林火灾预测的模型方法,然而近年来有学者发现该方法没有充分考虑林火影响因子... 林火预测预报是科学有效进行林火管理的前提,是林业管理部门和科研工作者的广泛关注的领域。逻辑斯蒂回归(Logistic Regression,LR)是目前国内外广泛应用于森林火灾预测的模型方法,然而近年来有学者发现该方法没有充分考虑林火影响因子的空间相关性和异质性,从而导致模型拟合结果偏差。地理加权逻辑斯蒂回归(Geographically weighted logistic regression,GWR)模型考虑到了模型变量之间的空间相关性,有效提高的模型的拟合能力。为探讨GWLR模型在福建林火预测上的适用性,本研究应用LR和GWLR两种方法分别建立福建省森林火灾与气象因子的预测模型,通过模型拟合能力对比,判断在GWLR的适用性。研究以2000—2005年福建地区森林火灾卫星火点数据和每日气象因子为基础,将全样本分为60%的建模数据和40%的校验数据,并重复5次,建立5个样本组。选择在5个样本组中3个及以上表现显著的变量进入最终模型。研究结果表明GWLR在模型拟合度、模型残差、空间自相关性以及预测准确率等方面均优于LR模型,说明充分考虑模型变量的空间异质性有助于提高模型的预测精度,同时也验证了GWLR在福建地区林火预测上的适应性。此外,模型参数结果显示,"日最高地表气温"、"日最低地表气温"、"日平均风速"、"24小时降水量"、"日最高本站气压"、"日照时数"、"日最高气温"和"日最小相对湿度"8个因子对福建省林火发生有显著影响,研究结论为福建地区林火预测预报提供了新的方法。 展开更多
关键词 林火预测 空间异质性 逻辑回归 地理加权逻辑回归
下载PDF
基于逻辑斯蒂回归模型的鹭科水鸟栖息地适宜性评价 被引量:19
7
作者 邹丽丽 陈晓翔 +2 位作者 何莹 黎夏 何执兼 《生态学报》 CAS CSCD 北大核心 2012年第12期3722-3728,共7页
近年来湿地生态系统遭到不同程度破坏,湿地水鸟及其生存空间日益受到威胁。以香港米埔-后海湾湿地为例,收集2003年1月份与鹭科水鸟密切相关的15个自变量和鹭科水鸟实测数据作为因变量构建逻辑斯蒂回归模型,通过筛选获取9个变量因子,分... 近年来湿地生态系统遭到不同程度破坏,湿地水鸟及其生存空间日益受到威胁。以香港米埔-后海湾湿地为例,收集2003年1月份与鹭科水鸟密切相关的15个自变量和鹭科水鸟实测数据作为因变量构建逻辑斯蒂回归模型,通过筛选获取9个变量因子,分别为土地利用,NDVI,坡度,降雨,TM4纹理,TM3纹理,道路密度,道路距离,人居密度。经Nagelkerke R2检验模型精度达到0.743,拟合度较高。利用模型结果快速聚类,对栖息地进行适宜性分级,分级结果与同期鹭科水鸟实测数据做拟合,精度达到77.4%。最后采集2009年1月份各变量因子数据对回归方程进行时间尺度检验,与同期实测鹭科水鸟数据拟合精度同样达到75.8%,模型具有较好的通用性。 展开更多
关键词 逻辑回归模型 鹭科水鸟 栖息地 适宜性
下载PDF
基于逻辑斯蒂回归的变压器涌流识别 被引量:7
8
作者 丁晓兵 周红阳 +3 位作者 黄佳胤 张弛 白淑华 张利强 《电力系统及其自动化学报》 CSCD 北大核心 2020年第12期77-84,94,共9页
变压器涌流是造成变压器差动保护误动的主要原因之一。本文从变压器不同运行工况下记录的差动电流波形出发,结合小波分析和机器学习智能技术,提出了一种基于逻辑斯蒂回归的涌流识别方法。首先,通过仿真手段批量获取变压器涌流和内部故... 变压器涌流是造成变压器差动保护误动的主要原因之一。本文从变压器不同运行工况下记录的差动电流波形出发,结合小波分析和机器学习智能技术,提出了一种基于逻辑斯蒂回归的涌流识别方法。首先,通过仿真手段批量获取变压器涌流和内部故障波形样本。然后,借助小波理论从中抽取反映波形组成成分复杂度的特征指标,并在此基础上,详细阐述了逻辑斯蒂回归分类器从构建优化到性能评估的完整过程。最后,将分类器应用于仿真实验和现场录波数据,通过与现有文献中的检测方法相比,验证了本文方法的正确性和有效性。本文方法原理简单,计算量小,既可以对当前现场配置保护作动作特性分析,也可以为智能保护的研究提供参考。 展开更多
关键词 变压器保护 涌流 内部故障 逻辑回归 小波
下载PDF
基于逻辑斯蒂模型的遥感图像分类 被引量:5
9
作者 刘庆生 刘高焕 +1 位作者 蔺启忠 王志刚 《国土资源遥感》 CSCD 2001年第1期36-41,共6页
逻辑斯蒂法是一种非线性的回归分析方法 ,因采用逻辑斯蒂模型而得名[1] ,可用来进行未知单元类别属性的预测和判定。不同于一般的分类方法 ,它可分别给出某一单元属于各已知类别的概率 ,进而对研究的未知区中所有单元进行分类和预测。... 逻辑斯蒂法是一种非线性的回归分析方法 ,因采用逻辑斯蒂模型而得名[1] ,可用来进行未知单元类别属性的预测和判定。不同于一般的分类方法 ,它可分别给出某一单元属于各已知类别的概率 ,进而对研究的未知区中所有单元进行分类和预测。本文首先阐述了该方法的基本原理 ,而后利用它对内蒙古自治区两个研究区的两种图像数据进行了分类 。 展开更多
关键词 逻辑模型 逻辑 遥感图像 回归
下载PDF
连续比例逻辑斯蒂回归模型在半参数ROC曲面估计上的应用 被引量:1
10
作者 杨朝伟 《重庆工商大学学报(自然科学版)》 2021年第3期100-104,共5页
针对诊断试验中有3种或3种以上诊断结果的情形,常采用ROC曲面来代替ROC曲线进行试验准确度的判断。回顾以往有关ROC曲面估计问题的文献,可以发现学者们大多使用的是参数方法和非参数方法,而利用半参数方法所得到的结果也很优良,结合连... 针对诊断试验中有3种或3种以上诊断结果的情形,常采用ROC曲面来代替ROC曲线进行试验准确度的判断。回顾以往有关ROC曲面估计问题的文献,可以发现学者们大多使用的是参数方法和非参数方法,而利用半参数方法所得到的结果也很优良,结合连续比例逻辑斯蒂回归模型和bootstrap方法,所得到的ROC曲面和非参数方法相比更加平滑,也更加精确,在计算半参数最大似然估计时,半参数方法可以借助许多统计软件中的逻辑斯蒂程序来代替传统的牛顿迭代法之类的数值计算方法,能很快得到结果。因此在ROC曲面估计问题上半参数方法明显优于非参数方法。 展开更多
关键词 密度比模型 ROC曲面 连续比例逻辑回归模型 VUS
下载PDF
混合效应逻辑斯蒂回归模型的原理及其应用
11
作者 张懂 《语料库语言学》 2020年第2期100-111,共12页
近年来,混合效应逻辑斯蒂回归模型(mixed-effects logistic regression model)在社会语言学、心理语言学、语料库语言学和认知语言学等领域中得到广泛应用。本文旨在介绍混合效应逻辑斯蒂回归建模的原理,并以英语与格交替研究作为案例,... 近年来,混合效应逻辑斯蒂回归模型(mixed-effects logistic regression model)在社会语言学、心理语言学、语料库语言学和认知语言学等领域中得到广泛应用。本文旨在介绍混合效应逻辑斯蒂回归建模的原理,并以英语与格交替研究作为案例,展示混合效应逻辑斯蒂回归模型在语言研究中的具体应用。 展开更多
关键词 混合效应逻辑回归模型 变量统计 英语与格交替
下载PDF
基于多分变量逻辑回归的短波广播效果估算方法
12
作者 王强 《广播与电视技术》 2015年第S1期56-58,共3页
本文提出基于多分变量逻辑回归的短波广播效果估算方法,并通过实测结果、REC533方法预测广播效果值和BTC时间这三个参数,预测广播效果。将该方法得到的结果与REC533方法的预测结果进行比较,本文的方法有一定的优势。
关键词 广播效果 估算方法 多分变量逻辑回归
下载PDF
地形对温带密林下灌草层地上生物量分异的影响——以东北虎豹国家公园为例
13
作者 王乐 牟溥 王天明 《广西植物》 CAS CSCD 北大核心 2024年第8期1512-1523,共12页
为探讨地形对林下灌草层植物生物量的影响,该研究采用嵌套设计法在东北虎豹国家公园调查了138个密林下样地共1685个植物样方,通过嵌套方差分析与有序逻辑斯蒂回归模型对林下灌草层植物生物量受地形的影响进行了分析。结果表明:(1)不同... 为探讨地形对林下灌草层植物生物量的影响,该研究采用嵌套设计法在东北虎豹国家公园调查了138个密林下样地共1685个植物样方,通过嵌套方差分析与有序逻辑斯蒂回归模型对林下灌草层植物生物量受地形的影响进行了分析。结果表明:(1)不同坡位之间,谷底的灌草层植物生物量高于坡上,坡上高于坡下(P<0.01);不同坡向之间,阴坡灌草层植物生物量低于阳坡及平地(P<0.01),后二者间无显著差异;不同坡度之间,平坡灌草层植物生物量高于陡坡,陡坡高于缓坡(P<0.01)。(2)坡位与坡向的交互作用显著,坡下平地、坡上平地、坡上阳坡与谷底的所有坡位灌草层植物生物量最高,坡下阴坡、坡下阳坡及坡上阴坡之间无显著差异。(3)研究区现行状态下,有序逻辑斯蒂回归结果显示,灌草层植物生物量在不同海拔、坡位及坡向坡度组合下不同。坡位、坡向及坡度对林下灌草层植物生物量有显著影响,3个坡位等级间谷底最高而坡下最低,3个坡度等级间陡坡最高而缓坡最低,不同坡向比较,阴坡最低。(4)在不排除人为干扰、森林放牧的现实情况下,谷底、陡坡地带灌草层植物生物量概率最高。该研究结果可为准确估计东北虎豹国家公园林下灌草层植物对虎豹猎物种群的承载力提供重要参考,从而为濒危虎豹的保护和管理提供科学依据。 展开更多
关键词 林下灌草层植物 有蹄类动物食物资源 地形 东北虎豹国家公园 有序逻辑回归
下载PDF
融合两帧差分法的改进视觉背景提取算法
14
作者 舒兆翰 李小龙 吴从辉 《科学技术与工程》 北大核心 2024年第11期4618-4625,共8页
针对视觉背景提取(visual background extractor,ViBe)算法在运动目标检测过程中容易受到噪声干扰的问题,将两帧差分法融入ViBe的前景检测阶段,提出一种融合两帧差分信息的改进ViBe算法(ViBe with two-frame differencing,ViBe-TD)。首... 针对视觉背景提取(visual background extractor,ViBe)算法在运动目标检测过程中容易受到噪声干扰的问题,将两帧差分法融入ViBe的前景检测阶段,提出一种融合两帧差分信息的改进ViBe算法(ViBe with two-frame differencing,ViBe-TD)。首先,设计单阈值形ViBe(single-threshold form of ViBe,S-ViBe)检测,为信息融合做准备;其次,基于逻辑斯蒂(logistic)回归模型,实现像素点上两帧差分和S-ViBe检测信息的融合;最后,综合两类检测信息完成前景像素点的判定。实验结果表明,ViBe-TD算法在4种不同场景视频上的检测效果达到了0.932的平均精确率,0.785的平均召回率以及0.842的平均F 1值。与原算法相比,ViBe-TD算法的各项指标平均有0.158的提高,具有良好的检测效果。 展开更多
关键词 运动目标检测 视觉背景提取 两帧差 逻辑回归 信息融合
下载PDF
逻辑斯蒂方程的特征与经济系统
15
作者 陶前功 鲍春华 《计划与市场》 2001年第8期36-38,共3页
关键词 逻辑方程 混沌现象 经济变量 经济系统
下载PDF
基于Logistic回归的计算机应用基础课程统考成绩分析 被引量:2
16
作者 张新华 骆昌日 苏智 《高等函授学报(自然科学版)》 2012年第6期45-48,共4页
本文针对学生《计算机应用基础》课程统考成绩的影响因素进行基于Logistic回归的多元分析。采用Logistic回归方程对《计算机应用基础》课程统考成绩作为目标变量进行建模分析,结果表明:年级、学习专业、学习中心对《计算应用基础》课程... 本文针对学生《计算机应用基础》课程统考成绩的影响因素进行基于Logistic回归的多元分析。采用Logistic回归方程对《计算机应用基础》课程统考成绩作为目标变量进行建模分析,结果表明:年级、学习专业、学习中心对《计算应用基础》课程统考成绩影响最重要。 展开更多
关键词 网络教育特征重要性 皮尔逊统计量 逻辑回归
下载PDF
权核Logistic回归模型的分类和特征选择算法 被引量:1
17
作者 池光辉 刘建伟 +1 位作者 李卫民 罗雄麟 《计算机工程与应用》 CSCD 2013年第9期41-44,共4页
监督学习情况下,经常遇到样例的维数远远大于样本个数的学习情况。此时,样例中存在许多与样例类标签无关的特征,研究如何同时实现稀疏特征选择并具有更好的分类性能的算法具有优势。提出了基于权核逻辑斯蒂非线性回归模型的分类和特征... 监督学习情况下,经常遇到样例的维数远远大于样本个数的学习情况。此时,样例中存在许多与样例类标签无关的特征,研究如何同时实现稀疏特征选择并具有更好的分类性能的算法具有优势。提出了基于权核逻辑斯蒂非线性回归模型的分类和特征选择算法。权对角矩阵的对角元素在0到1之间取值,对角元素的取值作为学习参数由最优化过程确定,讨论了提出的快速轮转优化算法。提出的算法在十个实际数据集上进行了测试,实验结果显示,提出的分类算法与L1,L2,Lp正则化逻辑斯蒂模型分类算法比较具有优势。 展开更多
关键词 权矩阵 逻辑回归 特征选择 非线性模型 核函数
下载PDF
基于Logistic回归模型的黄河三角洲淡水恢复湿地大型底栖生物种群分布模拟 被引量:6
18
作者 杨薇 李晓晓 +1 位作者 李铭 孙涛 《生态学报》 CAS CSCD 北大核心 2017年第22期7750-7759,共10页
掌握大型底栖生物种群分布的时空变化对正确把握湿地生态修复效率、揭示湿地生态演替过程具有重要理论与实践意义。选择黄河三角洲地区一千二自然保护区的淡水恢复湿地为研究区,在2014—2015年大型底栖生物野外采样和优势物种的基础上,... 掌握大型底栖生物种群分布的时空变化对正确把握湿地生态修复效率、揭示湿地生态演替过程具有重要理论与实践意义。选择黄河三角洲地区一千二自然保护区的淡水恢复湿地为研究区,在2014—2015年大型底栖生物野外采样和优势物种的基础上,选择了琥珀刺沙蚕、中华蜾蠃蜚、摇蚊幼虫作为典型优势物种,构建了基于Logistic回归的淡水恢复湿地大型底栖生物种群分布模拟模型。其中,琥珀刺沙蚕和摇蚊幼虫的模拟结果较好,模拟准确率分别为84.9%和77.9%,而中华蜾蠃蜚的模拟结果不甚理想。对比生态补水前后大型底栖生物的模拟分布结果发现,琥珀刺沙蚕主要集中在潮间带区域,且在春、秋两季的生存概率分布差异不显著;而淡水恢复湿地中摇蚊幼虫的分布概率显著提高,其中高于分割值0.5的栖息面积增长了9.9—10.8倍,表明退化湿地生境正处于向淡水湿地演替进程中。 展开更多
关键词 种群布模型 逻辑回归 大型底栖生物 淡水恢复湿地 黄河三角洲
下载PDF
贵州省喀斯特区土地利用变化及驱动力分析 被引量:3
19
作者 罗笑 卢鹏 《贵州林业科技》 2022年第4期22-27,共6页
基于中国科学院重要创新项目积累的土地利用数据库,采用土地利用转移矩阵法以及动态度研究法,对贵州省内1990、2000、2010、2018年度土地利用数据及情况进行分析,利用逻辑斯蒂回归法对土地利用变化驱动力方程进行求算。结果表明:人均GDP... 基于中国科学院重要创新项目积累的土地利用数据库,采用土地利用转移矩阵法以及动态度研究法,对贵州省内1990、2000、2010、2018年度土地利用数据及情况进行分析,利用逻辑斯蒂回归法对土地利用变化驱动力方程进行求算。结果表明:人均GDP、GDP、铁路密度、水系密度、高程(DEM)的增加会提升土地变化的概率,人口、公路密度、地形起伏度和喀斯特程度的增加会减少土地变化的概率。 展开更多
关键词 土地利用 转移矩阵 逻辑回归
下载PDF
类别不平衡高维数据的最优逻辑斯蒂回归
20
作者 李智凡 尹建鑫 《系统科学与数学》 CSCD 北大核心 2023年第9期2341-2363,共23页
研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上... 研究响应变量两类比例不平衡时逻辑斯蒂回归的最优参数估计和代价敏感分类问题.在代价敏感的损失函数下,将不平衡的两类数量之比作为参数,通过等价转换成一个重新加权的类别平衡分类问题,得到了原问题预测的超额风险(excess risk)的上界和逻辑斯蒂回归系数误差上界.同时利用VC维技术得到了正则条件下超额风险的minimax下界.得出结论:在相差一个可忽略常数倍的意义下,非平衡数据在代价敏感损失下得到的惩罚似然估计的误差界可以达到最优,且最优误差与一个可收敛至零的稀有类比例有关.其次,论文还将主要结论推广至损失函数为非凸的情形,并讨论了在两类数量比例需要估计时的误差上界.此外,通过数值模拟比较了给定和待估计类别比例的实际表现,发现主要结论不受影响. 展开更多
关键词 代价敏感损失函数 类别不平衡数据 逻辑回归 minimax最优
原文传递
上一页 1 2 6 下一页 到第
使用帮助 返回顶部