针对正常与异常样本分布不平衡的异常点检测问题,本文以小球大距离(small sphere large margin,SSLM)超球支持向量机为基础,提出一种高正确率识别的包裹学习算法。基本思想为建立正常样本的同类特征集合的紧密包裹集,在特征空间内构造...针对正常与异常样本分布不平衡的异常点检测问题,本文以小球大距离(small sphere large margin,SSLM)超球支持向量机为基础,提出一种高正确率识别的包裹学习算法。基本思想为建立正常样本的同类特征集合的紧密包裹集,在特征空间内构造一个半径最小的超球,使超球内尽可能地包含大多数的正常样本,并使超球边界与包裹集及异常样本间隔最大化,所构造的超球边界会近似与正常样本边界拟合,同时将该方法与支持向量机方法和超球支持向量方法进行实验对比,并在uci数据集中的医学诊断数据及USPS数字集上进行对比实验。实验结果表明,与同类经典算法相比,包裹学习算法在不同的异常检测数据上分别达到了最高准确率。该研究可应用于样本分布不均的异常行为检测中。展开更多
针对现有搜索广告转化率预测模型和分类模型未考虑店铺特征和用户需求,为了更好的预测广告的转化率,本文基于店铺特征和用户需求对广告转化率进行预测。以阿里搜索广告为研究对象,提出基于店铺特征和用户需求的数据预分析的特征处理方式...针对现有搜索广告转化率预测模型和分类模型未考虑店铺特征和用户需求,为了更好的预测广告的转化率,本文基于店铺特征和用户需求对广告转化率进行预测。以阿里搜索广告为研究对象,提出基于店铺特征和用户需求的数据预分析的特征处理方式,对特征进行预分析,即对用户和店铺的相关特征进行初次预测处理,分别求出转化率,以此作为新特征。XGBoost算法泛化性能高,损失函数同时用到一阶导和二阶导,可以加快优化速度,所以运用该算法构建基于店铺特征和用户需求的阿里搜索广告转化率预测模型和转化率分类模型。通过对比预测结果在对数似然损失(Logarith mic loss,Logless)的指标,该预测模型的正确预测率和正确分类率显著提升。本文使用的特征处理方式能够充分挖掘商品信息,能够更好的实现广告转化率的预测,有利于提高广告的竞争力。展开更多
文摘针对正常与异常样本分布不平衡的异常点检测问题,本文以小球大距离(small sphere large margin,SSLM)超球支持向量机为基础,提出一种高正确率识别的包裹学习算法。基本思想为建立正常样本的同类特征集合的紧密包裹集,在特征空间内构造一个半径最小的超球,使超球内尽可能地包含大多数的正常样本,并使超球边界与包裹集及异常样本间隔最大化,所构造的超球边界会近似与正常样本边界拟合,同时将该方法与支持向量机方法和超球支持向量方法进行实验对比,并在uci数据集中的医学诊断数据及USPS数字集上进行对比实验。实验结果表明,与同类经典算法相比,包裹学习算法在不同的异常检测数据上分别达到了最高准确率。该研究可应用于样本分布不均的异常行为检测中。
文摘针对现有搜索广告转化率预测模型和分类模型未考虑店铺特征和用户需求,为了更好的预测广告的转化率,本文基于店铺特征和用户需求对广告转化率进行预测。以阿里搜索广告为研究对象,提出基于店铺特征和用户需求的数据预分析的特征处理方式,对特征进行预分析,即对用户和店铺的相关特征进行初次预测处理,分别求出转化率,以此作为新特征。XGBoost算法泛化性能高,损失函数同时用到一阶导和二阶导,可以加快优化速度,所以运用该算法构建基于店铺特征和用户需求的阿里搜索广告转化率预测模型和转化率分类模型。通过对比预测结果在对数似然损失(Logarith mic loss,Logless)的指标,该预测模型的正确预测率和正确分类率显著提升。本文使用的特征处理方式能够充分挖掘商品信息,能够更好的实现广告转化率的预测,有利于提高广告的竞争力。