期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
大数据分析下劣质用户数据动态清理方法仿真 被引量:1
1
作者 郭娜 沈焱萍 +1 位作者 韩莹 李攀 《计算机仿真》 北大核心 2019年第2期362-366,共5页
在大数据分析下对劣质用户数据进行动态清理时,对提高数据的准确率具有重要意义。进行劣质用户数据的动态清理时,需对数据集的关联因子进行计算,确定数据集的限定阈值。针对传统方法主要根据数据的变量进行清理,导致清理效果差、准确率... 在大数据分析下对劣质用户数据进行动态清理时,对提高数据的准确率具有重要意义。进行劣质用户数据的动态清理时,需对数据集的关联因子进行计算,确定数据集的限定阈值。针对传统方法主要根据数据的变量进行清理,导致清理效果差、准确率低的问题,提出基于SVM方法的劣质用户数据动态清理方法。根据劣质用户的输出数据,分析劣质用户数据处于不同数据集时的空间矩阵,利用数据清理因子和数据清理频率对数据集在不同子空间中的距离进行计算,并区分数据集的关联因子,确定关联因子与限定阈值之间的关系,建立清理模型,并利用劣质用户的离散数据计算数据的均值和方差,通过求得结果分析数据的置信区间,并计算数据的置信边界,获得数据的分类函数,实现对劣质用户数据的动态清理。仿真结果表明,提出方法在对劣质用户数据进行动态清理时,具有较好的清理效果和较高的准确率。 展开更多
关键词 大数据分析 劣质用户数据 动态清理 方法
下载PDF
改进自训练模型在业务质差用户识别中的应用
2
作者 余立 李哲 +2 位作者 高飞 袁向阳 杨永 《电信科学》 2021年第10期136-142,共7页
质差用户识别是降低用户投诉率、提升用户满意度的重要环节。针对当前电信网络系统中业务感知相关的大量结构化及非结构化数据难以有效标注、质差用户标签不完备、现有监督学习模型训练样本不均衡而导致质差识别率低的问题,采用改进自... 质差用户识别是降低用户投诉率、提升用户满意度的重要环节。针对当前电信网络系统中业务感知相关的大量结构化及非结构化数据难以有效标注、质差用户标签不完备、现有监督学习模型训练样本不均衡而导致质差识别率低的问题,采用改进自训练半监督学习模型,利用少量满意度低分和投诉用户作为质差用户标签对网络数据进行标注,并通过标签迁移对大量未标注数据进行训练识别质差用户。实验表明,相比于识别准确率高但是训练成本高的全监督学习和识别准确率低的无监督学习,半监督学习可以充分利用无标签样本数据进行有效训练,保证较低训练成本的同时显著提升质差用户识别准确率。 展开更多
关键词 半监督学习 改进自训练模型 质差用户识别 无标签数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部