-
题名大数据分析下劣质用户数据动态清理方法仿真
被引量:1
- 1
-
-
作者
郭娜
沈焱萍
韩莹
李攀
-
机构
防灾科技学院灾害信息工程系
-
出处
《计算机仿真》
北大核心
2019年第2期362-366,共5页
-
基金
河北省教育厅高等学校科学研究计划项目作为第一资助(Z2018209)
中央高校基本科研业务费青年教师资助计划项目作为第二资助项(Z2018209)
-
文摘
在大数据分析下对劣质用户数据进行动态清理时,对提高数据的准确率具有重要意义。进行劣质用户数据的动态清理时,需对数据集的关联因子进行计算,确定数据集的限定阈值。针对传统方法主要根据数据的变量进行清理,导致清理效果差、准确率低的问题,提出基于SVM方法的劣质用户数据动态清理方法。根据劣质用户的输出数据,分析劣质用户数据处于不同数据集时的空间矩阵,利用数据清理因子和数据清理频率对数据集在不同子空间中的距离进行计算,并区分数据集的关联因子,确定关联因子与限定阈值之间的关系,建立清理模型,并利用劣质用户的离散数据计算数据的均值和方差,通过求得结果分析数据的置信区间,并计算数据的置信边界,获得数据的分类函数,实现对劣质用户数据的动态清理。仿真结果表明,提出方法在对劣质用户数据进行动态清理时,具有较好的清理效果和较高的准确率。
-
关键词
大数据分析
劣质用户数据
动态清理
方法
-
Keywords
Big data analysis
poor user data
Dynamic cleanup
Method
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进自训练模型在业务质差用户识别中的应用
- 2
-
-
作者
余立
李哲
高飞
袁向阳
杨永
-
机构
中国移动通信有限公司研究院人工智能与智慧运营中心
中国移动通信集团公司网络事业部服务保障室
中国移动通信有限公司研究院
-
出处
《电信科学》
2021年第10期136-142,共7页
-
文摘
质差用户识别是降低用户投诉率、提升用户满意度的重要环节。针对当前电信网络系统中业务感知相关的大量结构化及非结构化数据难以有效标注、质差用户标签不完备、现有监督学习模型训练样本不均衡而导致质差识别率低的问题,采用改进自训练半监督学习模型,利用少量满意度低分和投诉用户作为质差用户标签对网络数据进行标注,并通过标签迁移对大量未标注数据进行训练识别质差用户。实验表明,相比于识别准确率高但是训练成本高的全监督学习和识别准确率低的无监督学习,半监督学习可以充分利用无标签样本数据进行有效训练,保证较低训练成本的同时显著提升质差用户识别准确率。
-
关键词
半监督学习
改进自训练模型
质差用户识别
无标签数据
-
Keywords
semi-supervised learning
improved self-training model
poor quality user identification
unlabeled data
-
分类号
TN915.41
[电子电信—通信与信息系统]
-