-
题名基于数字内容偏好的多标签分类应用
- 1
-
-
作者
刘斌
李笑
-
机构
陕西科技大学电子信息与人工智能学院
-
出处
《计算机与现代化》
2021年第2期45-50,共6页
-
基金
国家自然科学基金资助项目(61871260)。
-
文摘
目前电信行业的数字内容研究主要是基于业务口径进行不同偏好的用户洞察,多以业务经验进行判断,不利于数字内容用户规模的发展扩大。为此,本文利用大流量客户的历史数据,基于多标签分类算法对数字内容偏好进行研究,得到各类别的潜在目标客户,最终通过营销推荐客户喜好内容,提高精准营销能力。首先以M电信公司用户的基础、消费属性等脱敏数据作为数据源,并获取近3个月视频、音乐、阅读活跃用户清单,人工进行活跃维度的标注,得到初始数据集;由于正负样本不均衡,故采用多次下采样的方法随机抽样得到3份样本数据,并使用CC、ML-KNN、Rakel D等6种算法进行对比实验验证;实验结果表明:采用Rakel D及ML-KNN多标签分类算法在数字内容用户偏好洞察方面有较好的预测能力,故采用ML-KNN作为Rakel D算法的基本分类器,即Rakel D_MLKNN方法,对正负样比例不同的数据集分别进行预测,效果均优于前6种已经存在的常用多标签分类算法及传统经验选型方法。
-
关键词
数字内容偏好
多标签分类
CC算法
ML-KNN算法
rakeld算法
-
Keywords
digital content preference
multi-label classification
Classifier Chains(CC)algorithm
Multi-Label K-Nearest Neighbor(ML-KNN)algorithm
Random k labelsets Disjoint(rakeld)algorithm
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-