-
题名基于隐私政策条款和机器学习的应用分类
被引量:3
- 1
-
-
作者
朱璋颖
陆亦恬
唐祝寿
张燕
-
机构
上海犇众信息技术有限公司
-
出处
《通信技术》
2020年第11期2749-2757,共9页
-
文摘
为了提升隐私政策可读性并评价其质量,提出一种基于机器学习的中文隐私政策条款自动分类方法。首先,确立条款分类指标体系,从不同类别条款中提取特征;其次,建立和训练基于机器学习算法的层次多标签分类模型,在测试集上通过实验对比各算法性能;最后,基于分类结果检测隐私政策的虚假性和完整性,同时设计了隐私政策评价方法对其进行评分。实验结果表明,支持向量机模型在分类效果上优于其他模型,准确率达到86%,验证了该方法在自动分类隐私政策条款上的可行性。此外,对华为应用市场中1500篇隐私政策检测发现,其中38.5%不是隐私政策,余下隐私政策中92.5%的内容不完整,大部分得分偏低。
-
关键词
隐私政策
机器学习
支持向量机
多标签分类模型
-
Keywords
privacy policy
machine learning
SVM
multi-label classification model
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-