基于隐私政策条款和机器学习的应用分类被引量：3

Application Classification based on Privacy Policy Terms and Machine Learning

下载PDF

导出

摘要为了提升隐私政策可读性并评价其质量,提出一种基于机器学习的中文隐私政策条款自动分类方法。首先,确立条款分类指标体系,从不同类别条款中提取特征;其次,建立和训练基于机器学习算法的层次多标签分类模型,在测试集上通过实验对比各算法性能;最后,基于分类结果检测隐私政策的虚假性和完整性,同时设计了隐私政策评价方法对其进行评分。实验结果表明,支持向量机模型在分类效果上优于其他模型,准确率达到86%,验证了该方法在自动分类隐私政策条款上的可行性。此外,对华为应用市场中1500篇隐私政策检测发现,其中38.5%不是隐私政策,余下隐私政策中92.5%的内容不完整,大部分得分偏低。 In order to improve the readability of privacy policy and evaluate its quality,an automatic classification method of Chinese privacy policy terms based on machine learning is proposed.Firstly,a clause classification index system is established to extract features from different categories of clauses.Then,a hierarchical multi-label classification model based on machine learning algorithms is established and trained,and the performance of each algorithm is compared through experiments on the test set.Finally,based on the classification results,the falseness and completeness of the privacy policy are detected,and at the same time,a privacy policy evaluation method is designed to score it.The experimental results indicate that the support vector machine model is superior to other models in the classification effect,with an accuracy rate of 86%,which verifies the feasibility of this method in the automatic classification of privacy policy terms.In addition,a test of 1,500 privacy policies in Huawei App Market shows that 38.5%of them are not privacy policies,and 92.5%of the remaining privacy policies are incomplete,and most scores are low.

作者朱璋颖陆亦恬唐祝寿张燕 ZHU Zhang-ying;LU Yi-tian;TANG Zhu-shou;ZHANG Yan(Pwnzen Information Technology Co.Ltd.,Shanghai 201100,China)

机构地区上海犇众信息技术有限公司

出处《通信技术》 2020年第11期2749-2757,共9页 Communications Technology

关键词隐私政策机器学习支持向量机多标签分类模型 privacy policy machine learning SVM multi-label classification model

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1赵波,刘贤刚,刘行,胡影.Android应用程序个人信息安全量化评估模型研究[J].通信技术,2020,53(8):2019-2026. 被引量：4
2丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10. 被引量：920
3朱颖.我国移动APP隐私保护政策研究——基于96个移动应用APP的分析[J].暨南学报（哲学社会科学版）,2017,39(12):107-114. 被引量：35
4付少雄,赵安琪.健康APP用户隐私保护政策调查分析——以《信息安全技术个人信息安全规范》为框架[J].图书馆论坛,2019,39(12):109-118. 被引量：30
5申琦.我国网站隐私保护政策研究:基于49家网站的内容分析[J].新闻大学,2015(4):43-50. 被引量：48

二级参考文献81

1徐敬宏.美国网络隐私权的行业自律保护及其对我国的启示[J].情报理论与实践,2008,31(6):955-956. 被引量：32
2周涛.基于内容分析法的网站隐私声明研究[J].杭州电子科技大学学报（社会科学版）,2009,5(3):11-16. 被引量：11
3李道国,苗夺谦,张东星,张红云.粒度计算研究综述[J].计算机科学,2005,32(9):1-12. 被引量：54
4孔锐,张冰.一种快速支持向量机增量学习算法[J].控制与决策,2005,20(10):1129-1132. 被引量：31
5李颖新,阮晓钢.基于支持向量机的肿瘤分类特征基因选取[J].计算机研究与发展,2005,42(10):1796-1801. 被引量：51
6刘松,林海萍.基于P3P的隐私数据访问机制[J].现代计算机,2005,11(12):37-39. 被引量：1
7彭礼堂,饶传平.网络隐私权的属性:从传统人格权到资讯自决权[J].法学评论,2006,24(1):57-62. 被引量：64
8战照鹏,付长龙,姚全珠.基于Pareto最佳解的P3P隐私协商机制研究[J].计算机应用研究,2006,23(2):119-121. 被引量：4
9谈咏梅,钱小平.我国网站隐私保护政策完善之建议[J].现代情报,2006,26(1):215-217. 被引量：27
10李东晖,杜树新,吴铁军.基于壳向量的线性支持向量机快速增量学习算法[J].浙江大学学报（工学版）,2006,40(2):202-206. 被引量：16

共引文献1016

1范海潮,顾理平.探寻平衡之道:隐私保护中知情同意原则的实践困境与修正[J].新闻与传播研究,2021(2):70-85. 被引量：45
2康琛笠,刘西青.基于PSO-SVM的矿用干式变压器局部放电模式识别[J].计算机产品与流通,2020,9(8):138-138. 被引量：1
3杜慧颖.信息系统强制行为安全研究——以三大电商平台为例[J].内蒙古科技与经济,2022(16):49-51.
4蒋月,Shaker ul Din,刘勇,张寅丹,刘巨峰,陆海霞.一种集成多分类器的面向地理对象遥感影像变化回溯分析方法[J].兰州大学学报（自然科学版）,2020(5):666-676. 被引量：1
5丁晓欣,刘凯.基于软间隔支持向量机的装配式建筑构件质量控制研究[J].建筑经济,2020(S02):62-67. 被引量：5
6王云锋,刘丹,裴作飞,姚丽霜.基于改进引力搜索算法的SVM的参数优化及应用[J].计算机应用研究,2020,37(S01):152-154. 被引量：7
7卢文,李霞.大数据时代不正当价格行为的规制及用户个人隐私保护研究[J].互联网金融法律评论,2018(2):83-96. 被引量：2
8严雨灵,陈闵叶,吕亚辉.基于Leap Motion的三维动态手势识别研究[J].智能计算机与应用,2020,0(1):271-273.
9张奕翔.算法时代的隐私保护:矛盾困境、路径方向及未来挑战[J].传媒论坛,2022,5(16):4-10. 被引量：2
10程平,何昱衡,辜榕容.基于支持向量机机器学习算法的项目人员绩效评价研究――基于A风景园林规划研究院规划设计类项目[J].中国管理会计,2020(1):32-43. 被引量：2

同被引文献26

1徐磊,郭旭.大数据时代读者个人信息保护的实践逻辑与规范路径——以图书类App隐私政策文本为视角[J].图书馆建设,2021(1):74-83. 被引量：34
2左虹,朱勇.中级欧美留学生汉语文本可读性公式研究[J].世界汉语教学,2014,28(2):263-276. 被引量：50
3梁晓丹,李颖灏,刘芳.在线隐私政策对消费者提供个人信息意愿的影响机制研究——信息敏感度的调节作用[J].管理评论,2018,30(11):97-107. 被引量：44
4刘百灵,夏惠敏,李延晖,梁丽婷.保健和激励双因素视角下影响移动支付意愿的实证研究[J].管理学报,2017,14(4):600-608. 被引量：34
5朱颖.我国移动APP隐私保护政策研究——基于96个移动应用APP的分析[J].暨南学报（哲学社会科学版）,2017,39(12):107-114. 被引量：35
6唐远清,赖星星.社交媒体隐私政策文本研究——基于Facebook与微信的对比分析[J].新闻与写作,2018,0(8):31-37. 被引量：20
7朱侯,张明鑫,路永和.社交媒体用户隐私政策阅读意愿实证研究[J].情报学报,2018,37(4):362-371. 被引量：57
8王靖瑜,徐明昆,王浩宇,徐国爱.Android应用隐私条例与敏感行为一致性检测[J].计算机科学与探索,2019,13(1):56-69. 被引量：4
9秦克飞.手机APP隐私政策的可读性研究[J].情报探索,2019(1):18-23. 被引量：17
10何培育,马雅鑫,涂萌.Web浏览器用户隐私安全政策问题与对策研究[J].图书馆,2019(2):19-26. 被引量：12

引证文献3

1王浩漪,阮树骅,陈兴蜀,郑涛.基于依存句法的Android App隐私条例解析算法[J].计算机应用研究,2022,39(7):1961-1965.
2刘晓建,彭玉坤.App合规性检测综述[J].计算机工程与应用,2023,59(3):1-12. 被引量：4
3朱侯,罗颖嘉,陈梦蕾,欧阳佳祥,肖颖,蔡伊南.基于知识库增强深度学习模型的隐私政策合规性研究——从完整性与语义冲突角度[J].数据分析与知识发现,2024,8(5):46-58. 被引量：2

二级引证文献6

1陈炎华,李炯彬,安淇雨.大数据时代智能终端移动应用App个人隐私合规性分析[J].质量与认证,2023(11):63-66. 被引量：1
2李畅畅.APP个人信息保护政策困境与应对路径[J].信息安全研究,2024,10(2):177-183. 被引量：1
3何艾星,郑旭飞,谢明天,何枘峰.面向APP应用的隐私合规的检测方法[J].人工智能科学与工程,2024(1):31-40.
4陈丽婷,王子豪,王爱青.移动应用隐私合规检查技术研究[J].无线互联科技,2024,21(16):95-98.
5陈梦蕾,罗颖嘉,朱侯.基于扎根理论和机器学习的隐私政策诱导同意研究[J].信息资源管理学报,2024,14(5):75-90.
6蔡智权,张娟.生成式AI嵌入数字政府的价值审思与路径展望[J].哈尔滨工业大学学报（社会科学版）,2024,26(6):151-160.

1李高峰,郝润梅,吴晓光.乡村振兴战略背景下的村庄规划编制类型划分[J].中国国土资源经济,2020,33(8):36-41. 被引量：19
2杨昌其,马梦尧,郝铭佟,王博.基于AHP-K均值聚类的中小机场空管运行保障分类[J].综合运输,2020,42(9):37-42.
3张继亮.代表理论的“建构性转向”:从霍布斯到萨沃德[J].新视野,2020(6):84-90.
4丁浩,刘同舫.鲍曼对“人的解放”的构思是否成立?[J].浙江社会科学,2020(11):97-102.
5叶绿,朱家懿,段婷.基于深度学习的行驶视觉图像分割模型设计[J].实验室研究与探索,2020,39(10):88-92. 被引量：5
6沈超,戴衡,陶东平.改进的分子相互作用体积模型(M-MIVM)在部分铜和铟液态合金中的应用[J].昆明理工大学学报（自然科学版）,2020(3):10-17. 被引量：1
7贡荣麟,施俊,王骏.面向乳腺超声图像分割的混合监督双通道反馈U-Net[J].中国图象图形学报,2020,25(10):2206-2217. 被引量：7
8李江静.马克思意识形态概念的内在一致性辨析与当代意识形态之建设[J].思想理论教育导刊,2020(10):44-50.
9王佳,金秀,王旭,李刚.基于时变Markov的DCC-GARCH模型最小风险套期保值研究[J].中国管理科学,2020,28(10):13-23. 被引量：9
10李金潮,邓道明,沈伟伟,高振宇,宫敬.气井积液机理和临界气速预测新模型[J].石油学报,2020,41(10):1266-1277. 被引量：10

通信技术

2020年第11期

浏览历史

内容加载中请稍等...

基于隐私政策条款和机器学习的应用分类被引量：3

参考文献5

二级参考文献81

共引文献1016

同被引文献26

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于隐私政策条款和机器学习的应用分类 被引量：3

参考文献5

二级参考文献81

共引文献1016

同被引文献26

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于隐私政策条款和机器学习的应用分类被引量：3