-
题名常见中文社交平台中网络欺凌语言的检测分析
被引量:1
- 1
-
-
作者
柳致远
范永胜
张万里
冯骥
李勇
黄靖
-
机构
重庆师范大学计算机与信息科学学院
国网四川电力公司天府新区供电公司
-
出处
《西南师范大学学报(自然科学版)》
CAS
2021年第8期86-94,共9页
-
基金
国家自然科学基金——青年基金项目(62003065)
重庆师范大学(人才引进/博士启动)基金项目(17XCB008)
+1 种基金
教育部人文社会科学研究项目(18XJC880002)
重庆市教育委员会科技项目(KJQN201800539).
-
文摘
当今中文社交平台中网络欺凌语言十分盛行,而传统的平台管理员人工审核的方式已无法有效地对其进行检测与分析.为解决这一难题,首先,我们提取了十几个典型的中文社交平台中的部分样本进行人工标注,构建了一个训练数据集.然后,我们分别使用朴素贝叶斯、支持向量机、长短期记忆神经网络构建分类模型,对未标注的数据进行分类识别处理.实验表明:选取的分类模型均能有效地识别出网络欺凌语言,其准确率分别是0.87,0.79,0.88.其中长短期记忆神经网络综合效果最佳.由此得出的结论为:借助大数据手段建立的分类模型,能快速地检测出社交平台上的原始数据中网络欺凌语言的存在.最后,我们对含有网络欺凌语言的评论与用户等级、发表时间等属性上的相关性做了分析,并拟合出高斯分布模型.
-
关键词
自然语言处理
网络欺凌语言
文本分类
中文社交平台
大数据模型
-
Keywords
natural language processing
cyberbullying language
text classification
Chinese social platform
big data model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-