-
题名基于特征加权的网络不良内容识别方法
被引量:5
- 1
-
-
作者
俞浩亮
王秋森
冯旭鹏
刘利军
傅铁威
黄青松
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机技术应用重点实验室
-
出处
《现代电子技术》
北大核心
2016年第3期76-79,共4页
-
基金
国家自然科学基金资助项目(81360230)
科技部科技型中小企业技术创新基金资助项目(13C26215305404)
-
文摘
网络上不良信息的出现是困扰社会精神健康发展的"顽疾",如果不进行有效的过滤,会给搜索服务带来不良影响,极大的影响了社会的和谐稳定发展。提出一种基于特征加权的网络不良内容识别方法,在对网页上的文本预处理后,引入针对不良内容的加权方法,然后再结合KNN、朴素贝叶斯、SVM三种文本分类方法进行实验对比。对比实验结果表明,所采用的方法在识别网络不良内容上的准确率和召回率都有较大提高。
-
关键词
互联网
不良内容
特征加权
内容识别
-
Keywords
Internet
undesirable content
feature weighting
content identification
-
分类号
TN711-34
[电子电信—电路与系统]
-
-
题名基于LDA的微博用户粉丝亲密度评价模型
被引量:3
- 2
-
-
作者
王秋森
俞浩亮
徐浩诚
冯旭鹏
刘利军
黄青松
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学教育技术与网络中心
云南省计算机技术应用重点实验室
-
出处
《计算机应用与软件》
CSCD
2016年第10期67-71,共5页
-
基金
国家自然科学基金项目(81360230)
科技部科技型中小企业技术创新基金项目(13C26215305404)
-
文摘
用户关系是目前微博研究的热门方向,微博用户亲密度评价在对用户隐含亲密粉丝的发现、微博网络环境优化等方面具有重要意义。目前微博用户群体庞大且关系复杂,仅从用户自身出发,以用户特征和关系网络等为依据对用户关系亲密度评价的准确率太低。针对这一问题,提出基于LDA的微博用户粉丝亲密度评价模型。首先,对用户粉丝集中非活跃粉丝过滤剔除,获取其活跃粉丝。然后,利用LDA主题模型对用户某时间段所发微博集进行训练,获取用户阶段性微博的主题分布;同时通过主题分布推断其兴趣取向分布,并利用余弦相似方法计算用户与其粉丝之间的兴趣相似度。最后,结合用户的背景相似度和关系紧密度,为用户建立综合的亲密度评价标准。通过新浪API接口抓取微博近期相关数据,组成实验数据集。在数据集上基于评价的推荐实验结果表明,所提出的模型方法具有较高的准确率和有效性。
-
关键词
亲密度
LDA粉丝
主题模型
相似度
-
Keywords
Intimacy;LDA;Follows( fans);Theme model;Similarity
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-