-
题名基于客户端的个性化邮件再过滤系统
被引量:1
- 1
-
-
作者
徐丹丹
陈松灿
-
机构
南京航空航天大学计算机科学与技术学院
-
出处
《中国科学:信息科学》
CSCD
北大核心
2018年第12期1681-1696,共16页
-
基金
国家自然科学基金项目(批准号:61672281
61472186)资助
-
文摘
电子邮件是一种必不可少的通讯工具,但是众多的垃圾邮件会严重影响用户的工作和生活,甚至还会造成财产损失.由于兴趣、爱好的不同,用户对垃圾邮件的定义可能存在巨大差异,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题.当出现邮件错滤情况,用户不得不手动修改,这给用户体验带来了极大不便.为了有效解决上述问题,并实现个性化邮件过滤及错滤邮件自动修改等功能,本文结合规则和统计方法提出了一种基于客户端的个性化邮件再过滤系统.大部分现有的垃圾邮件过滤器仅对邮件数据流进行在线过滤,而未考虑不同邮箱的邮件类先验存在差异和类不平衡问题,本过滤系统首先对进入收件箱和垃圾箱的邮件进行分别处理,然后基于多任务学习原理设计了两个互学习的过滤器分别用于收件箱和垃圾箱的邮件再过滤,并对错滤邮件进行自动修改.同时,为保证在随时间变化的用户兴趣点和邮件数据分布情况下过滤器的性能,设计了结合重要性加权的多窗口学习框架,从而有效实现了过滤器的动态自适应.最后,在TREC 2006c和2007p数据集上验证了我们所提出的过滤器拥有显著的过滤效果.
-
关键词
垃圾邮件过滤
个性化邮件再过滤
自动修正
重要性加权
多任务学习
多窗口学习框架
-
Keywords
spam filtering
personalized mail re-filtering
automatic correction
importance weights
multi-task learning
multi-window learning framework
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
TP393.098
[自动化与计算机技术—计算机应用技术]
-