期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
Deep Neural Network Based Spam Email Classification Using Attention Mechanisms
1
作者 Md. Tofael Ahmed Mariam Akter +4 位作者 Md. Saifur Rahman Maqsudur Rahman Pintu Chandra Paul Miss. Nargis Parvin Almas Hossain Antar 《Journal of Intelligent Learning Systems and Applications》 2023年第4期144-164,共21页
Spam emails pose a threat to individuals. The proliferation of spam emails daily has rendered traditional machine learning and deep learning methods for screening them ineffective and inefficient. In our research, we ... Spam emails pose a threat to individuals. The proliferation of spam emails daily has rendered traditional machine learning and deep learning methods for screening them ineffective and inefficient. In our research, we employ deep neural networks like RNN, LSTM, and GRU, incorporating attention mechanisms such as Bahdanua, scaled dot product (SDP), and Luong scaled dot product self-attention for spam email filtering. We evaluate our approach on various datasets, including Trec spam, Enron spam emails, SMS spam collections, and the Ling spam dataset, which constitutes a substantial custom dataset. All these datasets are publicly available. For the Enron dataset, we attain an accuracy of 99.97% using LSTM with SDP self-attention. Our custom dataset exhibits the highest accuracy of 99.01% when employing GRU with SDP self-attention. The SMS spam collection dataset yields a peak accuracy of 99.61% with LSTM and SDP attention. Using the GRU (Gated Recurrent Unit) alongside Luong and SDP (Structured Self-Attention) attention mechanisms, the peak accuracy of 99.89% in the Ling spam dataset. For the Trec spam dataset, the most accurate results are achieved using Luong attention LSTM, with an accuracy rate of 99.01%. Our performance analyses consistently indicate that employing the scaled dot product attention mechanism in conjunction with gated recurrent neural networks (GRU) delivers the most effective results. In summary, our research underscores the efficacy of employing advanced deep learning techniques and attention mechanisms for spam email filtering, with remarkable accuracy across multiple datasets. This approach presents a promising solution to the ever-growing problem of spam emails. 展开更多
关键词 spam email Attention Mechanism Deep Neural Network Bahdanua Attention Scale Dot Product
下载PDF
An Online Malicious Spam Email Detection System Using Resource Allocating Network with Locality Sensitive Hashing
2
作者 Siti-Hajar-Aminah Ali Seiichi Ozawa +2 位作者 Junji Nakazato Tao Ban Jumpei Shimamura 《Journal of Intelligent Learning Systems and Applications》 2015年第2期42-57,共16页
In this paper, we propose a new online system that can quickly detect malicious spam emails and adapt to the changes in the email contents and the Uniform Resource Locator (URL) links leading to malicious websites by ... In this paper, we propose a new online system that can quickly detect malicious spam emails and adapt to the changes in the email contents and the Uniform Resource Locator (URL) links leading to malicious websites by updating the system daily. We introduce an autonomous function for a server to generate training examples, in which double-bounce emails are automatically collected and their class labels are given by a crawler-type software to analyze the website maliciousness called SPIKE. In general, since spammers use botnets to spread numerous malicious emails within a short time, such distributed spam emails often have the same or similar contents. Therefore, it is not necessary for all spam emails to be learned. To adapt to new malicious campaigns quickly, only new types of spam emails should be selected for learning and this can be realized by introducing an active learning scheme into a classifier model. For this purpose, we adopt Resource Allocating Network with Locality Sensitive Hashing (RAN-LSH) as a classifier model with a data selection function. In RAN-LSH, the same or similar spam emails that have already been learned are quickly searched for a hash table in Locally Sensitive Hashing (LSH), in which the matched similar emails located in “well-learned” are discarded without being used as training data. To analyze email contents, we adopt the Bag of Words (BoW) approach and generate feature vectors whose attributes are transformed based on the normalized term frequency-inverse document frequency (TF-IDF). We use a data set of double-bounce spam emails collected at National Institute of Information and Communications Technology (NICT) in Japan from March 1st, 2013 until May 10th, 2013 to evaluate the performance of the proposed system. The results confirm that the proposed spam email detection system has capability of detecting with high detection rate. 展开更多
关键词 MALICIOUS spam email Detection System INCREMENTAL Learning RESOURCE Allocating Network LOCALITY Sensitive HASHING
下载PDF
VGI and crowdsourced data credibility analysis using spam email detection techniques
3
作者 Saman Koswatte Kevin McDougall Xiaoye Liu 《International Journal of Digital Earth》 SCIE EI 2018年第5期520-532,共13页
Volunteered geographic information(VGI)can be considered a subset of crowdsourced data(CSD)and its popularity has recently increased in a number of application areas.Disaster management is one of its key application a... Volunteered geographic information(VGI)can be considered a subset of crowdsourced data(CSD)and its popularity has recently increased in a number of application areas.Disaster management is one of its key application areas in which the benefits of VGI and CSD are potentially very high.However,quality issues such as credibility,reliability and relevance are limiting many of the advantages of utilising CSD.Credibility issues arise as CSD come from a variety of heterogeneous sources including both professionals and untrained citizens.VGI and CSD are also highly unstructured and the quality and metadata are often undocumented.In the 2011 Australian floods,the general public and disaster management administrators used the Ushahidi Crowd-mapping platform to extensively communicate flood-related information including hazards,evacuations,emergency services,road closures and property damage.This study assessed the credibility of the Australian Broadcasting Corporation’s Ushahidi CrowdMap dataset using a Naïve Bayesian network approach based on models commonly used in spam email detection systems.The results of the study reveal that the spam email detection approach is potentially useful for CSD credibility detection with an accuracy of over 90%using a forced classification methodology. 展开更多
关键词 VGI crowdsourced data CREDIBILITY Bayesian networks spam emails
原文传递
A Solution for Fighting Spammer's Resources and Minimizing the Impact of Spam
4
作者 Samir A. Elsagheer Mohamed 《International Journal of Communications, Network and System Sciences》 2012年第7期416-422,共7页
Spam or unsolicited emails constitute a major threat to the Internet, the corporations, and the end-users. Statistics show that about 70% - 80% of the emails are spam. There are several techniques that have been imple... Spam or unsolicited emails constitute a major threat to the Internet, the corporations, and the end-users. Statistics show that about 70% - 80% of the emails are spam. There are several techniques that have been implemented to react to the spam on its arrival. These techniques consist in filtering the emails and placing them in the Junk or Spam folders of the users. Regardless of the accuracy of these techniques, they are all passive. In other words, they are like someone is hitting you and you are trying by all the means to protect yourself from these hits without fighting your opponent. As we know the proverbs 'The best defense is a good offense' or 'Attack is the best form of defense'. Thus, we believe that attacking the spammers is the best way to minimize their impact. Spammers send millions of emails to the users for several reasons and usually they include some links or images that direct the user to some web pages or simply to track the users. The proposed idea of attacking the spammers is by building some software to collect these links from the Spam and Junk folders of the users. Then, the software periodically and actively visit these links and the subsequent redirect links as if a user clicks on these links or as if the user open the email containing the tracking link. If this software is used by millions of users (included in the major email providers), then this will act as a storm of Distributed Denial of Service attack on the spammers servers and there bandwidth will be completely consumed by this act. In this case, no human can visit their sites because they will be unavailable. In this paper, we describe this approach and show its effectiveness. In addition, we present an application we have developed that can be used for this reason. 展开更多
关键词 spam emails Attacking spammers spam FILTERING Distributed DENIAL of Service ATTACKS Software Development
下载PDF
改进的朴素贝叶斯垃圾邮件过滤算法 被引量:11
5
作者 翟军昌 秦玉平 王春立 《计算机工程与应用》 CSCD 北大核心 2009年第14期145-148,共4页
介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤... 介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤器的召回率和精确率,并且降低了过滤器的错误率。 展开更多
关键词 垃圾邮件 朴素贝叶斯 信息增益 多变量贝努里事件模型
下载PDF
改进KNN算法在垃圾邮件过滤中的应用 被引量:14
6
作者 张俊丽 张帆 《现代图书情报技术》 CSSCI 北大核心 2007年第4期75-78,共4页
提出一种改进的KNN算法,并将其用于垃圾邮件的过滤问题。经实验证明,改进的算法能够降低K值和训练文本的分布对过滤效果的影响,减少垃圾邮件的误判和漏判,具有较好的过滤性能。
关键词 KNN 垃圾邮件过滤 文本分类
下载PDF
基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法 被引量:5
7
作者 廖明涛 张德运 李金库 《微电子学与计算机》 CSCD 北大核心 2007年第8期1-3,7,共4页
为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为"合法邮件"、"可疑邮件"和"垃圾邮件"3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的... 为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为"合法邮件"、"可疑邮件"和"垃圾邮件"3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的优点,对邮件进行初步分类;在第二阶段,基于垃圾邮件的发送特征,利用层次聚类算法进行相似性比较。实验表明,该方法能够显著提高垃圾邮件的查准率,降低对合法邮件的误判,更加符合实际应用需求。 展开更多
关键词 朴素贝叶斯 层次聚类 垃圾邮件过滤
下载PDF
改进NB算法在垃圾邮件过滤技术中的研究 被引量:6
8
作者 刘月峰 苑江浩 张晓琳 《微电子学与计算机》 CSCD 北大核心 2017年第4期115-120,共6页
朴素贝叶斯(NB)是一种简单高效的分类算法,且在垃圾邮件过滤中得到广泛应用,但是其属性间独立性的假设在一定程度上影响了分类效果.针对这一问题,提出一种改进的NB算法——FOA-NB算法.该算法将NB算法与果蝇优化算法(FOA)相结合,根据不... 朴素贝叶斯(NB)是一种简单高效的分类算法,且在垃圾邮件过滤中得到广泛应用,但是其属性间独立性的假设在一定程度上影响了分类效果.针对这一问题,提出一种改进的NB算法——FOA-NB算法.该算法将NB算法与果蝇优化算法(FOA)相结合,根据不同特征属性对分类的影响程度赋予不同的权值,通过FOA对权值进行优化,得到全局最优特征权向量,该算法在保留NB算法的简洁高效的优点的同时,通过权值优化获取更加具有决策性的特征属性,从而提高垃圾邮件过滤的正确率和召回率.通过仿真实验与NB算法、加权贝叶斯(WB)进行对比,结果表明FOA-NB算法使得垃圾邮件过滤效果得到明显改善,正确率和召回率均有所提高,且提高幅度约为5%. 展开更多
关键词 垃圾邮件 朴素贝叶斯 特征权重优化 果蝇优化算法
下载PDF
集成学习和主动学习相结合的个性化垃圾邮件过滤 被引量:4
9
作者 刘伍颖 王挺 《计算机工程与科学》 CSCD 北大核心 2011年第9期34-41,共8页
本文提出了一种个性化垃圾邮件过滤方法,它能够根据用户反馈自动学习出用户兴趣,并随时间的推移自动适应用户兴趣的变化。该方法首先抽取邮件的语言特征和行为特征构建多个基于规则的单独过滤器,然后采用SVM集成学习方法组合这些单独过... 本文提出了一种个性化垃圾邮件过滤方法,它能够根据用户反馈自动学习出用户兴趣,并随时间的推移自动适应用户兴趣的变化。该方法首先抽取邮件的语言特征和行为特征构建多个基于规则的单独过滤器,然后采用SVM集成学习方法组合这些单独过滤器的结果。为了提高学习速度、减少用户提供反馈的数量,本文采用了主动学习方法挑选更加富含知识的邮件请求用户给出反馈。实验结果表明:集成学习和主动学习相结合的个性化过滤方法在个性化程度、分类准确率、过滤速度以及自动学习能力等方面具有更好的性能。 展开更多
关键词 垃圾邮件过滤 个性化 集成学习 主动学习 支持向量机
下载PDF
前置式邮件过滤系统的设计与实现 被引量:2
10
作者 林祥 荆涛 李生红 《计算机工程与应用》 CSCD 北大核心 2005年第2期116-119,共4页
针对互联网垃圾邮件泛滥的现状,该文设计了一种新的前置式邮件过滤系统。该系统独立于原邮件服务器,动态统计各SMTP客户端的发信频率,同时使用基于有限自动机的DFSA算法,快速过滤各种常见汉字编码的电子邮件。对于拦截信件,系统开放必... 针对互联网垃圾邮件泛滥的现状,该文设计了一种新的前置式邮件过滤系统。该系统独立于原邮件服务器,动态统计各SMTP客户端的发信频率,同时使用基于有限自动机的DFSA算法,快速过滤各种常见汉字编码的电子邮件。对于拦截信件,系统开放必要的邮件转发恢复操作,从而把误拦正常信件的可能性降至最低。该文最后给出系统实现并且进行性能验证。 展开更多
关键词 垃圾邮件 前置 邮件过滤
下载PDF
垃圾邮件过滤技术研究 被引量:3
11
作者 胡永杰 卜红霞 《河北师范大学学报(自然科学版)》 CAS 北大核心 2006年第2期158-160,216,共4页
详尽介绍了现有的电子邮件过滤技术,分析了各种技术的特点,比较了它们的优缺点.对未来的研究方向进行了展望,提出了若干值得研究的问题.
关键词 垃圾邮件 邮件过滤 过滤技术
下载PDF
邮件过滤算法的比较 被引量:3
12
作者 李文斌 陈嶷瑛 +1 位作者 刘椿年 刘泰峰 《计算机工程与设计》 CSCD 北大核心 2008年第17期4433-4436,共4页
探讨了邮件过滤器的体系,介绍了6种常用的过滤算法。在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较。实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过... 探讨了邮件过滤器的体系,介绍了6种常用的过滤算法。在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较。实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过滤器时会得出相对乐观的结果;NB和k-NN的表现不稳定,对数据集的敏感程度较高。对于邮件过滤研究者了解、改进已有算法,提出新的算法有一定的参考价值。 展开更多
关键词 邮件过滤 电子邮件 过滤体系 垃圾电子邮件 数据挖掘
下载PDF
加强Sendmail邮件传输服务器安全性的研究 被引量:1
13
作者 杨大伟 赵旦峰 吕栗 《应用科技》 CAS 2005年第10期44-46,共3页
提出了一种基于Linux操作系统的邮件过滤服务器加强安全性的方法,在对邮件传输服务器软件Sendmail做了研究之后,给出了一系列使得邮件服务器更加安全可靠的解决方案.该方案能够在有效地抵制垃圾电子邮件的基础上,提高Sendmail邮件传输... 提出了一种基于Linux操作系统的邮件过滤服务器加强安全性的方法,在对邮件传输服务器软件Sendmail做了研究之后,给出了一系列使得邮件服务器更加安全可靠的解决方案.该方案能够在有效地抵制垃圾电子邮件的基础上,提高Sendmail邮件传输服务器的负载能力、抗攻击能力,并具有有效的流量控制功能. 展开更多
关键词 邮件传输服务器 垃圾邮件 LINUX SENDMAIL
下载PDF
结构化集成学习垃圾邮件过滤 被引量:12
14
作者 刘伍颖 王挺 《计算机研究与发展》 EI CSCD 北大核心 2012年第3期628-635,共8页
为了解决垃圾邮件过滤算法低计算复杂度与高分类准确率之间的矛盾,在多域学习框架下提出一种结构化集成学习思想,它根据文档结构组合多个基分类器的结果以追求更高分类性能.采用邮件文档的字符串特征生成多个轻量基分类器,并采用字符串... 为了解决垃圾邮件过滤算法低计算复杂度与高分类准确率之间的矛盾,在多域学习框架下提出一种结构化集成学习思想,它根据文档结构组合多个基分类器的结果以追求更高分类性能.采用邮件文档的字符串特征生成多个轻量基分类器,并采用字符串-频率索引存储标注数据,使得每次更新和查询的时间开销是常数量级.根据邮件文档的多域结构特性,提出历史域分类器效力线性组合权和当前域文档分类能力线性组合权.综合考虑历史域分类器效力和当前域文档分类能力,还提出一种能够提高整体分类准确率的综合线性组合权.在TREC立即全反馈垃圾邮件过滤任务上的实验结果表明:基于综合线性组合权的结构化集成学习方法能够在较短的时间(47.24min)内完成过滤任务,整体性能1-ROCA达到参加TREC2007评测的最优过滤器性能(0.005 5). 展开更多
关键词 垃圾邮件过滤 结构化集成学习 多域结构 线性组合权 轻量基分类器 TREC垃圾邮件任务
下载PDF
一种智能垃圾邮件过滤模型的仿真研究 被引量:4
15
作者 雷剑刚 孙细斌 《计算机仿真》 CSCD 北大核心 2013年第5期370-373,407,共5页
研究垃圾邮件过滤准确率问题,电子邮件是一种高维、复杂的特殊文本,单一支持向量机、K近邻等传统模型均难以识别垃圾邮件,导致过滤正确率低。为了提高了垃圾邮件过滤正确率,提出一种K近邻和支持向量机相融合的垃圾邮件过滤模型(SVM-KNN... 研究垃圾邮件过滤准确率问题,电子邮件是一种高维、复杂的特殊文本,单一支持向量机、K近邻等传统模型均难以识别垃圾邮件,导致过滤正确率低。为了提高了垃圾邮件过滤正确率,提出一种K近邻和支持向量机相融合的垃圾邮件过滤模型(SVM-KNN)。首先将邮件特征向量输入到支持向量机学习,找到支持向量集,然后计算待识别邮件与最优超平面间的距离,距离大于阈值,便采用支持向量机识别邮件类型,否则用K近邻识别邮件类型。仿真结果表明,SVM-KNN很好地解决单一模型存在的难题,提高了垃圾邮件过滤正确率,是一种有效的电子邮件管理的手段。 展开更多
关键词 电子邮件 垃圾邮件 支持向量机 近邻算法 过滤
下载PDF
云环境下NB算法的垃圾邮件过滤研究 被引量:4
16
作者 刘月峰 张亚斌 苑江浩 《微电子学与计算机》 CSCD 北大核心 2018年第8期60-63,共4页
朴素贝叶斯算法在解决垃圾邮件分类领域内具有较高的准确性,能够很好的将邮件区分开来,但是在分类前期的训练阶段却会大量耗用系统和网络资源,严重影响分类效率.为此引入spark平台.以并行的思想去解决邮件分类问题,利用spark计算平台RD... 朴素贝叶斯算法在解决垃圾邮件分类领域内具有较高的准确性,能够很好的将邮件区分开来,但是在分类前期的训练阶段却会大量耗用系统和网络资源,严重影响分类效率.为此引入spark平台.以并行的思想去解决邮件分类问题,利用spark计算平台RDD的血缘关系合理的安排NB邮件分类的各个过程.实验结果表明,与其他传统的分类方法对比而言,朴素贝叶斯在精确率,召回率等方面具有很好的效果,并且与传统单机下的邮件分类,本次实验因引入分布式的思想,利用spark集群的优势大大加快了分类的速率. 展开更多
关键词 垃圾邮件 朴素贝叶斯 spark计算平台 分布式
下载PDF
基于多Agent的垃圾邮件过滤系统的研究 被引量:1
17
作者 翟军昌 秦玉平 王春立 《长春理工大学学报(自然科学版)》 2009年第2期268-272,共5页
单一的垃圾邮件过滤技术已经不能有效阻止不断出现的新型垃圾邮件,基于多Agent技术结合现有垃圾邮件过滤技术建立一个多技术整合分层过滤的垃圾邮件过滤系统。该系统在服务器端主要对一些具有反动、色情和病毒特征的邮件进行强制过滤,... 单一的垃圾邮件过滤技术已经不能有效阻止不断出现的新型垃圾邮件,基于多Agent技术结合现有垃圾邮件过滤技术建立一个多技术整合分层过滤的垃圾邮件过滤系统。该系统在服务器端主要对一些具有反动、色情和病毒特征的邮件进行强制过滤,在客户端可以根据用户的兴趣选择进行个性化过滤。 展开更多
关键词 多AGENT系统 垃圾邮件 黑名单 白名单 朴素贝叶斯
下载PDF
基于改进贝叶斯决策的邮件过滤 被引量:2
18
作者 薛正元 《计算机工程与应用》 CSCD 2013年第7期98-101,125,共5页
探讨了基于概率阈值的贝叶斯邮件过滤模型的局限性:由于很少考虑所设定阈值的适用性和实用性,损失了一定的召回率。改进贝叶斯决策,提出了基于随机变量的较小错误分类决策方法;针对邮件处理的特殊性,进一步提出了基于随机变量的较小风... 探讨了基于概率阈值的贝叶斯邮件过滤模型的局限性:由于很少考虑所设定阈值的适用性和实用性,损失了一定的召回率。改进贝叶斯决策,提出了基于随机变量的较小错误分类决策方法;针对邮件处理的特殊性,进一步提出了基于随机变量的较小风险分类决策方法。实验结果表明,处理普通文本分类问题时,前者的分类决策效果更好;而后者在处理邮件问题时性能更优,能够在保持较小误判风险的同时,提高贝叶斯邮件过滤器的召回率以及F值。 展开更多
关键词 垃圾邮件 邮件过滤 概率 阈值 分类决策
下载PDF
用户反馈自适应的POP3邮件过滤代理模型 被引量:1
19
作者 张巍 逄仁波 +1 位作者 庞彦伟 曲海鹏 《天津大学学报》 EI CAS CSCD 北大核心 2009年第2期159-167,共9页
为了有效接受邮件客户端反馈并自动根据邮件客户端反馈对邮件过滤系统做出调整,提出了用户反馈自适应的POP3邮件过滤代理模型SAMFUF(self-adaptive mail filtering POP3 proxy based on users’feedback).SAMFUF采用异步连接模拟同步连... 为了有效接受邮件客户端反馈并自动根据邮件客户端反馈对邮件过滤系统做出调整,提出了用户反馈自适应的POP3邮件过滤代理模型SAMFUF(self-adaptive mail filtering POP3 proxy based on users’feedback).SAMFUF采用异步连接模拟同步连接方式建立邮件客户端和邮件服务器间POP3连接,实现了邮件客户端与邮件服务器间的透明性连接;将最大熵、贝叶斯和支持向量机等基于内容过滤的方法从邮件过滤系统中独立出来,实现了通用邮件过滤系统的设计;通过在邮件中插入包含邮件唯一标识、分类结果等信息的HTML表单的标签以及调整邮件过滤模型,实现了基于邮件客户端的用户反馈以及邮件过滤系统的自适应功能;采用线程池管理线程和overlapped I/O事件通信方式实现邮件客户端与邮件服务器间通信,实现了邮件过滤服务的高效率和稳定性.实验表明,SAMFUF在垃圾邮件过滤上具有较高的效率和准确率. 展开更多
关键词 电子邮件 POP3 反垃圾邮件 邮件过滤
下载PDF
基于套索(Lasso)的中文垃圾邮件过滤 被引量:1
20
作者 徐征 刘遵雄 张贤龙 《华东交通大学学报》 2014年第4期130-135,共6页
使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮... 使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮件过滤,建立Lasso回归邮件分类模型、Lasso回归词条选择结合逻辑回归的分类模型,结合中文文本垃圾邮件数据集TREC06C进行垃圾邮件过滤实验。实验结果表明Lasso回归词条选择结合逻辑回归的邮件分类模型性能更佳。 展开更多
关键词 中文文本邮件 垃圾邮件 过滤 Lasso 逻辑回归
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部