期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
基于Winnow的中文邮件分类器的设计
1
作者 朱巧明 周志军 李培峰 《电子学报》 EI CAS CSCD 北大核心 2005年第B12期2481-2484,共4页
本文首先通过建立实验用中文邮件语料库,提出了用Winnow算法实现邮件分类器,并讨论了其特点,然后,文章提出了通过建立分类规则库改善邮件分类器的分类效果.实验证明,该方法能有效提高邮件分类的可信度.
关键词 WINNOW 中文邮件分类 中文邮件语料库 分类器
下载PDF
基于Winnow的中文邮件分类器的设计
2
作者 朱巧明 周志军 李培峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期807-812,共6页
首先通过建立实验用中文邮件语料库,提出了用Winnow算法实现邮件分类器,并讨论了其特点.然后,提出了通过建立分类规则库改善邮件分类器的分类效果.实验证明,该方法能有效提高邮件分类的可信度.
关键词 WINNOW 中文邮件分类 中文邮件语料库 分类器
下载PDF
基于邮件过滤的中文邮件语料库构建 被引量:3
3
作者 李军辉 朱巧明 李培峰 《计算机应用与软件》 CSCD 北大核心 2007年第8期56-58,121,共4页
首先分析了现阶段邮件过滤的主要技术和邮件语料库建设的现状,并提出了建设中文邮件语料库的相关问题,建议在邮件建设过程中保留邮件信头信息、不排斥邮件副本。然后给出了邮件语料库系统的实现框架,分为邮件源代码的解析与预处理、邮... 首先分析了现阶段邮件过滤的主要技术和邮件语料库建设的现状,并提出了建设中文邮件语料库的相关问题,建议在邮件建设过程中保留邮件信头信息、不排斥邮件副本。然后给出了邮件语料库系统的实现框架,分为邮件源代码的解析与预处理、邮件的初次标注、词分类和邮件的二次标注四个步骤,并通过提供一个管理工具来管理邮件语料。最后,介绍了目前已经建设的一个邮件语料库的情况。 展开更多
关键词 邮件过滤 中文邮件语料库 标注 XML
下载PDF
客户端中文邮件过滤算法研究
4
作者 包理群 马宏锋 李祥林 《兰州交通大学学报》 CAS 2010年第3期100-103,共4页
提出了改进的最小风险贝叶斯邮件过滤算法,将其应用于客户端中文邮件过滤,以适应邮件分类的个性化需求.实验结果表明,将改进算法应用于中文邮件过滤是可行的,且与传统贝叶斯算法相比,使垃圾邮件的误报率明显降低;实验测试了损失因子、... 提出了改进的最小风险贝叶斯邮件过滤算法,将其应用于客户端中文邮件过滤,以适应邮件分类的个性化需求.实验结果表明,将改进算法应用于中文邮件过滤是可行的,且与传统贝叶斯算法相比,使垃圾邮件的误报率明显降低;实验测试了损失因子、特征数量对过滤效果的影响,得出了较优的参数设定,对中文邮件过滤提出了有益的思路. 展开更多
关键词 贝叶斯算法 中文邮件过滤 特征数量 损失因子
下载PDF
一种改进自动更新的中文邮件过滤模型的设计
5
作者 苏艳刚 《电脑知识与技术(过刊)》 2013年第7X期4706-4709,共4页
该文提出了一种改进的基于用户操作信息自动学习的贝叶斯算法,该算法在最小风险贝叶斯算法的基础上,自动学习新样本,弥补了传统的贝叶斯分类器不能及时更新的缺陷。建立自动更新的中文邮件过滤模型,通过搭建实验平台测试对比分析改进的... 该文提出了一种改进的基于用户操作信息自动学习的贝叶斯算法,该算法在最小风险贝叶斯算法的基础上,自动学习新样本,弥补了传统的贝叶斯分类器不能及时更新的缺陷。建立自动更新的中文邮件过滤模型,通过搭建实验平台测试对比分析改进的基于用户操作信息自动学习的贝叶斯算法的综合性能。 展开更多
关键词 中文邮件过滤模型 贝叶斯分类算法 自动学习
下载PDF
基于贝叶斯算法的中文邮件过滤系统设计
6
作者 刘延华 林嘉雯 《福建电脑》 2009年第11期7-8,共2页
本文针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于贝叶斯算法的中文垃圾邮件过滤模型。实验结果表明,所设计的邮件过滤算法在召回率和准确率上具有良好的应用效果。
关键词 中文垃圾邮件 贝叶斯 特征选择
下载PDF
让Red Hat支持中文邮件收发
7
作者 宋建龙 《开放系统世界》 2003年第10期63-63,共1页
对用户来说,使用Linux最麻烦的事就是中文化问题。Red Hat从7.2版开始,已经支持在安装时选择系统语言地区,但中文支持得不是很好。Red Hat8.0在易用性上比7.2有了较大的提升,不过其默认的邮件收发工具——Mozilla Mail并不自动调整... 对用户来说,使用Linux最麻烦的事就是中文化问题。Red Hat从7.2版开始,已经支持在安装时选择系统语言地区,但中文支持得不是很好。Red Hat8.0在易用性上比7.2有了较大的提升,不过其默认的邮件收发工具——Mozilla Mail并不自动调整成为中文。下面就介绍如何设置Mozilla Mail来完全支持中文。 展开更多
关键词 LINUX操作系统 RED HAT 中文邮件 易用性
下载PDF
3721推出全球首个中文邮件 即日开始预注册
8
《信息化建设》 2003年第8期62-63,共2页
关键词 3721公司 中文电子邮件 网络注册 网址
下载PDF
建设与众不同的中文邮件系统
9
作者 叶怡萍 《互联网周刊》 2001年第17期109-110,共2页
中文域名,目前网上最热闹的话题之一,在中文域名给国人带来方便的同时,互联网上一个更大的变革正在酝酿着。如果说域名是网络的生命,那电子邮件或许就是生命的一个具体体现。据统计,截止1999年底,全球的电子邮件账号已达5.69亿个,专家预... 中文域名,目前网上最热闹的话题之一,在中文域名给国人带来方便的同时,互联网上一个更大的变革正在酝酿着。如果说域名是网络的生命,那电子邮件或许就是生命的一个具体体现。据统计,截止1999年底,全球的电子邮件账号已达5.69亿个,专家预测,到此为止2001年电子邮件的账号将达10亿个,同时根据国内权威组织中国互联网络信息中心的调查数字表明,目前中国87.65%的上网用户上网的主要目的是使用电子邮件。 展开更多
关键词 中文域名 中文电子邮件系统 因特网
下载PDF
一种基于内容和ERNIE3.0-CapsNet的中文垃圾邮件识别方法
10
作者 单晨棱 张新有 +1 位作者 邢焕来 冯力 《信息安全研究》 CSCD 北大核心 2024年第3期233-240,共8页
针对目前中文垃圾邮件识别方法中的深度学习检测方法词向量表示不足和特征提取丰富度欠缺的问题,提出融合ERNIE3.0预训练模型的胶囊神经网络改进识别模型——ERNIE3.0-CapsNet.对于中文垃圾邮件内容文本,利用ERNIE3.0生成对于知识具备... 针对目前中文垃圾邮件识别方法中的深度学习检测方法词向量表示不足和特征提取丰富度欠缺的问题,提出融合ERNIE3.0预训练模型的胶囊神经网络改进识别模型——ERNIE3.0-CapsNet.对于中文垃圾邮件内容文本,利用ERNIE3.0生成对于知识具备优异记忆和推理能力且语义丰富的词向量矩阵,再使用胶囊神经网络进行特征提取及分类,对于胶囊神经网络,改进了结构并使用GELU作为其动态路由的激活函数,设计了5组同类模型和4组激活函数的对比实验.在开源的TREC06C中文邮件数据集上,提出的ERNIE3.0-CapsNet模型效果在总体上表现突出,其准确率达到99.45%.实验结果表明,ERNIE3.0-CapsNet优于ERNIE3.0-TextCNN,ERNIE3.0-RNN等方法,证明了该模型在中文垃圾邮件识别效果的有效性和优异性. 展开更多
关键词 中文垃圾邮件 ERNIE3.0 胶囊神经网络 激活函数 文本分类
下载PDF
基于贝叶斯算法的中文垃圾邮件过滤系统研究 被引量:15
11
作者 刘浩然 丁攀 +2 位作者 郭长江 常金凤 崔静闯 《通信学报》 EI CSCD 北大核心 2018年第12期151-159,共9页
目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提... 目前大部分中文垃圾邮件过滤系统受文本稀疏及模型特征局限的影响较大,其特征高维和特征局限的缺陷成为制约过滤效果的重要因素。针对特征高维问题,提出一种基于中心词扩展的TF-IDF(term frequency-inverse document frequency)特征提取算法,增加了特征节点的表达能力,实现了特征降维。针对分类模型特征局限和属性间条件独立性假设不成立问题,提出一种基于GWO_GA(grey wolf optimizer-genetic algorithm)结构学习算法的3层贝叶斯网络模型,放松了条件独立性假设,增加了特征多样性,最终形成基于中心词扩展的TF-IDF特征提取及GWO_GA结构学习的3层贝叶斯算法。通过大量中文邮件数据验证,算法可明显提高中文垃圾邮件过滤效果。 展开更多
关键词 贝叶斯网络 TF-IDF 遗传算法 短文本分类 中文垃圾邮件过滤
下载PDF
抗好词攻击的中文垃圾邮件过滤模型 被引量:5
12
作者 邓蔚 秦志光 +1 位作者 刘峤 程红蓉 《电子测量与仪器学报》 CSCD 2010年第12期1146-1152,共7页
针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多... 针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多示例学习而言,当一封邮件中至少有一个示例为垃圾信息时,该邮件为垃圾邮件,否则为正常邮件。分别对训练数据集和测试数据集进行好词攻击,在多个大规模中文垃圾邮件过滤公开数据库上进行了测试。实验结果表明,在中文邮件过滤领域对抗好词攻击,分类器使用多示例反击策略较之于单示例反击策略有更强的鲁棒性。 展开更多
关键词 中文垃圾邮件过滤 敌手学习 多示例学习 逻辑回归 好词攻击 鲁棒性
下载PDF
高性能中文垃圾邮件过滤器 被引量:7
13
作者 齐浩亮 程晓龙 +3 位作者 杨沐昀 何晓宁 李生 雷国华 《中文信息学报》 CSCD 北大核心 2010年第2期76-83,共8页
设计并实现了基于在线过滤模式高性能中文垃圾邮件过滤器,能够较好地识别不断变化的垃圾邮件。以逻辑回归模型为基础,该文提出了字节级n元文法提取邮件特征,并采用TONE(Train On or Near Error)方法训练过滤器。在多个大规模中文垃圾邮... 设计并实现了基于在线过滤模式高性能中文垃圾邮件过滤器,能够较好地识别不断变化的垃圾邮件。以逻辑回归模型为基础,该文提出了字节级n元文法提取邮件特征,并采用TONE(Train On or Near Error)方法训练过滤器。在多个大规模中文垃圾邮件过滤公开评测数据上的实验结果表明,该文过滤器的性能在TREC 06C数据上优于当年评测的最好成绩,在SEWM07立即反馈上1-ROCA值达到了0.000 0%,并明显优于SEWM08评测在线过滤任务中的所有其他方法。 展开更多
关键词 计算机应用 中文信息处理 中文垃圾邮件过滤 在线学习 逻辑回归模型 字节级n元文法 TONE
下载PDF
基于套索(Lasso)的中文垃圾邮件过滤 被引量:1
14
作者 徐征 刘遵雄 张贤龙 《华东交通大学学报》 2014年第4期130-135,共6页
使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮... 使用向量空间模型表示的文本邮件数据高维而稀疏,不利于邮件过滤分类模型的建立,通常需在分类器训练前进行维数约减。Lasso回归是一种基于l1正则化的多元线性模型,其在模型参数估计的同时实现了变量选择。提出使用Lasso回归进行垃圾邮件过滤,建立Lasso回归邮件分类模型、Lasso回归词条选择结合逻辑回归的分类模型,结合中文文本垃圾邮件数据集TREC06C进行垃圾邮件过滤实验。实验结果表明Lasso回归词条选择结合逻辑回归的邮件分类模型性能更佳。 展开更多
关键词 中文文本邮件 垃圾邮件 过滤 Lasso 逻辑回归
下载PDF
中文垃圾邮件多层次过滤技术的应用研究 被引量:1
15
作者 刘延华 陈国龙 《计算机工程与应用》 CSCD 北大核心 2009年第34期94-97,129,共5页
针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于改进最小风险贝叶斯算法的多层次垃圾邮件过滤方法,并研究了其中关键应用技术。实验结果表明,所设计的多层次过滤算法不但在召回率和准确率上具有一定优势,还具有较高的过滤速率,... 针对当前中文垃圾邮件过滤中存在的问题,提出了一种基于改进最小风险贝叶斯算法的多层次垃圾邮件过滤方法,并研究了其中关键应用技术。实验结果表明,所设计的多层次过滤算法不但在召回率和准确率上具有一定优势,还具有较高的过滤速率,实际应用性较强。 展开更多
关键词 中文垃圾邮件 多层次过滤 最小风险贝叶斯 特征选择
下载PDF
基于中文域名的邮件系统研究
16
作者 张京鹏 胡安廷 《计算机系统应用》 2007年第7期45-48,53,共5页
本文提出将中文域名邮件系统分为邮件应用层、邮件表示层和邮件寻址投递层的3层结构模型。集中阐述了邮件应用层应具有的功能特性,重点讨论了邮件表示层中实现中文邮件地址而使用的punycode编码方案及其相关情况,分析并实现了邮件寻址... 本文提出将中文域名邮件系统分为邮件应用层、邮件表示层和邮件寻址投递层的3层结构模型。集中阐述了邮件应用层应具有的功能特性,重点讨论了邮件表示层中实现中文邮件地址而使用的punycode编码方案及其相关情况,分析并实现了邮件寻址投递层中中文电子邮件地址的处理。 展开更多
关键词 中文域名 Punycode 邮件系统 中文邮件地址
下载PDF
基于文本分类的中文垃圾邮件过滤技术研究
17
作者 朱军 饶元 +2 位作者 傅雷扬 张宁 刘锴 《长江大学学报(自科版)(上旬)》 2012年第1X期102-105,共4页
由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合... 由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合,设计了一种中文垃圾邮件过滤方法,详细阐述了中文邮件过滤的邮件预处理、中文分词、特征选取等技术.试验结果表明,该方法可以明显改善中文垃圾邮件过滤效果. 展开更多
关键词 中文垃圾邮件 过滤 文本分类 BAYES分类 特征选取
下载PDF
基于图正则化MNMF的中文垃圾邮件过滤
18
作者 刘遵雄 黄志强 +1 位作者 郑淑娟 石菲 《计算机应用研究》 CSCD 北大核心 2013年第9期2672-2676,共5页
利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理。最大间隔Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保持... 利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理。最大间隔Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保持数据空间的几何结构。基于以上两种NMF改进模型,提出了图正则化MNMF(graph regularized MNMF,GMNMF)算法,并设计了一个迭代的求解算法。将GMNMF算法及其他相关算法用于中文垃圾邮件过滤实验,结果表明GMNMF算法构建的过滤模型要优于其他较好的算法构建的过滤模型。 展开更多
关键词 向量空间模型 维数约减 最大间隔Semi—NMF 图正则化MNMF 中文垃圾邮件过滤
下载PDF
Novell中文电子邮件软件设计
19
作者 林南晖 《汕头大学学报(自然科学版)》 1995年第1期60-66,共7页
本文讨论了在Netware网络环境下运行的中文电子邮件软件的设计.文中所述的中文电子邮件在中文支持、多服务器间邮件传递,目标服务器关闭情况下邮件的存储待发等诸方面,有着独特之处.与国外的产品相比,这些特点正是中国网络... 本文讨论了在Netware网络环境下运行的中文电子邮件软件的设计.文中所述的中文电子邮件在中文支持、多服务器间邮件传递,目标服务器关闭情况下邮件的存储待发等诸方面,有着独特之处.与国外的产品相比,这些特点正是中国网络应用实际情况所需要的.文中还介绍了该邮件软件在同时兼容“智能”中文系统与“非智能”中文系统上所采取的方法;另外还谈到了开发中所发现的一些关于Netware的重要事实,而这些事实在过去是大多数Netware用户所未认识到的. 展开更多
关键词 电子邮件 网络操作系统 中文电子邮件 软件开发
下载PDF
一种基于动态特征词典的SVM中文电子邮件过滤方法 被引量:1
20
作者 侯岩 王文剑 《计算机科学》 CSCD 北大核心 2008年第3期49-51,共3页
随着电子邮件的广泛应用,泛滥成灾的垃圾邮件对人们的生活和网络安全带来了严重的威胁,反垃圾邮件问题已成为全球性的具有现实意义的问题。本文提出了一种基于动态特征词典的SVM中文邮件过滤方法,通过动态构造特征词典以及选择合适的支... 随着电子邮件的广泛应用,泛滥成灾的垃圾邮件对人们的生活和网络安全带来了严重的威胁,反垃圾邮件问题已成为全球性的具有现实意义的问题。本文提出了一种基于动态特征词典的SVM中文邮件过滤方法,通过动态构造特征词典以及选择合适的支持向量机(Support Vector Machine,SVM)核参数,有效地提高了垃圾邮件的过滤精度,实验结果超过了网易免费邮所公布的过滤指标。 展开更多
关键词 支持向量机 中文电子邮件 过滤 动态特征词典
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部