期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于改进的Porter Stemmer词干提取与核方法的垃圾邮件过滤算法 被引量:1
1
作者 孙汉博 冯国灿 《计算机科学》 CSCD 北大核心 2017年第S1期61-67,79,共8页
统计学习方法现已大量应用于垃圾邮件识别,其中表现突出的包括贝叶斯过滤器、支持向量机等。近年来,为应对日益严重的垃圾邮件问题,提出诸多改进算法或创新思路。通过改进Porter Stemmer并使之适用于垃圾邮件过滤,从而充分提取文本的有... 统计学习方法现已大量应用于垃圾邮件识别,其中表现突出的包括贝叶斯过滤器、支持向量机等。近年来,为应对日益严重的垃圾邮件问题,提出诸多改进算法或创新思路。通过改进Porter Stemmer并使之适用于垃圾邮件过滤,从而充分提取文本的有效特征,摒弃冗余信息,加强了过滤效果;将改进方法的Porter Stemmer与原方法分别应用于线性核、高斯核、多项式核支持向量机以及贝叶斯过滤器,对比实验结果可知,错误率分别下降了63.7%,63.1%,61.3%和11.4%,证明了改进方法的显著效果;另外,实验结果证明SVM过滤器显著优于贝叶斯过滤器,且能更大程度体现改进方法的优势;最后,给出多种定量评价和语义角度的分析,启发采用用户个性化定制的过滤器。 展开更多
关键词 垃圾邮件 SVM 核方法 SMO算法 porter stemmer
下载PDF
词干提取方法及工具的对比分析研究 被引量:13
2
作者 吴思竹 钱庆 +3 位作者 胡铁军 李丹亚 李军莲 洪娜 《图书情报工作》 CSSCI 北大核心 2012年第15期109-115,142,共8页
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取... 首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取研究的现有问题和未来发展趋势进行探讨。 展开更多
关键词 词形规范化 词干提取 波特算法 语言形态学
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部