期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进的Porter Stemmer词干提取与核方法的垃圾邮件过滤算法
被引量:
1
1
作者
孙汉博
冯国灿
《计算机科学》
CSCD
北大核心
2017年第S1期61-67,79,共8页
统计学习方法现已大量应用于垃圾邮件识别,其中表现突出的包括贝叶斯过滤器、支持向量机等。近年来,为应对日益严重的垃圾邮件问题,提出诸多改进算法或创新思路。通过改进Porter Stemmer并使之适用于垃圾邮件过滤,从而充分提取文本的有...
统计学习方法现已大量应用于垃圾邮件识别,其中表现突出的包括贝叶斯过滤器、支持向量机等。近年来,为应对日益严重的垃圾邮件问题,提出诸多改进算法或创新思路。通过改进Porter Stemmer并使之适用于垃圾邮件过滤,从而充分提取文本的有效特征,摒弃冗余信息,加强了过滤效果;将改进方法的Porter Stemmer与原方法分别应用于线性核、高斯核、多项式核支持向量机以及贝叶斯过滤器,对比实验结果可知,错误率分别下降了63.7%,63.1%,61.3%和11.4%,证明了改进方法的显著效果;另外,实验结果证明SVM过滤器显著优于贝叶斯过滤器,且能更大程度体现改进方法的优势;最后,给出多种定量评价和语义角度的分析,启发采用用户个性化定制的过滤器。
展开更多
关键词
垃圾邮件
SVM
核方法
SMO算法
porter
stemmer
下载PDF
职称材料
词干提取方法及工具的对比分析研究
被引量:
13
2
作者
吴思竹
钱庆
+3 位作者
胡铁军
李丹亚
李军莲
洪娜
《图书情报工作》
CSSCI
北大核心
2012年第15期109-115,142,共8页
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取...
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取研究的现有问题和未来发展趋势进行探讨。
展开更多
关键词
词形规范化
词干提取
波特算法
语言形态学
原文传递
题名
基于改进的Porter Stemmer词干提取与核方法的垃圾邮件过滤算法
被引量:
1
1
作者
孙汉博
冯国灿
机构
中山大学数学学院
出处
《计算机科学》
CSCD
北大核心
2017年第S1期61-67,79,共8页
基金
国家自然科学基金(61272338)部分资助
文摘
统计学习方法现已大量应用于垃圾邮件识别,其中表现突出的包括贝叶斯过滤器、支持向量机等。近年来,为应对日益严重的垃圾邮件问题,提出诸多改进算法或创新思路。通过改进Porter Stemmer并使之适用于垃圾邮件过滤,从而充分提取文本的有效特征,摒弃冗余信息,加强了过滤效果;将改进方法的Porter Stemmer与原方法分别应用于线性核、高斯核、多项式核支持向量机以及贝叶斯过滤器,对比实验结果可知,错误率分别下降了63.7%,63.1%,61.3%和11.4%,证明了改进方法的显著效果;另外,实验结果证明SVM过滤器显著优于贝叶斯过滤器,且能更大程度体现改进方法的优势;最后,给出多种定量评价和语义角度的分析,启发采用用户个性化定制的过滤器。
关键词
垃圾邮件
SVM
核方法
SMO算法
porter
stemmer
Keywords
Spam
SVM
Kernel function
SMO algorithm
porter stemmer
分类号
TP393.098 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
词干提取方法及工具的对比分析研究
被引量:
13
2
作者
吴思竹
钱庆
胡铁军
李丹亚
李军莲
洪娜
机构
中国医学科学院医学信息研究所
出处
《图书情报工作》
CSSCI
北大核心
2012年第15期109-115,142,共8页
基金
国家"十二五"科技支撑计划项目"科技知识组织体系的协同工作系统和辅助工具开发"(项目编号:2011BAH10B02)
中国医学科学院医学信息研究所基本科研业务费课题"基于语言网络的医学文本表示模型构建方法研究"(项目编号:11R0209)研究成果之一
文摘
首先,论述词干提取和语言形态学的关系。其次,对词干提取的主要算法和相关技术进行详细分类。而后,对词干提取方法的主要特点进行分析并对各类方法的优点、缺点和特点进行对比,并归纳实现词干提取功能的工具及其特点。最后,对词干提取研究的现有问题和未来发展趋势进行探讨。
关键词
词形规范化
词干提取
波特算法
语言形态学
Keywords
word normalization stemming
porter stemmer
morphology
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于改进的Porter Stemmer词干提取与核方法的垃圾邮件过滤算法
孙汉博
冯国灿
《计算机科学》
CSCD
北大核心
2017
1
下载PDF
职称材料
2
词干提取方法及工具的对比分析研究
吴思竹
钱庆
胡铁军
李丹亚
李军莲
洪娜
《图书情报工作》
CSSCI
北大核心
2012
13
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部