期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文分词在邮件过滤系统中的应用 被引量:3
1
作者 林珊 宁国宁 赵之霖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期112-116,共5页
针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用Φ2统计法生成新词,对词典起到了动态更新的作用,提高了分... 针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用Φ2统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025. 展开更多
关键词 分词 φ2统计法 最大匹配 垃圾邮件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部