-
题名基于贝叶斯统计法的垃圾邮件过滤研究
被引量:1
- 1
-
-
作者
翟正德
李伟
王鹏
-
机构
山东理工大学计算机教学部
青岛即墨第一中学计算机教研室
山东理工大学校友联谊办公室
-
出处
《山东理工大学学报(自然科学版)》
CAS
2005年第4期31-34,共4页
-
文摘
介绍了采用贝叶斯统计法过滤垃圾邮件的算法,通过简单贝叶斯过滤算法的研究,引入了派生的贝叶斯过滤算法———零散二元多项式散列法过滤技术,它能够处理单个的特征词和变异的特征词汇.零散二元多项式散列法和贝叶斯统计法的整合,可以建立一个功能强大的垃圾邮件过滤器.
-
关键词
垃圾邮件
过滤
贝叶斯统计法
零散二元多项式散列法
-
Keywords
spam
filtering
Bayesian statistical method
the sparse binary polynomial hash method
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于离散哈希的聚类
- 2
-
-
作者
轩书婷
刘惊雷
-
机构
烟台大学计算机与控制工程学院
-
出处
《计算机应用》
CSCD
北大核心
2022年第3期713-723,共11页
-
基金
国家自然科学基金资助项目(62072391)
山东省自然科学基金资助项目(ZR2020MF148)。
-
文摘
传统的聚类方法是在数据空间进行,且聚类数据的维度较高。为了解决这两个问题,提出了一种新的二进制图像聚类方法——基于离散哈希的聚类(CDH)。该框架通过L21范数实现自适应的特征选择,从而降低数据的维度;同时通过哈希方法将数据映射到二进制的汉明空间,随后,在汉明空间中对稀疏的二进制矩阵进行低秩矩阵分解,完成图像的快速聚类;最后使用可以快速收敛的优化方案来对目标函数进行优化求解。在Caltech101、Yale、COIL20、ORL图像数据集上的实验结果表明,该方法可以有效提升聚类效率。在Caltech101数据集的Gabor视图,与传统的K-means、谱聚类方法相比,在处理高维度数据时,CDH的时间效率分别提高了约87和98个百分点。
-
关键词
哈希方法
自动特征选择
稀疏二进制矩阵
L21范数
收敛优化
汉明空间
-
Keywords
hashing method
automatic feature selection
sparse binary matrix
L21-norm
convergent optimization
Hamming space
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-