期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于LZ复杂性相似度的垃圾邮件识别 被引量:3
1
作者 李斌 李义兵 何红波 《计算机工程与应用》 CSCD 北大核心 2007年第29期176-178,共3页
提出一个基于符号序列间LZ复杂性相似度的垃圾邮件识别方法。相比基于向量空间模型的邮件识别,邮件文本间的LZ复杂性相似度计算无需对文本进行预处理和特征提取。同时,K近邻规则的延迟学习特性适合于垃圾邮件样本需要动态调整的应用环... 提出一个基于符号序列间LZ复杂性相似度的垃圾邮件识别方法。相比基于向量空间模型的邮件识别,邮件文本间的LZ复杂性相似度计算无需对文本进行预处理和特征提取。同时,K近邻规则的延迟学习特性适合于垃圾邮件样本需要动态调整的应用环境。在Ling-Spam邮件语料集上对提出的识别方法进行十重交叉验证,其总体的识别效果优于基于向量空间模型的部分统计和机器学习方法。 展开更多
关键词 垃圾邮件 lz复杂性相似度 K近邻规则
下载PDF
基于复杂性K近邻规则的蛋白质亚细胞位点预测 被引量:1
2
作者 李斌 李义兵 何红波 《计算机工程》 CAS CSCD 北大核心 2007年第7期28-29,32,共3页
提出了一个基于符号序列LZ复杂性相似度和K近邻规则的蛋白质亚细胞位点类型预测的方法。相比许多其他特征参数,蛋白质序列的LZ复杂性相似度计算无需深入的生物学领域知识和除序列数据以外的其他辅助数据。同时,K近邻规则的延迟学习特性... 提出了一个基于符号序列LZ复杂性相似度和K近邻规则的蛋白质亚细胞位点类型预测的方法。相比许多其他特征参数,蛋白质序列的LZ复杂性相似度计算无需深入的生物学领域知识和除序列数据以外的其他辅助数据。同时,K近邻规则的延迟学习特性适合于亚细胞位点类型已知的蛋白质数据的动态增加。在标准的RH数据集上对该预测方法进行10重交叉验证,其总体的预测准确率优于4种对照预测方法。 展开更多
关键词 生物信息学 lz复杂性相似度 K近邻 蛋白质 亚细胞位点
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部