期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于后验概率制导的B-KNN文本分类方法 被引量:1
1
作者 周红鹃 祖永亮 《计算机工程》 CAS CSCD 北大核心 2011年第21期114-116,共3页
针对K最近邻(KNN)方法分类准确率高但分类效率较低的特点,提出基于后验概率制导的贝叶斯K最近邻(B-KNN)方法。利用测试文本的后验概率信息对训练集多路静态搜索树进行剪枝,在被压缩的候选类型空间内查找样本的K个最近邻,从而在保证分类... 针对K最近邻(KNN)方法分类准确率高但分类效率较低的特点,提出基于后验概率制导的贝叶斯K最近邻(B-KNN)方法。利用测试文本的后验概率信息对训练集多路静态搜索树进行剪枝,在被压缩的候选类型空间内查找样本的K个最近邻,从而在保证分类准确率的同时提高KNN方法的效率。实验结果表明,与KNN相比,B-KNN的性能有较大提升,更适用于具有较深层次类型空间的文本分类应用。 展开更多
关键词 文本分类 后验概率 贝叶斯分类器 k最近邻方法 贝叶斯k最近邻方法
下载PDF
基于K最近邻与K均值聚类法的样本分类方法对苯酚类化合物的定量结构毒性相关研究 被引量:3
2
作者 张雅雄 杨彩蓉 李琴 《计算机与应用化学》 CAS 2016年第3期359-361,共3页
选取了258个苯酚类化合物的生物毒性数据,通过软件ADMEWORKS Model Builder的计算,选出7个结构描述符作为样本的结构参数,用稳健诊断方法剔除24个奇异样本,分别采用K最近邻方法和K均值聚类方法对剩余的234个样本数据进行分类,对分好的... 选取了258个苯酚类化合物的生物毒性数据,通过软件ADMEWORKS Model Builder的计算,选出7个结构描述符作为样本的结构参数,用稳健诊断方法剔除24个奇异样本,分别采用K最近邻方法和K均值聚类方法对剩余的234个样本数据进行分类,对分好的每一个类分别随机选择外部测试集,并用球型排除算法划分训练集和内部测试集,然后运用多元线性回归(Multiple Linear Regression,MLR)、偏最小二乘(Partial Least Squares,PLS)和人工神经网络(Artificial Neural Networks,ANN)方法进行预测模型的建立,计算结果表明,非线性模型的预测结果优于线性模型,有管理的分类方法(K nearest neighbors method,KNN)的预测结果优于无管理的分类方法(K均值聚类法)。 展开更多
关键词 苯酚类化合物 k最近邻方法 k均值聚类法 定量结构毒性相关
原文传递
基于超长方体与KNN的分类算法
3
作者 陈发 张公敬 赵忠帅 《青岛大学学报(自然科学版)》 CAS 2013年第4期57-61,共5页
提出了超长方体与KNN相结合的分类算法。在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本。在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其... 提出了超长方体与KNN相结合的分类算法。在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本。在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别。实验采用四个真实数据集进行测试。实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法。 展开更多
关键词 超长方体 k最近邻方法 分类方法 区域分离
下载PDF
针对虚拟人的文本情感语义分析
4
作者 徐芳 侯进 +1 位作者 吴玲 向宇 《西南科技大学学报》 CAS 2012年第1期40-43,共4页
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最... 为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最近邻方法将文本情感信息分为6类:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。实验结果为:语料文本分类准确率为87.5%,系统能从用户输入的文本中提取出情感、动作信息,使虚拟人做出相应表情变化。 展开更多
关键词 潜在语义分析 词汇相似度 k最近邻方法 情感分类
下载PDF
基于耦合机器学习模型的洪水预报研究 被引量:16
5
作者 阚光远 洪阳 梁珂 《中国农村水利水电》 北大核心 2018年第10期165-169,176,共6页
近年来,以人工神经网络(ANN)为代表的机器学习模型在很多领域取得了突破性进展,例如:用于图像识别的深度学习模型、用于围棋对弈软件Alpha Go的强化学习模型等。本文提出了一种耦合机器学习模型,并用于流域洪水预报。该模型通过独特的... 近年来,以人工神经网络(ANN)为代表的机器学习模型在很多领域取得了突破性进展,例如:用于图像识别的深度学习模型、用于围棋对弈软件Alpha Go的强化学习模型等。本文提出了一种耦合机器学习模型,并用于流域洪水预报。该模型通过独特的建模方式将ANN与K最近邻方法相耦合,利用多目标遗传算法和Levenberg-Marquardt算法进行训练,较好地解决了传统ANN模型预见期仅为一个计算时段长、ANN拓扑结构和参数难以同时优化、ANN训练局部极小、单个ANN预报能力不佳等问题。在屯溪流域洪水预报中的应用表明,耦合机器学习模型的精度和可靠性较好,具有较好的应用前景。 展开更多
关键词 耦合机器学习模型 水文模型 洪水预报 人工神经网络 k最近邻方法
下载PDF
同系与非同系有机物的定量构效关系建模研究
6
作者 张雅雄 杨彩蓉 《计算机与应用化学》 CAS 2017年第6期485-490,共6页
首先对同系有机化合物进行定量结构毒性相关研究,选取263个芳香类化合物的生物毒性数据作为建模样本,分别采用有监督的模式识别方法—K最近邻方法和无监督的模式识别方法—K均值聚类方法对相关样本数据进行模式识别分析,对模式识别后的... 首先对同系有机化合物进行定量结构毒性相关研究,选取263个芳香类化合物的生物毒性数据作为建模样本,分别采用有监督的模式识别方法—K最近邻方法和无监督的模式识别方法—K均值聚类方法对相关样本数据进行模式识别分析,对模式识别后的每一类样本分别运用多元线性回归、偏最小二乘和人工神经网络方法进行QSTR预测模型的建立。然后又对非同系化合物进行QSTR研究,选取90个有机分子的肝癌致毒性数据作为建模样本,仍采用上述方法进行建模研究。在上述研究工作的基础之上,得出了对同系及非同系有机物建立QSTR模型的有关规律。 展开更多
关键词 k最近邻方法 k均值聚类法 结构相似度 线性与非线性模型 同系有机物与非同系有机物
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部