期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于字符串核的免分词中文文本分类方法
1
作者 游智 李战怀 张阳 《计算机工程与应用》 CSCD 北大核心 2006年第26期170-172,共3页
文本分类是获取文本信息的重要一步,现有的分类方法主要是基于统计理论和机器学习的,其中著名的有Bayes[1]、KNN[2]、SVM[3]、神经网络等方法。实验证明这些方法对英文分类都表现出较好的准确性和稳定性[4]。对于中文文本分类,涉及对文... 文本分类是获取文本信息的重要一步,现有的分类方法主要是基于统计理论和机器学习的,其中著名的有Bayes[1]、KNN[2]、SVM[3]、神经网络等方法。实验证明这些方法对英文分类都表现出较好的准确性和稳定性[4]。对于中文文本分类,涉及对文本进行分词的工作。但是中文分词本身又是一件困难的事情[5]。论文尝试一种基于字符串核函数的支持矢量机方法来避开分词对中文文本分类,实验表明此方法表现出较好的分类性能。 展开更多
关键词 函数 SVM 字符串核
下载PDF
基于字符串核函数的热点新闻发现系统 被引量:1
2
作者 王义 张阳 李书琴 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期212-215,共4页
随着网络新闻类门户网站的不断增多,如何从纷繁复杂的新闻信息中得到当日热点新闻,为用户提供一个方便的访问界面成为当前主要问题。通过对超文本进行聚类分析从而得到热点新闻,采用字符串核函数(string kerne l)来计算文本相似度,并将... 随着网络新闻类门户网站的不断增多,如何从纷繁复杂的新闻信息中得到当日热点新闻,为用户提供一个方便的访问界面成为当前主要问题。通过对超文本进行聚类分析从而得到热点新闻,采用字符串核函数(string kerne l)来计算文本相似度,并将其应用到超文本聚类分析中。实验表明字符串核对于超文本的聚类分析有较好效果。 展开更多
关键词 字符串核函数 文本聚类 文本相似度
下载PDF
一种基于中文关键字符串核函数的分类算法
3
作者 沈黎 肖勇 刘莺 《吉首大学学报(自然科学版)》 CAS 2019年第1期18-20,共3页
提出了一种基于中文关键字符串核函数的分类算法,并在农业文本上进行了分类性能测试.实验结果表明,与传统的中文分类算法相比,基于中文关键字符串核函数的分类算法准确率更高.
关键词 中文关键字符串核函数 农业文本 文本分类
下载PDF
基于后缀树词序列核挖掘Web文档 被引量:2
4
作者 傅鹏 张德运 +1 位作者 陈海诠 董皓 《微电子学与计算机》 CSCD 北大核心 2005年第12期4-7,共4页
通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的... 通过将文档表示为一棵后缀树,文章提出一种基于后缀树索引计算文档相似度的词序列核。首先根据文档的词序列构造出后缀树,然后根据后缀树词序列核计算文档间的相似度,最后利用支持向量机对文档进行分类。理论分析表明后缀树词序列核的计算只与比较文档的长度成线性关系,大大减少了序列核的计算时间。在reuters-21578文档集上将后缀树词序列核与词序列核、多项式核进行比较,实验结果表明在改善速度的同时,后缀树词序列核可达到与词序列核相当的性能,优于多项式核,更适于Web文档挖掘等应用。 展开更多
关键词 学习方法 词序列 字符串核 后缀树 WEB挖掘
下载PDF
一种面向间隙核函数的快速算法 被引量:1
5
作者 尹传环 田盛丰 牟少敏 《电子学报》 EI CAS CSCD 北大核心 2007年第5期875-881,共7页
间隙核是一种应用非常广泛的字符串核,在文本分类和蛋白质分类中都取得了很好的效果.本文提出了一种应用在入侵检测领域的间隙核,称为长度加权核.并且提出了一种基于后缀核的动态规划算法,能够有效计算变长度加权核.另外,本文提出了一... 间隙核是一种应用非常广泛的字符串核,在文本分类和蛋白质分类中都取得了很好的效果.本文提出了一种应用在入侵检测领域的间隙核,称为长度加权核.并且提出了一种基于后缀核的动态规划算法,能够有效计算变长度加权核.另外,本文提出了一种位并行算法,能够加速定长度加权核的计算.实验表明在满足位并行的条件下这种快速算法比现有的几种计算间隙核的算法更为快速,而且应用在入侵检测中能够取得较好的效果. 展开更多
关键词 方法 字符串核 间隙 位并行
下载PDF
基于SVM的蛋白质二级结构预测方法的研究
6
作者 李昆仑 崔丽娟 +1 位作者 张伟 戴运娜 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期319-322,共4页
应用计算智能方法分析,有效地处理现实世界中的大规模数据,是当今人工智能、机器学习等领域所追求的目标之一.简单综述了SVM用于处理大规模数据方法的发展现状,并针对蛋白质结构预测中数据量庞大、数据维数过高等问题,提出了SVM基于分... 应用计算智能方法分析,有效地处理现实世界中的大规模数据,是当今人工智能、机器学习等领域所追求的目标之一.简单综述了SVM用于处理大规模数据方法的发展现状,并针对蛋白质结构预测中数据量庞大、数据维数过高等问题,提出了SVM基于分解算法的蛋白质二级结构预测的实现方法,并应用固定长度的字符串核对多类分类SVM算法进行了改进.实验表明,该方法是行之有效的. 展开更多
关键词 大规模数据问题 支持向量机 固定长度字符串核 蛋白质二级结构预测
下载PDF
基于改进K-modes聚类的KNN分类算法 被引量:23
7
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 K-modes算法 KNN算法 分类 簇中心 K-modes-KNN算法 字符串核函数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部