期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于句子相似度的论文抄袭检测模型研究 被引量:9
1
作者 冷强奎 秦玉平 王春立 《计算机工程与应用》 CSCD 北大核心 2011年第24期199-201,共3页
提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表... 提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。 展开更多
关键词 句子相似度 抄袭检测 局部词频 最长有序公共子序列
下载PDF
SVMs与FANNs的关系及分类性能对比 被引量:2
2
作者 冷强奎 刘福德 阎琦 《渤海大学学报(自然科学版)》 CAS 2016年第3期254-260,共7页
研究了支持向量机(SVMs)与前馈人工神经网络(FANNs)的关系.首先说明了两者在网络结构上的相似性,即输入函数均可表示为基函数的线性组合形式.然后指出了两者之间存在的关键差异:一是优化目标不同,FANNs只需要达到经验风险最小化,而SVMs... 研究了支持向量机(SVMs)与前馈人工神经网络(FANNs)的关系.首先说明了两者在网络结构上的相似性,即输入函数均可表示为基函数的线性组合形式.然后指出了两者之间存在的关键差异:一是优化目标不同,FANNs只需要达到经验风险最小化,而SVMs寻求结构风险最小化;二是隐含层含义不同,SVMs的隐含层节点表现为支持向量,而FANNs则需要预先设定;三是模型复杂性不同,FANNs的模型复杂性由隐含层神经元数量来控制,而SVMs的复杂性独立于维度.最后,给出了两者在UCI标准数据集上的对比实验,用以评估它们在分类中的性能. 展开更多
关键词 模式识别 支持向量机 前馈人工神经网络 深度学习
下载PDF
一种基于混合二叉树结构的多类支持向量机分类算法 被引量:10
3
作者 冷强奎 刘福德 秦玉平 《计算机科学》 CSCD 北大核心 2018年第5期220-223,237,共5页
为提高多类支持向量机的分类效率,提出了一种基于混合二叉树结构的多类支持向量机分类算法。该混合二叉树中的每个内部结点对应一个分割超平面,该超平面通过计算两个距离最远的类的质心而获得,即该超平面为连接两质心线段的垂直平分线... 为提高多类支持向量机的分类效率,提出了一种基于混合二叉树结构的多类支持向量机分类算法。该混合二叉树中的每个内部结点对应一个分割超平面,该超平面通过计算两个距离最远的类的质心而获得,即该超平面为连接两质心线段的垂直平分线。每个终端结点(即决策结点)对应一个支持向量机,它的训练集不再是质心而是两类(组)样本集。该分类模型通常是超平面和支持向量机的混合结构,其中超平面实现训练早期的近似划分,以提升分类速度;而支持向量机完成最终的精确分类,以保证分类精度。实验结果表明,相比于经典的多类支持向量机方法,该算法在保证分类精度的前提下,能够有效缩短计算时间,提升分类效率。 展开更多
关键词 支持向量机 多类分类 混合二叉树 质心表达
下载PDF
使用SK算法构造组合凸线性感知器 被引量:1
4
作者 冷强奎 李玉鑑 《计算机科学与探索》 CSCD 2013年第9期831-837,共7页
组合凸线性感知器(multiconlitron)是用来构造分片线性分类器的一个通用理论框架。基于此框架,引入一种典型的凸包间最近点求解方法——Schlesinger-Kozinec(SK)算法,来计算线性可分样本间的分类超平面;然后构造可处理凸可分数据的凸线... 组合凸线性感知器(multiconlitron)是用来构造分片线性分类器的一个通用理论框架。基于此框架,引入一种典型的凸包间最近点求解方法——Schlesinger-Kozinec(SK)算法,来计算线性可分样本间的分类超平面;然后构造可处理凸可分数据的凸线性感知器和处理叠可分数据的组合凸线性感知器。在人工合成数据集和标准数据集上的实验说明,所构造的感知器具有良好的分类性能,与其他典型分片线性分类器的对比也说明了该方法的有效性。 展开更多
关键词 组合凸线性感知器 SK算法 通用框架 分片线性分类器
下载PDF
使用SVM和二叉树结构的分片线性分类器 被引量:1
5
作者 冷强奎 李玉鑑 《中国科技论文》 CAS 北大核心 2015年第2期164-168,共5页
提出了一种支持向量机(support vector machine,SVM)和二叉树结构相结合的分片线性分类模型。在每一节点,使用带软间隔的线性SVM计算分类超平面,并统计局部错误率。如果局部错误率在预先设定的阈值之下,则构造可进行最终决策的叶子节点... 提出了一种支持向量机(support vector machine,SVM)和二叉树结构相结合的分片线性分类模型。在每一节点,使用带软间隔的线性SVM计算分类超平面,并统计局部错误率。如果局部错误率在预先设定的阈值之下,则构造可进行最终决策的叶子节点;否则,进行非叶子节点的递归构造。对比实验表明,该分类器具有一定的有效性,优于一些原有分片线性分类器,在部分数据集上甚至能够达到RBF核SVM的水平。 展开更多
关键词 支持向量机 二叉树结构 泛化能力 分片线性分类器
下载PDF
组合凸线性感知器的极大切割构造方法
6
作者 冷强奎 李玉鑑 《自动化学报》 EI CSCD 北大核心 2014年第4期721-730,共10页
组合凸线性感知器(Multiconlitron)是用来构造分片线性分类器的一个通用理论框架,对于凸可分和叠可分情况,分别使用支持凸线性感知器算法(Support conlitron algorithm,SCA)和支持组合凸线性感知器算法(Support multiconlitron algorith... 组合凸线性感知器(Multiconlitron)是用来构造分片线性分类器的一个通用理论框架,对于凸可分和叠可分情况,分别使用支持凸线性感知器算法(Support conlitron algorithm,SCA)和支持组合凸线性感知器算法(Support multiconlitron algorithm,SMA)将两类样本分开.本文在此基础上,提出了一种基于极大切割(Maximal cutting)的组合凸线性感知器构造方法.该方法由两阶段训练构成,第一阶段称为极大切割过程(Maximal cutting process,MCP),通过迭代不断寻求能够切开最多样本的线性边界,并因此来构造尽可能小的决策函数集,最大程度减少决策函数集中线性函数的数量,最终简化分类模型.第二阶段称为边界调整过程(Boundary adjusting process,BAP),对MCP得到的初始分类边界进行一个二次训练,调整边界到适当位置,以提高感知器的泛化能力.数值实验说明,此方法能够产生更为合理的分类模型,提高了感知器的性能.同其他典型分片线性分类器的性能对比,也说明了这种方法的有效性和竞争力. 展开更多
关键词 组合凸线性感知器 极大切割 两阶段训练 泛化能力 分片线性分类器
下载PDF
软间隔组合凸线性感知器设计
7
作者 冷强奎 李玉鑑 《模式识别与人工智能》 EI CSCD 北大核心 2013年第10期924-934,共11页
组合凸线性感知器是用来构造分片线性分类器的一个通用理论框架.对于凸可分和叠可分情况,分别使用支持凸线性感知器算法和支持组合凸线性感知器算法将两类样本分开.在此基础上,文中提出一种软间隔的组合凸线性感知器设计方法.该方法首... 组合凸线性感知器是用来构造分片线性分类器的一个通用理论框架.对于凸可分和叠可分情况,分别使用支持凸线性感知器算法和支持组合凸线性感知器算法将两类样本分开.在此基础上,文中提出一种软间隔的组合凸线性感知器设计方法.该方法首先映射原空间数据到高维特征空间,然后利用K均值算法将其中一类样本聚类成多个簇,并在每一簇与另一类样本间构造凸线性感知器,最后集成组合凸线性感知器.该方法能解决原感知器模型不适用非叠可分数据的问题,并且在一定程度上简化模型结构,在保证分类精度的前提下,提高泛化能力.实验结果证实文中方法的有效性,同其它分片线性分类器的对比也说明了它的优势. 展开更多
关键词 组合凸线性感知器 软间隔 K均值 泛化能力 分片线性分类器
下载PDF
一种基于逐段比较的直线逼近曲线方法
8
作者 冷强奎 未有彬 《渤海大学学报(自然科学版)》 CAS 2010年第1期89-92,共4页
利用直线来模拟曲线轨迹实现逼近,在工业上有很大应用。传统逼近方法计算复杂,速度不高,有待改善。本文介绍了二次曲线基于逐段比较的逼近方法,并给出具体实现过程。从被逼曲线端点开始计算节点,在理论曲线与直线的最大偏差小于允许偏... 利用直线来模拟曲线轨迹实现逼近,在工业上有很大应用。传统逼近方法计算复杂,速度不高,有待改善。本文介绍了二次曲线基于逐段比较的逼近方法,并给出具体实现过程。从被逼曲线端点开始计算节点,在理论曲线与直线的最大偏差小于允许偏差的条件下,利用折半算法求得逼近节点,并在此基础上实现坐标轴变换,平移,缩放等,具有一定实际意义。 展开更多
关键词 逐段比较 逼近 二次曲线 节点
下载PDF
基于二元模糊匹配的编程题智能评分方法
9
作者 冷强奎 刘雨晴 秦玉平 《计算机技术与发展》 2020年第2期71-74,共4页
针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似... 针对传统编程题自动评分方法不能准确衡量学生程序与参考答案之间的接近程度等问题,提出了一种基于二元模糊匹配的编程题智能评分方法。第一元为结构匹配,检测学生程序在变量声明、数据输入、函数调用、控制结构等方面与参考答案的相似程度,目的是快速判断学生程序中是否存在关键的采分点。第二元为词语匹配,首先进行词频统计,以确定每个词的权重。然后,分别构造学生程序与参考答案的向量空间模型,并计算两者的余弦相似度,来作为评判词语相似的依据。最终的分数由结构相似度和词语相似度的加权分数计算得出。由于该二元匹配方法不关心程序中结构/词语的先后顺序和是否为精确表达,因此被称为是模糊的。仿真实验表明,该方法具有不错的评分准确性,尽管与人工评分相比还存在一定的差距,但当试题规模较大时,可以作为人工评分的替代手段。 展开更多
关键词 二元模糊匹配 自动评分 词频统计 余弦相似度 向量空间模型
下载PDF
几种排序算法在链式存储结构上的递归实现
10
作者 秦玉平 刘晴 冷强奎 《渤海大学学报(自然科学版)》 CAS 2023年第2期166-171,共6页
排序是程序设计中常用的一种操作,递归是一种重要的程序设计方法.探析了几种常用的排序算法在链式存储结构上的递归实现,包括基本思想、C语言函数源代码及详细注释,并与顺序存储结构上的算法实现进行了性能比较,以便于学习者熟练掌握链... 排序是程序设计中常用的一种操作,递归是一种重要的程序设计方法.探析了几种常用的排序算法在链式存储结构上的递归实现,包括基本思想、C语言函数源代码及详细注释,并与顺序存储结构上的算法实现进行了性能比较,以便于学习者熟练掌握链式存储结构上的递归程序设计,并为排序算法选择合适的存储结构提供借鉴. 展开更多
关键词 排序算法 链式存储 递归 实现
下载PDF
一种典型的模式分解算法分析与应用
11
作者 冷强奎 秦玉平 《赤峰学院学报(自然科学版)》 2010年第7期33-34,共2页
从非优化关系存在的问题出发,结合模式分解准则和规范化理论,分析了一种典型的模式分解算法,并给出其在抽象关系中的应用.最后,通过该算法将存在问题的关系分解,分解后的关系符合较高级的范式,达到了应用系统逻辑结构设计的要求.
关键词 模式分解 规范化 关系 逻辑结构 范式
下载PDF
基于局部词频指纹的论文抄袭检测算法 被引量:10
12
作者 秦玉平 冷强奎 +1 位作者 王秀坤 王春立 《计算机工程》 CAS CSCD 北大核心 2011年第6期193-194,197,共3页
提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程... 提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程度上克服了现有论文抄袭检测算法检测精度低的缺点,具有较快的检测速度。 展开更多
关键词 抄袭检测 数字指纹 局部词频 相似度
下载PDF
基于时空GPSO-SVM的短时交通流预测 被引量:8
13
作者 梅朵 郑黎黎 +1 位作者 冷强奎 鄂旭 《交通信息与安全》 CSCD 2017年第2期68-74,120,共8页
为了提高城市道路短时交通流预测的精度,提出了一种基于时空遗传粒子群支持向量机的短时交通流预测模型。通过主成分分析法对路网原始交通流量进行时空相关性分析,用较少的主成分代替原始交通流量并作为预测因子,在粒子群算法中引入遗... 为了提高城市道路短时交通流预测的精度,提出了一种基于时空遗传粒子群支持向量机的短时交通流预测模型。通过主成分分析法对路网原始交通流量进行时空相关性分析,用较少的主成分代替原始交通流量并作为预测因子,在粒子群算法中引入遗传算法的交叉和变异因子,避免粒子群算法陷入局部最优。利用改进后的粒子群算法优化支持向量机参数,得到最优的支持向量机模型,并实现城市道路的短时交通流预测。以长春市路网的实测数据为基础进行了实例验证,结果表明,优化支持向量机参数时,遗传粒子群算法不会陷入局部最优,优化效果更好;与粒子群支持向量机模型和遗传粒子群支持向量机模型相比,所提出预测模型的相对误差波动较稳定,平均预测精度分别提高了4.96%和3.41%。 展开更多
关键词 城市交通 短时交通流预测 路网时空相关性 主成分分析 遗传算法 粒子群算法 支持向量机
下载PDF
ASP程序访问SQL SERVER数据库基本操作
14
作者 冷强奎 《福建电脑》 2008年第6期177-177,99,共2页
本文分析了ASP程序访问SQL SERVER数据库的现实意义,利用两个具体实例(用户登录验证和新用户注册程序)来阐述嵌入式SQL操作方式,总结控制连接对象和记录集对象四大步骤,并且在实际运用中采用DSN-LESS模式以求得达到最大效能,节省系统资源。
关键词 数据库 数据源 数据操作 连接对象 记录集
下载PDF
基于最近邻子空间搜索的两类文本分类方法 被引量:3
15
作者 李玉鑑 王影 冷强奎 《计算机工程与科学》 CSCD 北大核心 2015年第1期168-172,共5页
在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大。为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法。首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高... 在文本分类中,最近邻搜索算法具有思想简单、准确率高等优点,但通常在分类过程中的计算量较大。为克服这一不足,提出了一种基于最近邻子空间搜索的两类文本分类方法。首先提取每一类样本向量组的特征子空间,并通过映射将子空间变换为高维空间中的点,然后把最近邻子空间搜索转化为最近邻搜索完成分类过程。在Reuters-21578数据集上的实验表明,该方法能够有效提高文本分类的性能,具有较高的准确率、召回率和F1值。 展开更多
关键词 文本分类 最近邻子空间搜索 最近邻搜索
下载PDF
基于B/S的软件工程教学网站设计与实现 被引量:5
16
作者 梅朵 王冬雪 +1 位作者 高丽娜 冷强奎 《信息技术》 2017年第7期121-124,共4页
为了提高《软件工程》课程的教学质量和学习效率,以信息化教育为基础,基于B/S(Browser/Server)框架模式,结合ASP.NE和SQLserver2005数据库技术,设计并实现一种《软件工程》教学网站。该教学网站可以支持教师的开放式教学模式,可以提高... 为了提高《软件工程》课程的教学质量和学习效率,以信息化教育为基础,基于B/S(Browser/Server)框架模式,结合ASP.NE和SQLserver2005数据库技术,设计并实现一种《软件工程》教学网站。该教学网站可以支持教师的开放式教学模式,可以提高学生自主学习的能力,进而改善当前的教学质量和学习效率。 展开更多
关键词 教学网站 软件工程 B/S架构 ASP.NET
下载PDF
基于Tomek链的边界少数类样本合成过采样方法 被引量:2
17
作者 陶佳晴 贺作伟 +2 位作者 冷强奎 翟军昌 孟祥福 《计算机应用研究》 CSCD 北大核心 2023年第2期463-469,共7页
在类别不平衡数据集中,由于靠近类边界的样本更容易被错分,因此准确识别边界样本对分类具有重要意义。现有方法通常采用K近邻来标识边界样本,准确率有待提高。针对上述问题,提出一种基于Tomek链的边界少数类样本合成过采样方法。首先,... 在类别不平衡数据集中,由于靠近类边界的样本更容易被错分,因此准确识别边界样本对分类具有重要意义。现有方法通常采用K近邻来标识边界样本,准确率有待提高。针对上述问题,提出一种基于Tomek链的边界少数类样本合成过采样方法。首先,计算得到类间距离互为最近的样本形成Tomek链;然后,根据Tomek链标识出位于类间边界处的少数类样本;接下来,利用合成少数类过采样技术(SMOTE)中的线性插值机制在边界样本及其少数类近邻间进行过采样,并最终实现数据集的平衡。实验对比了八种采样方法,结果表明所提方法在大部分数据集上均获得了更高的G-mean和F_(1)值。 展开更多
关键词 不平衡数据分类 合成过采样 边界样本 K近邻 Tomek链
下载PDF
基于LASVM-NC和TF.RF的文本分类方法 被引量:1
18
作者 李玉鑑 李玉雄 冷强奎 《计算机工程与应用》 CSCD 2014年第10期136-140,265,共6页
非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-N... 非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-NC+tf.rf。实验结果表明,这种方法在LASVM-NC与多种其他特征的结合中性能是最好的,且与SVM+tf.rf相比,不仅所产生的分类器具有泛化能力更强、模型表达更稀疏的优点,而且在处理含噪声的数据时具有更好的鲁棒性,在处理大规模数据时具有快得多的训练速度。 展开更多
关键词 非凸在线支持向量机 支持向量机 特征项 词频 相关频率 文本分类
下载PDF
组合凸线器和Hadamard纠错码相结合的多类文本分类算法 被引量:1
19
作者 秦玉平 邱凤凤 冷强奎 《渤海大学学报(自然科学版)》 CAS 2017年第1期71-75,共5页
提出了一种组合凸线器和Hadamard纠错码相结合的多类文本分类算法,利用Hadamard纠错码将多类分类问题转换成多个二分类问题,对每个二分类问题,采用组合凸线器构造二分类器,使用海明距离判定待分类文本类别.在标准数据集Reuters 21578上... 提出了一种组合凸线器和Hadamard纠错码相结合的多类文本分类算法,利用Hadamard纠错码将多类分类问题转换成多个二分类问题,对每个二分类问题,采用组合凸线器构造二分类器,使用海明距离判定待分类文本类别.在标准数据集Reuters 21578上进行了文本分类实验,分类结果表明,与支持向量机多类分类算法1-a-r、1-a-1和DAGSVM相比,该算法不仅提高了分类精度,而且分类速度有较大幅度的提高. 展开更多
关键词 多类分类 组合凸线器 Hadamard纠错码
下载PDF
使用交叉距离最小化算法设计支持向量机
20
作者 李玉鑑 冷强奎 《北京工业大学学报》 CAS CSCD 北大核心 2014年第1期61-67,共7页
针对核方法在处理非线性可分数据问题上的优势,将一种硬间隔无核支持向量机——交叉距离最小化算法(cross distance minimization algorithm,CDMA)推广到带核的版本,称为带核的交叉距离最小化算法(kernel cross distance minimization a... 针对核方法在处理非线性可分数据问题上的优势,将一种硬间隔无核支持向量机——交叉距离最小化算法(cross distance minimization algorithm,CDMA)推广到带核的版本,称为带核的交叉距离最小化算法(kernel cross distance minimization algorithm,KCDMA).利用乘子将交叉距离最小化算法表示为内积的形式,然后使用核函数代替内积运算,并且引入二次惩罚,这样扩展后的模型能处理非线性可分数据集,并且允许一定的分类偏差.实验结果表明,与一些经典的支持向量机方法相比,该方法具有明显的竞争力. 展开更多
关键词 交叉距离最小化算法 核函数 最近点算法 支持向量机
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部