期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
大数据下的快速KNN分类算法 被引量:29
1
作者 苏毅娟 邓振云 +1 位作者 程德波 宗鸣 《计算机应用研究》 CSCD 北大核心 2016年第4期1003-1006,1023,共5页
针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KNN分类算法。该算法创新性地在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测... 针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KNN分类算法。该算法创新性地在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测试过程中找出与待测样本距离最近的块,并将其作为新的训练样本进行K最近邻分类。这样的过程大幅度地减少了K最近邻算法的测试开销,使其能在大数据集中得以应用。实验表明,该算法在与经典KNN分类准确率保持近似的情况下,分类的速度明显快于经典KNN算法。 展开更多
关键词 K最近邻 测试复杂度 大数据 分块 聚类中心
下载PDF
基于PCA的哈希图像检索算法 被引量:7
2
作者 苏毅娟 余浩 +2 位作者 雷聪 郑威 李永钢 《计算机应用研究》 CSCD 北大核心 2018年第10期3147-3150,共4页
为了解决传统图像检索算法低效和耗时的缺点,提出一种基于PCA哈希的图像检索算法。通过结合PCA与流形学习将原始高维数据降维;然后通过最小方差旋转得到哈希函数和二值化阈值,进而将原始数据矩阵转换为哈希编码矩阵;最后通过计算样本间... 为了解决传统图像检索算法低效和耗时的缺点,提出一种基于PCA哈希的图像检索算法。通过结合PCA与流形学习将原始高维数据降维;然后通过最小方差旋转得到哈希函数和二值化阈值,进而将原始数据矩阵转换为哈希编码矩阵;最后通过计算样本间汉明距离得到样本相似性。在三个公开数据集上的实验结果表明,提出的哈希算法在多个评价指标下均优于现有算法。 展开更多
关键词 哈希 图像检索 主成分分析 流形学习
下载PDF
稀疏编码的最近邻填充算法 被引量:3
3
作者 苏毅娟 程德波 +2 位作者 宗鸣 李凌 朱永华 《计算机应用研究》 CSCD 北大核心 2015年第7期1942-1945,共4页
针对K最近邻填充算法(K-nearest neighbor imputation,KNNI)的参数K值固定问题进行了研究,发现对缺失值填充时,参数K值固定很大程度上影响了填充效果。为此,提出了基于稀疏编码的最近邻填充算法来解决这一问题。该算法是用训练样本重构... 针对K最近邻填充算法(K-nearest neighbor imputation,KNNI)的参数K值固定问题进行了研究,发现对缺失值填充时,参数K值固定很大程度上影响了填充效果。为此,提出了基于稀疏编码的最近邻填充算法来解决这一问题。该算法是用训练样本重构每一缺失样本,在重构过程中充分考虑了样本之间的相关性;并用1范数来学习确保每个缺失样本用不同数目的训练样本填充,以此解决KNNI算法参数K值选取问题。基于数据性能分析指标RMSE和相关系数的实验比较结果表明,该算法比KNNI算法的效果要好。该算法能很好地避免了KNNI算法存在的缺陷,适用于数据预处理环节需要对缺失值进行填充的应用领域。 展开更多
关键词 缺失值填充 稀疏编码 重构 均方根误差 相关系数 数据预处理
下载PDF
一种改进的频繁集挖掘方法 被引量:10
4
作者 苏毅娟 严小卫 《广西师范大学学报(自然科学版)》 CAS 2001年第3期22-26,共5页
为了有效解决关联规则挖掘中最关键的一步即频繁集的产生 ,构造了一个新的频繁树结构 ,以存储数据库中频繁项的信息 ,且基于该频繁树给出挖掘频繁集的算法 .该方法能够避免重复扫描数据库 ,避免产生大量的候选集 。
关键词 频繁集 频繁树 条件项集库 数据挖掘 关联规则
下载PDF
一种新的关联规则挖掘的模型 被引量:1
5
作者 苏毅娟 严小卫 《计算机科学》 CSCD 北大核心 2001年第10期46-48,共3页
A new algorithm for mining positive and negative association rules is presented. A new confi-dence is constructed to measure the uncertainty of an association rule based on the probability theory and Piatetsky-Shapiro... A new algorithm for mining positive and negative association rules is presented. A new confi-dence is constructed to measure the uncertainty of an association rule based on the probability theory and Piatetsky-Shapiro′s model. 展开更多
关键词 关联规则 数据挖掘 数据库
下载PDF
基于灰色关联分析的缺失值重复填补方法 被引量:3
6
作者 苏毅娟 《计算机工程与应用》 CSCD 北大核心 2009年第15期169-172,共4页
缺失填补是机器学习与数据挖掘领域中极富有挑战性的工作。数据源中的缺失值会对学习算法的性能与学习的质量产生较大的负面影响。目前存在的缺失值填补方法还不能满足用户的需要。提出了一种基于灰色系统理论的缺失值填补方法,该方法... 缺失填补是机器学习与数据挖掘领域中极富有挑战性的工作。数据源中的缺失值会对学习算法的性能与学习的质量产生较大的负面影响。目前存在的缺失值填补方法还不能满足用户的需要。提出了一种基于灰色系统理论的缺失值填补方法,该方法采用了基于实例学习的非参拟合和灰色理论技术,对缺失数据进行重复填补,直至填补结果收敛或者满足用户的需要。实验结果表明,该方法在填补效果与效率方面都比现有的KNN填补法和普通的均值替代法要好。 展开更多
关键词 重复填补 缺失值 灰色关联分析
下载PDF
数据挖掘中基于核的多重填补的一种新算法 被引量:1
7
作者 苏毅娟 《计算机工程与应用》 CSCD 北大核心 2008年第31期156-158,172,共4页
在数据挖掘预处理中,数据缺失是最为常见的数据预处理问题之一。通常对所要挖掘的数据分布形式没有任何先验知识。在这种情况下,非参回归分析方法可以为数据缺失的处理提供一种效果很好的解决途径。据此,在缺失机制是随机缺失(Missing a... 在数据挖掘预处理中,数据缺失是最为常见的数据预处理问题之一。通常对所要挖掘的数据分布形式没有任何先验知识。在这种情况下,非参回归分析方法可以为数据缺失的处理提供一种效果很好的解决途径。据此,在缺失机制是随机缺失(Missing at Random,MAR)和完全随机缺失(Missing Completely at Random,MCAR)的条件下,提出了一种处理数据缺失的新方法,即基于核函数的非参多重填补算法。模拟实验结果表明,算法的置信区间的覆盖率,区间长度,以及相对效率都比常用的NORM算法要好。 展开更多
关键词 多重填补 缺失数据 核函数 非参
下载PDF
基于属性自表达的低秩超图属性选择算法
8
作者 苏毅娟 雷聪 +2 位作者 胡荣耀 何威 朱永华 《计算机应用研究》 CSCD 北大核心 2017年第8期2294-2298,共5页
针对高维数据具有低秩形式和属性冗余等特点,提出一种基于属性自表达的无监督超图属性选择算法。该算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子... 针对高维数据具有低秩形式和属性冗余等特点,提出一种基于属性自表达的无监督超图属性选择算法。该算法首先利用属性自表达特点用其他属性稀疏地表达每个属性,此自表达形式使用低秩假设寻找高维数据的低秩表示,然后建立超图正则化因子保持高维数据的局部结构,最后利用稀疏正则化因子进行属性选择。属性自表达特性确定属性的重要性,低秩表示相当于考虑数据的全局信息进行子空间学习,超图正则化因子考虑数据的局部结构对数据进行子空间学习。该算法实际上考虑数据全局和局部信息进行子空间学习,更是一种嵌入了子空间学习的属性选择算法。实验结果表明,该算法相比其他对比算法,能更有效地选取属性,并能取得很好的分类效果。 展开更多
关键词 属性选择 属性自表达 子空间学习 超图 低秩表示
下载PDF
基于自表征和群组效应的子空间聚类算法
9
作者 苏毅娟 李永钢 +2 位作者 杨利锋 孙可 罗? 《计算机工程与设计》 北大核心 2017年第2期534-538,共5页
为解决目前聚类算法对噪声敏感和缺乏考虑样本间相关性等问题,提出一种充分考虑样本间相关性,使构造的关联矩阵保持子空间结构的子空间聚类算法。利用2,1-norm对每个样本进行自表征;群组效应确保相近样本的自表征系数亦相近,生成块对... 为解决目前聚类算法对噪声敏感和缺乏考虑样本间相关性等问题,提出一种充分考虑样本间相关性,使构造的关联矩阵保持子空间结构的子空间聚类算法。利用2,1-norm对每个样本进行自表征;群组效应确保相近样本的自表征系数亦相近,生成块对角化的样本自表征系数矩阵;根据自表征矩阵得到关联矩阵,在谱聚类模型下实现数据聚类。在Hopkins155等数据集上的实验结果表明,在聚类错误率评判标准下,该算法优于现有经典子空间聚类算法SRC、SSC等。 展开更多
关键词 子空间聚类 自表征 群组效应 谱聚类 关联矩阵
下载PDF
项目教学法在《数据库原理及应用》实验教学中的应用 被引量:9
10
作者 苏毅娟 《广西师范学院学报(自然科学版)》 2009年第2期109-111,115,共4页
采用项目教学法进行《数据库原理及应用》的实验教学,有利于学生系统地掌握数据库管理技术,提高分析问题和解决问题的能力.结合自己的实际教学经验,针对项目教学法在《数据库原理及应用》实验教学中的应用进行了探讨和分析.
关键词 项目教学法 数据库原理及应用 实验教学
下载PDF
基于LPP和l_(2,1)的KNN填充算法
11
作者 苏毅娟 孙可 +1 位作者 邓振云 尹科军 《广西师范大学学报(自然科学版)》 CAS 北大核心 2015年第4期55-62,共8页
传统的KNN缺失值填充算法存在没有利用样本间属性的相关性,也没有考虑到保持样本数据本身的结构和去除噪声样本的问题。本文提出利用训练样本重构测试样本从而进行最近邻缺失值填充的方法,该方法重构过程充分利用样本间的相关性,也用到L... 传统的KNN缺失值填充算法存在没有利用样本间属性的相关性,也没有考虑到保持样本数据本身的结构和去除噪声样本的问题。本文提出利用训练样本重构测试样本从而进行最近邻缺失值填充的方法,该方法重构过程充分利用样本间的相关性,也用到LPP(保局投影)保持数据结构在重构过程中不变,同时引入l2,1范式用于去除噪声样本。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN填充算法以及基于属性信息熵的Entropy-KNN算法有更高的预测准确度。 展开更多
关键词 缺失值填充 K最近邻 保局投影 重构
下载PDF
一种新的Vague集相似度量方式 被引量:1
12
作者 苏毅娟 《广西科学院学报》 2006年第4期260-262,共3页
在分析比较当前几种V ague集相似度量方法及其优缺点的基础上,提出一种新的V ague集相似度量方法.该方法充分考虑支持度以及真隶属度差距和假隶属度差距,并且区分隶属度差距的方向.该方法更符合实际,它为V ague集之间的相似度提供了一... 在分析比较当前几种V ague集相似度量方法及其优缺点的基础上,提出一种新的V ague集相似度量方法.该方法充分考虑支持度以及真隶属度差距和假隶属度差距,并且区分隶属度差距的方向.该方法更符合实际,它为V ague集之间的相似度提供了一种更好的度量方法. 展开更多
关键词 VAGUE集 相似度量 加权
下载PDF
虚拟实验在高校计算机专业实验教学中的应用研究 被引量:3
13
作者 苏毅娟 《创新教育研究》 2015年第2期23-27,共5页
虚拟实验教学是实验教学的一个重要发展方向。将虚拟实验应用到实验教学中,不仅能完善真实实验、丰富实验项目及内容,还有助于培养学生的创新能力,利于学生个别化发展。本文对虚拟实验在高校计算机专业实验教学中的应用进行了探讨和分析。
关键词 虚拟实验 实验教学 计算机专业
下载PDF
代价敏感的缺失数据有序填充算法
14
作者 苏毅娟 钟智 《计算机工程》 CAS CSCD 北大核心 2009年第17期92-93,96,共3页
缺失数据填充效果会对学习算法和挖掘算法的后续处理过程产生影响。针对代价敏感决策树方法没有同时考虑填充顺序和填充代价的问题,提出一种有序填充缺失数据的算法,综合考虑经济因素和建立填充器所需的有效信息。实验结果表明其预测准... 缺失数据填充效果会对学习算法和挖掘算法的后续处理过程产生影响。针对代价敏感决策树方法没有同时考虑填充顺序和填充代价的问题,提出一种有序填充缺失数据的算法,综合考虑经济因素和建立填充器所需的有效信息。实验结果表明其预测准确率和分类准确率高于现有算法。 展开更多
关键词 代价敏感学习 缺失数据填充 填充顺序
下载PDF
多数据库中例外模式和高选票模式的挖掘
15
作者 苏毅娟 曾德胜 王日凤 《广西师范学院学报(自然科学版)》 2006年第1期55-58,共4页
文章在分析前人算法不足的基础上,提出了一种改进的挖掘多数据库中例外模式和高选票模式的算法,算法分析结果表明改进的算法能更加准确有效地在多数据库中挖掘出潜在的例外模式和高选票模式.
关键词 多数据库 数据挖掘 例外模式 高选票模式
下载PDF
一种基于用户导向的多数据库例外模式挖掘方法
16
作者 苏毅娟 黄发良 《广西师范学院学报(自然科学版)》 2007年第4期93-96,共4页
例外模式挖掘是数据挖掘的一项重要内容.该文针对用户的兴趣提出一种多数据库中例外模式的挖掘方法,先由用户给定他感兴趣的数据对象,选择与用户兴趣相关的数据,局部分析每一个数据库得到局部模式,再将局部模式综合得到全局模式,最终得... 例外模式挖掘是数据挖掘的一项重要内容.该文针对用户的兴趣提出一种多数据库中例外模式的挖掘方法,先由用户给定他感兴趣的数据对象,选择与用户兴趣相关的数据,局部分析每一个数据库得到局部模式,再将局部模式综合得到全局模式,最终得到例外模式;并用实验验证了该方法的正确性和有效性. 展开更多
关键词 用户导向 例外模式 多数据库挖掘
下载PDF
绿色网络不良内容语义分析方法研究 被引量:7
17
作者 宁葵 龙珑 +4 位作者 覃晓 钟智 苏毅娟 陈万雷 宁德鹏 《计算机应用研究》 CSCD 北大核心 2010年第12期4643-4645,共3页
Internet已经在我国迅猛发展,我国网民的数量激增,由于不良内容的多变性,传统的不良内容语义分析方法已经无法适应我国对于净化网络需求。提出不良内容语义分析的方法,具体方法是借用依存语法作为框架,通过在基本内—外部算法中结合知... Internet已经在我国迅猛发展,我国网民的数量激增,由于不良内容的多变性,传统的不良内容语义分析方法已经无法适应我国对于净化网络需求。提出不良内容语义分析的方法,具体方法是借用依存语法作为框架,通过在基本内—外部算法中结合知识识别句子中的依存关系。系统使用结果表明,利用借助知识的内—外部算法训练无指导模型是可行的不良内容语义分析方法。 展开更多
关键词 绿色网络 不良内容 依存分析 内—外算法
下载PDF
二对一的带教方法在护理大专生手术室临床带教中的应用 被引量:5
18
作者 林羡枝 朱小燕 +2 位作者 杨秋香 苏毅娟 陈红英 《中华护理教育》 2012年第3期140-141,共2页
目的探讨二对一的带教方法在护理专业学生手术室临床带教中应用的方法与效果。方法便利抽取154名护理大专实习生为对象。2009年10月至2010年3月实习的学生75名为对照组,采用常规的带教方法;2010年7~12月实习的学生79名为试验组,采用二... 目的探讨二对一的带教方法在护理专业学生手术室临床带教中应用的方法与效果。方法便利抽取154名护理大专实习生为对象。2009年10月至2010年3月实习的学生75名为对照组,采用常规的带教方法;2010年7~12月实习的学生79名为试验组,采用二对一的带教方法。比较两组的教学效果。结果两组对工作程序、手术步骤掌握的准确性,以及配合的效果、满意度方面比较,差异均有统计学意义(P均<0.01),理论、操作考核成绩差异有统计学意义(P<0.01),且试验组优于对照组。结论二对一的带教方法可有效提高手术室临床护理教学质量,能充分调动师生双方积极性和主动性,提高师生的满意度。 展开更多
关键词 学生 护理 临床实习 手术室 教学方法
下载PDF
基于超图和样本自表征的谱聚类算法 被引量:2
19
作者 李永钢 苏毅娟 +1 位作者 何威 雷聪 《计算机应用研究》 CSCD 北大核心 2017年第6期1621-1625,共5页
针对传统谱聚类算法仅考虑数据点对点间的相互关系而未考虑数据间可能隐藏的复杂的相关性的问题,提出一种基于超图和自表征的谱聚类方法。首先,建立数据的超图,得到超图的拉普拉斯矩阵表示;然后利用l_(2,1)-范数对样本进行行稀疏自表征... 针对传统谱聚类算法仅考虑数据点对点间的相互关系而未考虑数据间可能隐藏的复杂的相关性的问题,提出一种基于超图和自表征的谱聚类方法。首先,建立数据的超图,得到超图的拉普拉斯矩阵表示;然后利用l_(2,1)-范数对样本进行行稀疏自表征,同时融入超图来描述数据间多层次的相互关系;最后,利用生成的自表征系数进行谱聚类。利用基于超图的样本自表征技术考虑了样本之间复杂的相关性。通过在Hopkins155等数据集上的实验表明,在聚类错误率评判标准下,算法优于现有基于普通图的谱聚类算法SSC、SRC等。 展开更多
关键词 谱聚类 超图 超图拉普拉斯 样本自表征
下载PDF
数据挖掘中的增量式关联规则更新算法 被引量:4
20
作者 蒙韧 苏毅娟 +1 位作者 朱晓峰 张继连 《广西科学院学报》 2006年第2期125-128,共4页
设计增量关联规则更新算法,用于解决数据挖掘中元组数增加而最小支持度不发生变化时关联规则增量式更新问题。该算法只须扫描原始数据库和新增数据库各一遍,能大大降低运算时间,加快速度,极大地提高关联规则的挖掘性能。
关键词 数据挖掘 关联规则 增量更新算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部