期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
图卷积神经网络综述 被引量:3
1
作者 谢娟英 张建宇 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期89-101,共13页
图卷积神经网络是图论与深度学习的交叉,已成为机器学习领域的研究热点。基于此,介绍了图卷积神经网络的形成,梳理了两大类经典的图卷积神经网络:谱方法和空间方法,详细介绍了这两类图卷积神经网络模型,分析了图卷积操作的核心理论基础... 图卷积神经网络是图论与深度学习的交叉,已成为机器学习领域的研究热点。基于此,介绍了图卷积神经网络的形成,梳理了两大类经典的图卷积神经网络:谱方法和空间方法,详细介绍了这两类图卷积神经网络模型,分析了图卷积操作的核心理论基础,介绍了图卷积神经网络在各领域的应用,总结了图卷积神经网络面临的主要挑战,展望了图卷积神经网络的发展趋势,并分析了图卷积神经网络在野外环境下蝴蝶识别任务中的潜在应用。 展开更多
关键词 图卷积神经网络 谱方法 空间方法 目标检测
下载PDF
SOSNet:一种非对称编码器-解码器结构的非小细胞肺癌CT图像分割模型 被引量:2
2
作者 谢娟英 张凯云 《电子学报》 EI CAS CSCD 北大核心 2024年第3期824-837,共14页
非小细胞肺癌严重损害人类健康,早期非小细胞肺癌CT(Computed Tomography)图像中的肿瘤结节体积小,不易发现,极易造成漏诊和误诊.为了精确分割非小细胞肺癌CT图像中的小体积肿瘤结节,本文提出SOSNet(Small Object Segmentation Networks... 非小细胞肺癌严重损害人类健康,早期非小细胞肺癌CT(Computed Tomography)图像中的肿瘤结节体积小,不易发现,极易造成漏诊和误诊.为了精确分割非小细胞肺癌CT图像中的小体积肿瘤结节,本文提出SOSNet(Small Object Segmentation Networks)自动分割模型,利用ResNet(Residual Network)基础层和空洞卷积构造非对称编码器-解码器结构作为分割主网络,利用轴向取反注意力模块ARA(Axial Reverse Attention)逐步擦除背景中对分割有影响的结构,再使用结构细化模块SR(Structure Refinement)对主网络输出的粗略特征图进行结构细化,从而实现非小细胞肺癌肿瘤结节分割.在非小细胞肺癌公开数据集的实验测试表明,本文提出的小目标自动分割模型SOSNet可以有效分割出非小细胞肺癌CT图像中的小体积肿瘤结节,其mDice(mean-Dice)、mIoU(mean Intersection over Union)、Sensitivity、F1、Specificity、平均绝对误差MAE(Mean Absolute Error)均优于当前最先进的小目标分割模型CaraNet(Context Axial Reverse Attention Network). 展开更多
关键词 小目标分割 非小细胞肺癌 非对称编码器-解码器 结构细化 轴向取反注意力 CT图像 深度学习 卷积
下载PDF
局部标准差优化的密度峰值聚类算法
3
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值聚类 标准差 局部密度 分配策略 聚类
下载PDF
DL-MAML:一种新的蝴蝶物种自动识别模型
4
作者 赵戈伟 许升全 谢娟英 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期674-684,共11页
蝴蝶种类成千上万,每种蝴蝶都与一定植物密切相关,研究蝴蝶种类自动识别有重要意义.野外环境下的蝴蝶物种识别研究受制于现有数据集蝴蝶种类较少,每类样本(图像)数量较少,使基于机器学习的蝴蝶种类识别面临泛化推广难的挑战.另外,野外... 蝴蝶种类成千上万,每种蝴蝶都与一定植物密切相关,研究蝴蝶种类自动识别有重要意义.野外环境下的蝴蝶物种识别研究受制于现有数据集蝴蝶种类较少,每类样本(图像)数量较少,使基于机器学习的蝴蝶种类识别面临泛化推广难的挑战.另外,野外环境下的蝴蝶翅膀遮挡使分类特征学习面临挑战.因此,提出基于元学习的蝴蝶物种自动识别新模型DL-MAML(deep learning advanced model-agnostic meta-learning),实现野外环境下的任意蝴蝶种类识别.首先,DL-MAML模型采用L2正则改进经典元学习算法MAML(model-agnostic meta-learning)的目标函数和模型参数更新方法,并对MAML增加了2层特征学习模块,避免模型陷入过拟合风险,解决现有野外环境下蝴蝶物种识别面临的泛化推广困难;其次,采用ResNet34深度学习模型提取蝴蝶分类特征,对图像进行表征预处理,作为DL-MAML模型元学习模块的输入,克服其特征提取不足的缺陷,以及野外环境下蝴蝶翅膀遮挡带来的分类特征学习困难.大量消融实验以及与同类模型的实验比较表明,DL-MAML算法学习获得的初始模型参数对蝴蝶新类识别具有很好的效果,优于MAML和其他同类模型,对野外环境下的蝴蝶种类识别很有效,使利用现有野外环境下的蝴蝶数据集构造通用且完全的蝴蝶物种识别系统成为可能. 展开更多
关键词 蝴蝶分类 深度学习 特征提取 元学习 MAML算法
下载PDF
一种改进的全局K-均值聚类算法 被引量:47
5
作者 谢娟英 蒋帅 +2 位作者 王春霞 张琰 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第2期18-22,共5页
将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远... 将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远的样本为下一个簇的最佳初始中心,得到一种改进的全局K-均值聚类算法.改进后的算法不仅可以避免将噪音点作为下一个簇的最佳初始中心点,而且在不影响聚类效果的基础上缩短了聚类时间.通过UCI机器学习数据库数据以及随机生成的人工模拟数据实验测试,证明改进的全局K-均值聚类算法与全局K-均值聚类算法及快速全局K-均值聚类算法相比在聚类时间上更优越. 展开更多
关键词 K-均值 全局K-均值 快速全局K-均值 K中心点法
下载PDF
基于样本空间分布密度的初始聚类中心优化K-均值算法 被引量:53
6
作者 谢娟英 郭文娟 +1 位作者 谢维信 高新波 《计算机应用研究》 CSCD 北大核心 2012年第3期888-892,共5页
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定... 针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。 展开更多
关键词 聚类 K-均值聚类 初始中心 邻域 样本分布密度
下载PDF
蝴蝶种类自动识别研究 被引量:21
7
作者 谢娟英 侯琦 +6 位作者 史颖欢 吕鹏 景丽萍 庄福振 张军平 谭晓阳 许升全 《计算机研究与发展》 EI CSCD 北大核心 2018年第8期1609-1618,共10页
针对现有蝴蝶识别研究中所用数据集蝴蝶种类偏少,且只含有蝴蝶标本照片、不含生态环境中蝴蝶照片的问题,发布了一个同时包含标本照片和生态照片的蝴蝶图像数据集,其中标本照片包含全部中国蝶类志蝴蝶种类,共计4 270张照片、1 176种,蝴... 针对现有蝴蝶识别研究中所用数据集蝴蝶种类偏少,且只含有蝴蝶标本照片、不含生态环境中蝴蝶照片的问题,发布了一个同时包含标本照片和生态照片的蝴蝶图像数据集,其中标本照片包含全部中国蝶类志蝴蝶种类,共计4 270张照片、1 176种,蝴蝶生态环境下照片1 425张、111种.提出基于深度学习技术Faster R-CNN的蝴蝶种类自动识别系统,包括生态照片中蝴蝶位置的自动检测和物种鉴定.实验去除只含有单张生态照片的蝴蝶种类,对剩余的蝴蝶生态照片进行5-5划分,构造2种不同训练数据集:一半生态照片+全部模式照片、一半生态照片+对应种类模式照片;训练3种不同网络结构的蝴蝶自动识别系统,以平均精度均值(mean average precision,mAP)为评价指标,采用上下、左右翻转、不同角度旋转、加噪、不同程度模糊、对比度升降等9种方式扩充训练集.实验结果表明,基于Faster R-CNN深度学习框架的蝴蝶自动识别系统对生态环境中的蝴蝶照片能实现其中蝴蝶位置的自动检测和物种识别,模型的mAP最低值接近60%,并能同时检测出生态照中的多只蝴蝶和完成物种识别. 展开更多
关键词 蝴蝶 自动识别 目标检测 深度学习 分类
下载PDF
基于改进的F-score与支持向量机的特征选择方法 被引量:31
8
作者 谢娟英 王春霞 +1 位作者 蒋帅 张琰 《计算机应用》 CSCD 北大核心 2010年第4期993-996,共4页
将传统F-score度量样本特征在两类之间的辨别能力进行推广,提出了改进的F-score,使其不但能够评价样本特征在两类之间的辨别能力,而且能够度量样本特征在多类之间的辨别能力大小。以改进的F-score作为特征选择准则,用支持向量机(SVM)评... 将传统F-score度量样本特征在两类之间的辨别能力进行推广,提出了改进的F-score,使其不但能够评价样本特征在两类之间的辨别能力,而且能够度量样本特征在多类之间的辨别能力大小。以改进的F-score作为特征选择准则,用支持向量机(SVM)评估所选特征子集的有效性,实现有效的特征选择。通过UCI机器学习数据库中六组数据集的实验测试,并与SVM、PCA+SVM方法进行比较,证明基于改进F-score与SVM的特征选择方法不仅提高了分类精度,并具有很好的泛化能力,且在训练时间上优于PCA+SVM方法。 展开更多
关键词 F-score 支持向量机 特征选择 主成分分析 核函数主成分分析
下载PDF
聚类有效性评价新指标 被引量:33
9
作者 谢娟英 周颖 +1 位作者 王明钊 姜炜亮 《智能系统学报》 CSCD 北大核心 2017年第6期873-882,共10页
聚类有效性评价指标分为外部评价指标和内部评价指标两大类。现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数。针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别... 聚类有效性评价指标分为外部评价指标和内部评价指标两大类。现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数。针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别基于相依表和样本对的外部评价指标,用于评价任意分布数据集的聚类结果;提出采用方差度量类内紧密度和类间分离度,以类间分离度与类内紧密度之比作为度量指标的内部评价指标。UCI数据集和人工模拟数据集实验测试表明,提出的新内部评价指标能有效发现数据集的真实类簇数;提出的基于相依表和样本对的外部评价指标,可有效评价存在类偏斜与噪音数据的聚类结果。 展开更多
关键词 聚类 聚类有效性 评价指标 外部指标 内部指标 F-MEASURE Adjusted Rand INDEX STDI S2 PS2
下载PDF
基于邻域的K中心点聚类算法 被引量:32
10
作者 谢娟英 郭文娟 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期16-22,共7页
提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个... 提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个初始中心位于同一类簇的潜在缺陷.通过UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集实验测试,表明提出的基于邻域的K中心点算法不仅具有很好的聚类效果,而且运行时间短,对噪音数据有很强的抗干扰性能,优于传统K中心点算法和Park等人的快速K中心点算法. 展开更多
关键词 邻域 K中心点算法 样本密度 聚类 样本空间分布
下载PDF
基于统计相关性与K-means的区分基因子集选择算法 被引量:56
11
作者 谢娟英 高红超 《软件学报》 EI CSCD 北大核心 2014年第9期2050-2075,共26页
针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原... 针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原则选取与类标相关性较大的若干基因构成预选择基因子集;然后,采用K-means算法将预选择基因子集中高度相关的基因聚集到同一类簇,训练SVM分类模型,计算每一个基因的权重,从每一类簇选择一个权重最大或者采用轮盘赌思想从每一类簇选择一个得票数最多的基因作为本类簇的代表基因,各类簇的代表基因构成有效区分基因子集.将该算法与采用随机策略选择各类簇代表基因的随机基因选择算法Random,Guyon的经典基因选择算法SVM-RFE、采用顺序前向搜索策略的基因选择算法SVM-SFS进行实验比较,几个经典基因数据集上的200次重复实验的平均实验结果表明:所提出的混合基因选择算法能够选择到区分性能非常好的基因子集,建立在该区分基因子集上的分类器具有非常好的分类性能. 展开更多
关键词 区分基因子集选择 Pearson 相关系数 Wilcoxon 秩和检验 K-MEANS 聚类 统计相关性 FILTER 算法 Wrapper算法
下载PDF
非平衡基因数据的差异表达基因选择算法研究 被引量:11
12
作者 谢娟英 王明钊 +2 位作者 周颖 高红超 许升全 《计算机学报》 EI CSCD 北大核心 2019年第6期1232-1251,共20页
针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出了 F2 -measure(简称 F2 )准则.为避免mRMR(minimal Redundancy-Maximal Relevance)的互信息方法倾向于选择多值特征,提出了归一化互信息 SU (Symmetrical Uncertainty).针对最大... 针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出了 F2 -measure(简称 F2 )准则.为避免mRMR(minimal Redundancy-Maximal Relevance)的互信息方法倾向于选择多值特征,提出了归一化互信息 SU (Symmetrical Uncertainty).针对最大化 AUC (Area Under an ROC Curve)框架下,特征选择算法的特征与类标相关性、特征间相关性的取值范围(量纲)不一致问题,提出了归一化的特征权重.为加快特征选择过程,提出了结合 SU和AUC 的特征预选择,缩小特征搜索空间.提出动态加权顺序前向搜索DWSFS(Dynamic Weighted Sequential Forward Search)和动态加权顺序前向浮动搜索DWSFFS(Dynamic Weighted Sequential Forward Floating Search),以期得到分类性能更好的特征子集.基于最大化 AUC 和mRMR框架,结合上述创新点,设计出16种特征选择算法.7个经典二类不平衡基因数据集、3个多类不平衡(或近似平衡)基因数据集的50次重复实验表明:所提算法选择的基因子集具有非常好的分类识别能力;提出的 F2、SU、归一化基因权重、基因预选择,以及DWSFS和DWSFFS对选择非平衡基因数据集的差异表达基因非常有效.提出的 SU 在度量基因冗余性时优于斯皮尔曼等级相关系数 RCC (Rank Correlation Coefficient);基因选择过程中的权值度量采用基因与类标相关性减去基因间冗余性优于采用基因与类标相关性除以基因冗余性方案.与现有经典基因选择算法的实验比较表明:提出的基因选择算法的性能优于现有基因选择算法. 展开更多
关键词 基因选择 AUC 互信息 mRMR 不平衡数据
下载PDF
粒计算优化初始聚类中心的K-medoids聚类算法 被引量:13
13
作者 谢娟英 鲁肖肖 +1 位作者 屈亚楠 高红超 《计算机科学与探索》 CSCD 北大核心 2015年第5期611-620,共10页
针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小... 针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。 展开更多
关键词 粒计算 初始聚类中心 最大最小距离法 K-me doids聚类算法
下载PDF
基于双支持向量机的偏二叉树多类分类算法 被引量:28
14
作者 谢娟英 张兵权 汪万紫 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期354-363,共10页
提出一种基于双支持向量机的偏二叉树多类分类算法,偏二叉树双支持向量机多类分类算法.该算法综合了二叉树支持向量机和双支持向量机的优势,实现了在不降低分类性能的前提下,大大缩短训练时间.理论分析和UCI(University of California I... 提出一种基于双支持向量机的偏二叉树多类分类算法,偏二叉树双支持向量机多类分类算法.该算法综合了二叉树支持向量机和双支持向量机的优势,实现了在不降低分类性能的前提下,大大缩短训练时间.理论分析和UCI(University of California Irvine)机器学习数据库数据集上的实验结果共同证明,偏二叉树双支持向量机多类分类算法在训练时间上具有绝对的优势,尤其在处理稍大数据集的多类分类问题时,这一优势尤为突出;实验仿真结果还证明,在采用非线性核时,该算法取得了比基于经典支持向量机的一对其余多类分类算法及二叉树支持向量机更好的分类效果;同时该算法还解决了后两种算法可能存在的样本不平衡问题,以及基于经典支持向量机的一对其余多类分类算法可能存在的不可分区域问题. 展开更多
关键词 双支持向量机 偏二叉树支持向量机 支持向量机 多类分类
下载PDF
最小方差优化初始聚类中心的K-means算法 被引量:86
15
作者 谢娟英 王艳娥 《计算机工程》 CAS CSCD 2014年第8期205-211,223,共8页
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该... 传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。 展开更多
关键词 聚类 K-MEANS算法 方差 紧密度 初始聚类中心
下载PDF
不同健康教育方法在糖尿病足高危患者护理中的应用价值研究 被引量:54
16
作者 谢娟英 邹建平 张琼飞 《中国全科医学》 CAS 北大核心 2017年第A01期197-199,共3页
目的探讨不同教育方法在糖尿病足高危患者护理中的应用价值。方法选取我院2014年3月—2016年3月收治的150例糖尿病足高危患者为研究对象,根据患者入院顺序将其分为对照组和观察组,两组各75例。对照组采用传统健康教育方法,观察组采用个... 目的探讨不同教育方法在糖尿病足高危患者护理中的应用价值。方法选取我院2014年3月—2016年3月收治的150例糖尿病足高危患者为研究对象,根据患者入院顺序将其分为对照组和观察组,两组各75例。对照组采用传统健康教育方法,观察组采用个性化系统性健康教育方法,两组均随访4个月,观察并比较两组患者自我护理能力、血糖控制情况和糖尿病足发病情况。结果健康教育护理4个月后,观察组自我护理能力各项评分均高于对照组,差异有统计学意义(P<0.05);观察组空腹血糖(FBG)、餐后血糖(PBG)均低于对照组,差异有统计学意义(P<0.05);观察组随访期糖尿病足发病率4.0%(3/75)低于对照组13.3%(10/75),差异有统计学意义(P<0.05)。结论个性化系统性健康教育有助于提高糖尿病足高危患者自我护理能力和控制血糖,降低糖尿病足发病率。 展开更多
关键词 糖尿病足 健康教育 自我护理
下载PDF
基于特征子集区分度与支持向量机的特征选择算法 被引量:64
17
作者 谢娟英 谢维信 《计算机学报》 EI CSCD 北大核心 2014年第8期1704-1718,共15页
考虑特征之间的相关性对于其类间区分能力的影响,提出了一种新的特征子集区分度衡量准则——DFS(Discernibility of Feature Subsets)准则.该准则考虑特征之间的相关性,通过计算特征子集中全部特征对于分类的联合贡献来判断特征子集的... 考虑特征之间的相关性对于其类间区分能力的影响,提出了一种新的特征子集区分度衡量准则——DFS(Discernibility of Feature Subsets)准则.该准则考虑特征之间的相关性,通过计算特征子集中全部特征对于分类的联合贡献来判断特征子集的类间辨别能力大小,不再只考虑单个特征对于分类的贡献.结合顺序前向、顺序后向、顺序前向浮动和顺序后向浮动4种特征搜索策略,以支持向量机(Support Vector Machines,SVM)为分类工具,引导特征选择过程,得到4种基于DFS与SVM的特征选择算法.其中在顺序前/后向浮动搜索策略中,首先根据DFS准则加入/去掉特征到特征子集中,然后在浮动阶段根据所得临时SVM分类器的分类性能决定刚加入/去掉特征的去留.UCI机器学习数据库数据集的对比实验测试表明,提出的DFS准则是一种很好的特征子集类间区分能力度量准则;基于DFS与SVM的特征选择算法实现了有效的特征选择;与其他同类算法相比,基于DFS准则与SVM的特征选择算法具有非常好的泛化性能,但其所选特征子集的规模不一定是最好的. 展开更多
关键词 特征选择 支持向量机 相关性 特征子集区分度 特征区分度
下载PDF
学生成绩关键因素挖掘与成绩预测 被引量:16
18
作者 谢娟英 张宜 陈恩红 《南京信息工程大学学报(自然科学版)》 CAS 2019年第3期316-325,共10页
为了探索影响学习成绩的关键因素,为学生学习、教师教学和学校管理提供帮助,采用密度全局K-means算法对UCI机器学习数据库的葡萄牙学生数据、陕西蒲城县第三高级中学的学生数据进行聚类分析,挖掘影响学生成绩的相关因素,并对学生成绩进... 为了探索影响学习成绩的关键因素,为学生学习、教师教学和学校管理提供帮助,采用密度全局K-means算法对UCI机器学习数据库的葡萄牙学生数据、陕西蒲城县第三高级中学的学生数据进行聚类分析,挖掘影响学生成绩的相关因素,并对学生成绩进行预测分析.葡萄牙学生数据挖掘发现:学生成绩与其所在学校、家庭住址、母亲学历、家庭有无网络有极大相关性,与父亲受教育程度、上学路上花费时间、想上大学、在谈恋爱也有一定相关性.蒲城县第三高级中学学生数据分析发现:学生成绩与其监护人、父母年龄、父母学历、学习态度、课后学习量之间有极大相关性.成绩预测聚类结果显示:预测成绩与实际成绩一致.中外学生数据挖掘揭示:学生成绩与父母受教育程度,特别是母亲受教育程度密切相关,母亲受教育程度越高,孩子学习成绩越好;孩子成长过程中,父母作为监护人的陪伴作用不容忽视;激励和引导学生树立远大理想,调动学生学习的主动性,对学习成绩和成长至关重要;缩小城乡教育差距势在必行. 展开更多
关键词 教育数据挖掘 学生成绩分析 密度全局K-means算法 关联分析 预测分析
下载PDF
一种确定最佳聚类数的新算法 被引量:11
19
作者 谢娟英 马箐 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第1期13-18,共6页
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)... 针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响. 展开更多
关键词 信息粒度 K-均值 全局K-均值 模糊相似度 聚类指标BWP
下载PDF
基于邻域粗糙集的不完整决策系统特征选择算法 被引量:13
20
作者 谢娟英 李楠 乔子芮 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期383-390,共8页
针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件下,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据在约简集合中加入各属性后对正域影响程度大小将属性降... 针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件下,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据在约简集合中加入各属性后对正域影响程度大小将属性降序排列,采用顺序前向搜索,选择当前最佳特征加入特征约简集合,确定最佳特征子集.将该算法扩展到基于邻域粗糙集的实值和混合型不完整决策系统,得到基于邻域粗糙集的不完整决策系统前向顺序特征选择算法.同时,将基于相容关系的不完整决策系统快速属性约简算法推广到实值和混合属性的不完整决策系统,得到适用于实值、混合属性的不完整决策系统后向特征选择算法.理论分析和University of California Irvine机器学习数据库数据集的实验共同表明,本文提出的基于邻域粗糙集的不完整决策系统前向特征选择算法有效降低了不完整决策系统特征选择算法的时间复杂度,在保持系统识别能力的情况下,用更少的时间得到决策系统的属性约简子集,即特征子集.然而,本文前向特征选择算法的缺陷是有可能因为无法选择到第一个最重要的特征(属性)而使特征选择过程不能进行下去,从而不能完成特征选择过程. 展开更多
关键词 不完整决策系统 特征选择 邻域粗糙集 正域
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部