题名 混合不完备数据的新型双邻域粗糙集分类方法
1
作者
黄恒秋
陈素霞
翁世洲
机构
广西民族师范学院数理与电子信息工程学院
河南轻工职业学院计算机与艺术设计系
广西民族师范学院经济管理学院
出处
《现代计算机》
2022年第22期31-36,共6页
基金
广西高校中青年教师科研基础能力提升项目(2020KY20012):混合型不完备数据的邻域粗糙集分类方法
广西高校中青年教师科研基础能力提升项目(2022KY0764):概率数及其在不确定决策理论中的应用研究
广西民族师范学院校级科研项目(2020YB007):模糊区间粗糙数信息系统下的多属性决策方法及应用研究。
文摘
针对混合不完备数据集,提出了一种新型双邻域粗糙集分类方法。首先,定义一个无参数的邻域联系度距离,并建立基于无参数邻域联系度距离的双邻域粗糙集模型;其次,基于所构建的模型,给出基于覆盖约简的双邻域粗糙集规则约简方法,获得约简后的上近似规则集和下近似规则集;再次,基于约简后的上、下近似规则集,给出最近邻分类方法;最后,取7个UCI公共测试集做实验分析,通过与混合距离HEOM、带参数邻域联系度距离的双邻域粗糙集分类方法对比,结果表明提出的分类方法仍然取得了优异的分类效果,其突出的优势是不再需要通过大量实验来确定其参数值。
关键词
混合不完备数据 集
双邻域粗糙集
邻域联系度距离
分类
Keywords
mixed incomplete data
double-neighborhood rough set
neighborhood connection degree distance
classification
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 混合不完备数据的拓展高斯核-支持向量机分类方法
2
作者
黄恒秋
翁世洲
机构
广西民族师范学院数理与电子信息工程学院
广西民族师范学院经济管理学院
出处
《现代计算机》
2022年第21期18-25,共8页
基金
广西高校中青年教师科研基础能力提升项目(2020KY20012):混合型不完备数据的邻域粗糙集分类方法
广西高校中青年教师科研基础能力提升项目:概率数及其在不确定决策理论中的应用研究
广西民族师范学院校级科研项目(2020YB007):模糊区间粗糙数信息系统下的多属性决策方法及应用研究。
文摘
针对混合不完备数据集,提出一种基于邻域联系度距离拓展高斯核函数的支持向量机分类方法。首先,给出了基于邻域联系度距离拓展高斯核函数的定义;其次,给出基于二次函数逼近的支持向量机SMO训练算法和分类算法;最后,取多个UCI数据集进行了实验分析,通过与填充支持向量机、混合距离支持向量机和风险重构支持向量机分类方法进行比较,结果表明提出的分类方法在不对缺失值作任何处理、不改变支持向量机模型结构与约束条件的情况下,仍然获得了优异的分类效果。
关键词
混合不完备数据
联系度距离
联系度距离高斯核
支持向量机
Keywords
incomplete data with hybrid value
connection degree distance
connection degree distance Gaussian kernel
support vector machine
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 面向不完备混合数据的模糊多粒度异常检测
3
作者
唐宇皓
彭德中
袁钟
机构
四川大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2024年第10期3097-3104,共8页
基金
国家自然科学基金资助项目(62306196)
四川省科技计划项目(2023YFQ0020,2022YFSY0047)
中央高校基本科研业务费专项资金资助项目(YJ202245)。
文摘
针对现有的异常检测方法大多无法有效处理不完备混合数据的问题,提出一种面向不完备混合数据的模糊多粒度异常检测算法ADFIIS(Anomaly Detection in Fuzzy Incomplete Information System),所提算法考虑在标称属性和在数值属性上出现缺失值的情况,能处理混合属性数据。首先,定义属性之间的模糊相似度;其次,计算每个属性的模糊熵,基于熵的大小使用多粒度的思想构建多个属性序列;再次,计算每个样本的异常值以表征它的异常程度;最后,设计相应的ADFIIS算法并分析它的复杂度。在公开数据集上进行实验,将所提算法与ILGNI(Incomplete Local and Global Neighborhood Information network)等主流离群点检测算法对比。实验结果表明,ADFIIS在不完备混合数据集上的受试者操作特征(ROC)曲线效果更好。ADFIIS的曲线下面积(AUC)的平均值优于90%的对比方法,相较于同样能够处理不完备混合数据的ILGNI,它的AUC平均值提升了7个百分点。所提算法使用模型扩展法在不改变原始数据集的情况下对不完备数据集进行异常检测,拓展了异常检测的适用范围。
关键词
模糊粗糙集
多粒度
异常检测
离群检测
不完备 混合 数据
Keywords
fuzzy rough set
multi-granularity
anomaly detection
outlier detection
incomplete mixed data
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
题名 变精度下不完备混合数据的增量式属性约简方法
被引量:15
4
作者
王映龙
曾淇
钱文彬
舒文豪
黄锦涛
机构
江西农业大学计算机与信息工程学院
江西农业大学软件学院
华东交通大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2018年第10期2764-2771,共8页
基金
国家自然科学基金资助项目(61502213
61662023)
江西省自然科学基金资助项目(20161BAB212049)~~
文摘
为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50. 0%、36. 8%、40. 0%、64. 7%和38. 2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2. 99 s、3. 13 s、9. 70 s、274. 19 s和50. 87 s,静态算法的平均耗时分别为284. 92 s、302. 76 s、1062. 23 s、3510. 79 s和667. 85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。
关键词
粗糙集
属性约简
邻域关系
增量式方法
不完备 混合 数据
Keywords
rough set
attribute reduction
neighborhood relation
incremental method
incomplete hybrid data
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 面向不完备混合数据的矩阵增量知识维护方法研究
被引量:5
5
作者
黄倩倩
李天瑞
杨新
王国强
胡节
机构
西南交通大学计算机科学与技术学院
西南交通大学人工智能研究院
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第4期868-877,共10页
基金
国家自然科学基金项目(61573292,61572406,61603313)资助
中央高校基本科研业务费项目(2682017CX097)资助。
文摘
现有邻域粗糙集模型可用于处理包含名义型和数值型两种类型共存的混合数据,但较少考虑混合数据的不完备性.本文从缺失值的两种语义解释出发,即"不关心值"和"丢失值",通过定义邻域特征关系和量化邻域特征关系,提出了面向不完备混合数据的两种新型邻域粗糙集模型,并给出了粗糙邻域近似知识的矩阵计算表达方法.此外,在属性集动态变化下,介绍了基于扩展邻域粗糙集模型的快速增量知识维护机理和方法.最后通过实例验证了所提出增量更新方法的有效性.
关键词
不完备 混合 数据
粗糙集
邻域关系
矩阵运算
增量更新
Keywords
incomplete hybrid data
rough set
neighborhood relation
matrix operations
incremental updating
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 不完备混合型数据的决策粗糙集与三支决策分类算法
被引量:2
6
作者
王光琼
机构
四川文理学院智能制造学院
出处
《计算机应用与软件》
北大核心
2020年第11期246-254,共9页
基金
“2019年中国物流学会/中国物流与采购联合会面上研究课题计划”面上项目(2019CSLKT3-231)
四川省教育厅重点项目(18ZA0421)。
文摘
决策粗糙集是目前粗糙集理论的重要研究分支。目前的决策粗糙集很少对不完备混合型的信息系统进行研究,为了改善这一局限,提出一种扩展的决策粗糙集模型。通过引入邻域容差关系来处理不完备混合型信息系统,在其基础上定义扩展的决策粗糙集模型,同时提出相应的三支决策。在该模型的基础上设计一种最小化决策代价的属性约简算法。根据三支决策,构建出一种不完备混合型数据的三支决策分类算法。实验结果表明,该算法具有更高的数据分类精度和更小的误分类代价。
关键词
粗糙集
决策粗糙集
不完备 混合 型数据
三支决策
属性约简
分类
Keywords
Rough set
Decision-theoretic rough set
Incomplete mixed data
Three-way decisions
Attribute reduction
Classification
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 不完备混合决策系统的三支决策模型与规则获取方法
被引量:5
7
作者
钱文彬
彭莉莎
王映龙
段德林
机构
江西农业大学计算机与信息工程学院
江西农业大学软件学院
出处
《计算机应用研究》
CSCD
北大核心
2020年第5期1421-1427,共7页
基金
国家自然科学基金资助项目(61502213,61662023,71461013)
江西省自然科学基金资助项目(20161BAB212049)。
文摘
现有三支决策主要针对各类完备信息系统或不完备单一型信息系统进行研究,而现实应用领域中数据往往呈现不完备性和复杂性等特征,为此,构建面向不完备混合决策系统的三支决策模型与规则获取方法。首先,计算不完备混合数据的完备邻域容差类,并将其代替等价类计算三支决策模型的条件概率;然后,根据扩展的损失函数区间概念获取各对象在乐观、折中和悲观决策下的不同阈值,进而针对不完备混合决策系统构造三种决策风险下的三支决策模型;最后,通过理论分析和医疗诊断实例详细分析了算法的有效性和可解释性,并通过实验比较和分析可知,所构模型较其他已有模型的分类过程更加合理有效,同时该模型也扩充了三支决策模型和知识发现的理论与应用研究。
关键词
粗糙集
三支决策
不完备 混合 数据
规则获取
粒计算
Keywords
rough set
three-way decisions
incomplete composite data
rule acquisition
granular computing
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]