期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
SMOTE和Biased-SVM相结合的不平衡数据分类方法 被引量:16
1
作者 王和勇 樊泓坤 姚正安 《计算机科学》 CSCD 北大核心 2008年第5期174-176,共3页
针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使... 针对不平衡数据集的分类问题,本文利用支持向量机推广能力强的优良特性,提出了SMOTE(Synthetic Minority Over-sampling Technique,SMOTE)和Biased-SVM(Biased Support Vector Machine,Biased-SVM)相结合的方法。该方法首先对原始数据使用Biased-SVM方法,然后对求出的支持向量使用SMOTE向上采样方法进行采样,最后再使用Biased-SVM方法进行分类。实验结果表明,本文采用的SMOTE和Biased-SVM相结合的方法可提高不平衡数据集分类精度。 展开更多
关键词 机器学习 不平衡数据 数据分类 SMOTE biased-SVM
下载PDF
Global patterns of fern species diversity:An evaluation of fern data in GBIF 被引量:2
2
作者 Hong Qian Jian Zhang Mei-Chen Jiang 《Plant Diversity》 SCIE CAS CSCD 2022年第2期135-140,共6页
Despite that several studies have shown that data derived from species lists generated from distribution occurrence records in the Global Biodiversity Information Facility(GBIF)are not appropriate for those ecological... Despite that several studies have shown that data derived from species lists generated from distribution occurrence records in the Global Biodiversity Information Facility(GBIF)are not appropriate for those ecological and biogeographic studies that require high sampling completeness,because species lists derived from GBIF are generally very incomplete,Suissa et al.(2021)generated fern species lists based on data with GBIF for 100 km×100 km grid cells across the world,and used the data to determine fern diversity hotspots and species richness-climate relationships.We conduct an evaluation on the completeness of fern species lists derived from GBIF at the grid-cell scale and at a larger spatial scale,and determine whether fern data derived from GBIF are appropriate for studies on the relations of species composition and richness with climatic variables.We show that species sampling completeness of GBIF is low(<40%)for most of the grid cells examined,and such low sampling completeness can substantially bias the investigation of geographic and ecological patterns of species diversity and the identification of diversity hotspots.We conclude that fern species lists derived from GBIF are generally very incomplete across a wide range of spatial scales,and are not appropriate for studies that require data derived from species lists in high completeness.We present a map showing global patterns of fern species diversity based on complete or nearly complete regional fern species lists. 展开更多
关键词 CLIMATE data bias FERN GBIF Species diversity Species list
下载PDF
What Does Information Science Offer for Data Science Research?:A Review of Data and Information Ethics Literature
3
作者 Brady Lund Ting Wang 《Journal of Data and Information Science》 CSCD 2022年第4期16-38,共23页
This paper reviews literature pertaining to the development of data science as a discipline,current issues with data bias and ethics,and the role that the discipline of information science may play in addressing these... This paper reviews literature pertaining to the development of data science as a discipline,current issues with data bias and ethics,and the role that the discipline of information science may play in addressing these concerns.Information science research and researchers have much to offer for data science,owing to their background as transdisciplinary scholars who apply human-centered and social-behavioral perspectives to issues within natural science disciplines.Information science researchers have already contributed to a humanistic approach to data ethics within the literature and an emphasis on data science within information schools all but ensures that this literature will continue to grow in coming decades.This review article serves as a reference for the history,current progress,and potential future directions of data ethics research within the corpus of information science literature. 展开更多
关键词 data science Library and information science data ethics data bias Education
下载PDF
The Intersection of Privacy by Design and Behavioral Economics: Nudging Users towards Privacy-Friendly Choices
4
作者 Vivek Kumar Agarwal 《Journal of Information Security》 2024年第4期557-563,共7页
This paper conducts a comprehensive review of existing research on Privacy by Design (PbD) and behavioral economics, explores the intersection of Privacy by Design (PbD) and behavioral economics, and how designers can... This paper conducts a comprehensive review of existing research on Privacy by Design (PbD) and behavioral economics, explores the intersection of Privacy by Design (PbD) and behavioral economics, and how designers can leverage “nudges” to encourage users towards privacy-friendly choices. We analyze the limitations of rational choice in the context of privacy decision-making and identify key opportunities for integrating behavioral economics into PbD. We propose a user-centered design framework for integrating behavioral economics into PbD, which includes strategies for simplifying complex choices, making privacy visible, providing feedback and control, and testing and iterating. Our analysis highlights the need for a more nuanced understanding of user behavior and decision-making in the context of privacy, and demonstrates the potential of behavioral economics to inform the design of more effective PbD solutions. 展开更多
关键词 Privacy by Design Behavioral Economics Nudges User-Centric Design data Protection Cognitive biases HEURISTICS
下载PDF
基于二维有偏距离插值的双层嵌入可逆信息隐藏算法
5
作者 郭媛 晁恒 《燕山大学学报》 CAS 北大核心 2024年第5期428-436,共9页
针对目前可逆信息隐藏技术存在载密图像嵌入率与失真度无法兼顾的问题,提出一种基于二维有偏距离插值的双层嵌入可逆信息隐藏方案。第一层嵌入将图像像素按棋盘式划分为两组,采用改进的全向梯度参数结合二维有偏距离插值算法,用其中一... 针对目前可逆信息隐藏技术存在载密图像嵌入率与失真度无法兼顾的问题,提出一种基于二维有偏距离插值的双层嵌入可逆信息隐藏方案。第一层嵌入将图像像素按棋盘式划分为两组,采用改进的全向梯度参数结合二维有偏距离插值算法,用其中一组像素预测另一组像素,再按照预测误差扩展方式嵌入秘密信息。第二层嵌入将剩余一组像素作为目标像素,再进行预测和嵌入,进一步提高嵌入率。本文从算法可逆性、预测精度、嵌入容量和载密图像失真度等多方面进行实验分析,结果表明,双层嵌入恢复后图像峰值信噪比为∞,不同种类隐藏图像像素和恢复图像像素均方误差均为0,表明算法可实现完全可逆隐藏;对不同种类载体图像进行测试,测试图像平均预测误差绝对值小于4的比例为79%,表明算法预测精度高;嵌入率对比实验表明,与其他算法相比,本算法均为最高,且双层嵌入较单层嵌入率平均提升30%以上,充分利用了像素冗余性;嵌入率为0.7 bit/pixel时,本算法载密图像和原始图像的峰值信噪比平均为39.854 dB,高于同类算法3~5 dB,表明载密图像失真度更低。本文还对阈值与嵌入率、结构相似性与嵌入率之间的关联进行分析和对比实验,深入探讨了高嵌入率的获得条件。本算法可较好解决载密图像嵌入率和嵌入失真不平衡的矛盾,综合性能更优。 展开更多
关键词 可逆信息隐藏 预测误差扩展 二维有偏距离插值 全向梯度 双层嵌入
下载PDF
互联网信息技术的年龄偏向性特征检验——基于CHIP和CLDS数据的实证分析 被引量:1
6
作者 刘西涛 李立辉 《科学决策》 CSSCI 2023年第5期106-118,共13页
年龄结构和技术背景是影响经济发展的两个重要因素,这两者都会对劳动者的产出效率产生重要的影响。分别采用了CHIP2002、CHIP2007、CLDS2012、CLDS2018四个年份上的横截面数据,对互联网信息技术和年龄产出关系特征进行了纵向对比分析。... 年龄结构和技术背景是影响经济发展的两个重要因素,这两者都会对劳动者的产出效率产生重要的影响。分别采用了CHIP2002、CHIP2007、CLDS2012、CLDS2018四个年份上的横截面数据,对互联网信息技术和年龄产出关系特征进行了纵向对比分析。通过改进的明瑟方程,选定具体的子样本以保证产出效率和工资率的一致性,并对组群效应进行控制。结果表明,互联网信息技术的年龄偏向性特征主要发生在2012-2018期间。这表现为劳动者黄金年龄整体前移,老年劳动者相对年轻和中年群体的相对产出效率显著下降。需要制定灵活化的退休年龄标准,还应充分考虑各职业和岗位上的劳动供求关系。 展开更多
关键词 互联网信息技术 年龄偏向性特征 CLDS数据
下载PDF
生成式人工智能的三大安全风险及法律规制——以ChatGPT为例 被引量:161
7
作者 刘艳红 《东方法学》 CSSCI 北大核心 2023年第4期29-43,共15页
ChatGPT的横空出世意味着人工智能的发展获得全新动能,根据生成式人工智能从准备、运算到生成阶段的运行机理,可以发现其中存在三大安全风险。针对生成式人工智能在准备阶段的数据风险,应基于总体国家安全观统筹使用国家数据,对政务数... ChatGPT的横空出世意味着人工智能的发展获得全新动能,根据生成式人工智能从准备、运算到生成阶段的运行机理,可以发现其中存在三大安全风险。针对生成式人工智能在准备阶段的数据风险,应基于总体国家安全观统筹使用国家数据,对政务数据进行合规监管,在个人数据的收集广度上保持合规并以最小比例原则确定处理深度,以确保生成结论的真实性。针对生成式人工智能在运算阶段的算法模型特点及算法偏见风险,应通过技管结合进行修正,完善技术标准并予以实质审查,建立自动化、生态化、全流程的动态监管体系。针对生成式人工智能在生成阶段的知识产权风险,鉴于其生成物的独特属性,应基于可解释性重塑其保护模式,明确保护的对象是ChatGPT中的可解释算法及其生成物,并构建全流程知产合规保护体系。对于生成式人工智能在未来可能造成的其他安全风险,宜基于风险预防主义加以防范,争取在最大程度上发挥生成式人工智能的技术效能,并减少新兴技术对社会发展造成的负面冲击。 展开更多
关键词 ChatGPT 生成式人工智能 合规制度 数据安全 算法偏见 知识产权
下载PDF
基于有偏卡尔曼的双冗余热电阻数据滤波方法
8
作者 徐正海 左信 +2 位作者 吴露 陈亚男 岳元龙 《化工自动化及仪表》 CAS 2023年第2期188-193,共6页
针对水下生产控制系统温度测量系统中单个传感器易受水下复杂环境影响,出现温漂、测量精度低等问题,设计了一种双冗余温度测量传感器(采用两个热敏元件进行温度测量)。利用基于有偏卡尔曼的扩维融合方法进行数据处理,提高传感器融合测... 针对水下生产控制系统温度测量系统中单个传感器易受水下复杂环境影响,出现温漂、测量精度低等问题,设计了一种双冗余温度测量传感器(采用两个热敏元件进行温度测量)。利用基于有偏卡尔曼的扩维融合方法进行数据处理,提高传感器融合测量精度。定义一个相似矩阵,用于在融合之前剔除故障传感器的测量数据,进一步提高测量结果的可靠性。实验结果表明:双冗余温度测量传感器具有精度高、抗干扰性能强的优点。 展开更多
关键词 温度测量 双冗余 传感器 有偏卡尔曼 数据融合 扩维
下载PDF
长度偏差完全数据下均值剩余寿命的矩类估计
9
作者 武洪萍 《工程数学学报》 CSCD 北大核心 2023年第6期1001-1010,共10页
长度偏差数据在寿命研究中是广泛存在的,但是在长度偏差完全样本下对均值剩余寿命的研究却相对较少。作为生存分析中评估个体生存情况的重要指标之一,均值剩余寿命也越来越受到统计研究者的关注。为了在长度偏差完全数据下建立均值剩余... 长度偏差数据在寿命研究中是广泛存在的,但是在长度偏差完全样本下对均值剩余寿命的研究却相对较少。作为生存分析中评估个体生存情况的重要指标之一,均值剩余寿命也越来越受到统计研究者的关注。为了在长度偏差完全数据下建立均值剩余寿命函数的非参数估计,采用逆概率加权方法,以矩估计为基础,得到了均值剩余寿命的两种估计量,并证明了两个估计量在适当条件下分别依分布收敛到均值为零的正态变量。为了评估两种点估计在有限样本下的优劣,还进行了一系列的数值模拟试验,并将模拟结果与已有方法进行了比较。数值结果表明了两种估计方法的合理性。 展开更多
关键词 剩余寿命 均值 长度偏差数据 矩类估计 中心极限定理
下载PDF
提高测量可靠性的多传感器数据融合有偏估计方法 被引量:43
10
作者 岳元龙 左信 罗雄麟 《自动化学报》 EI CSCD 北大核心 2014年第9期1843-1852,共10页
为了提高测量数据可靠性,多传感器数据融合在过程控制领域得到了广泛应用.本文基于有偏估计能够减小最小二乘无偏估计方差的思想,提出采用多传感器有偏估计数据融合改善测量数据可靠性的方法.首先,基于岭估计提出了有偏测量过程,并给出... 为了提高测量数据可靠性,多传感器数据融合在过程控制领域得到了广泛应用.本文基于有偏估计能够减小最小二乘无偏估计方差的思想,提出采用多传感器有偏估计数据融合改善测量数据可靠性的方法.首先,基于岭估计提出了有偏测量过程,并给出了测量数据可靠性定量表示方法,同时证明了有偏测量可靠度优于无偏测量可靠度.其次,提出了多传感器有偏估计数据融合方法,证明了现有集中式与分布式无偏估计数据融合之间的等价性.最后,证明了多传感器有偏估计数据融合收敛于无偏估计数据融合.实例应用验证了方法的有效性. 展开更多
关键词 测量 可靠性 数据融合 有偏估计 岭估计
下载PDF
数据挖掘取样方法研究 被引量:54
11
作者 胡文瑜 孙志挥 吴英杰 《计算机研究与发展》 EI CSCD 北大核心 2011年第1期45-54,共10页
取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取... 取样是一种通用有效的近似技术.在数据挖掘研究中,取样方法可显著减小所处理数据集的规模,使得众多数据挖掘算法得以应用到大规模数据集以及数据流数据上.通过对应用于数据挖掘领域的代表性取样方法的比较研究和分析总结,提出了一个取样算法分类框架.在指出了均匀取样局限性的基础上阐述了某些应用场景中选用偏倚取样方法的必要性,综述了取样技术在数据挖掘领域的应用研究与应用发展,最后对数据流挖掘取样方法面临的挑战和发展方向进行了展望. 展开更多
关键词 数据挖掘 均匀取样 偏倚取样 数据流 概要数据结构
下载PDF
基于ν-SVM的不平衡数据挖掘研究 被引量:8
12
作者 郑恩辉 许宏 +1 位作者 李平 宋执环 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2006年第10期1682-1687,共6页
针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些... 针对基于精度的现有分类算法对不平衡数据挖掘表现出“有偏性”,即正例样本的分类和预测性能差于反例样本的分类和预测性能,基于-νSVM及其启发,提出支持向量数和边界支持向量数的界,进而提出支持向量率和边界支持向量率的界,并把这些界分别扩展到正例和反例.在此基础上,证明了正例的支持向量率和边界支持向量率分别依概率大于反例的支持向量率和边界支持向量率,以及正例的分类性能依概率差于反例的分类性能.针对German credit和Heart disease两个Benchmark数据集的试验研究,验证了本文假设的合理性和上述结论的正确性. 展开更多
关键词 不平衡数据 有偏分类器 支持向量机
下载PDF
不平衡数据知识挖掘:类分布对支持向量机分类的影响 被引量:17
13
作者 郑恩辉 李平 宋执环 《信息与控制》 CSCD 北大核心 2005年第6期703-708,共6页
基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和... 基于标准支持向量机及其启发,提出并证明支持向量数(率)和边界支持向量数(率)的界,并分别推广到正例类和反例类.在此基础上,证明正例的分类精度依概率小于反例的分类精度.虚拟数据仿真和Benchm ark数据仿真表明本文所提方法的有效性和结论的正确性.* 展开更多
关键词 不平衡数据 有偏分类器 支持向量机
下载PDF
一种基于密度偏差抽样的孤立点检测算法 被引量:3
14
作者 余建桥 葛继科 李娅 《计算机科学》 CSCD 北大核心 2004年第10期206-208,共3页
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法... 孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。 展开更多
关键词 孤立点 检测算法 数据约简 大规模数据 知识发现 点检 识别 样本数据 区域 抽样
下载PDF
密度偏差抽样技术在聚类算法中的应用研究 被引量:7
15
作者 余波 朱东华 +1 位作者 刘嵩 郑涛 《计算机科学》 CSCD 北大核心 2009年第2期207-209,264,共4页
针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法。利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能... 针对在大规模数据集上进行聚类困难的问题,分析了抽样技术的优点,研究了数据挖掘领域中的随机抽样的特点,并在此基础上提出了一种基于密度的偏差抽样方法。利用密度偏差抽样所获得的样本数据集能够较准确地反映总体数据集的特征,并且能够灵活地控制对数据集不同区域的抽样率。实验证明,在大规模数据集上进行聚类时,密度偏差抽样在时间复杂度上要优于随机抽样。 展开更多
关键词 数据挖掘 聚类 偏差抽样 随机抽样
下载PDF
基于有偏卡尔曼的多传感器数据融合研究 被引量:7
16
作者 岳元龙 陈亚南 +1 位作者 孙钦 左信 《仪表技术与传感器》 CSCD 北大核心 2022年第1期82-86,共5页
推导出偏参数为矩阵形式的有偏卡尔曼滤波(BKF)的完整迭代过程,该算法在均方误差条件下优于卡尔曼滤波(KF),可以进一步提高估计的精度。将BKF与多传感器融合算法中的扩维融合和序贯式融合相结合,推导出多传感器扩维有偏卡尔曼滤波和多... 推导出偏参数为矩阵形式的有偏卡尔曼滤波(BKF)的完整迭代过程,该算法在均方误差条件下优于卡尔曼滤波(KF),可以进一步提高估计的精度。将BKF与多传感器融合算法中的扩维融合和序贯式融合相结合,推导出多传感器扩维有偏卡尔曼滤波和多传感器序贯有偏卡尔曼滤波算法,并从理论上证明了多传感器序贯BKF融合在均方误差条件下优于扩维BKF融合。仿真实验结果表明:在均方误差条件下,多传感器扩维BKF融合和序贯BKF融合优于扩维KF融合和序贯KF融合,序贯BKF融合优于扩维BKF融合。 展开更多
关键词 卡尔曼滤波 数据融合 有偏估计 多传感器融合 序贯融合 扩维融合
下载PDF
产业价值链提升路径的理论与实证研究——以长三角制造业为例 被引量:31
17
作者 周彩红 《中国软科学》 CSSCI 北大核心 2009年第7期163-171,共9页
对于嵌入跨国公司全球生产体系的发展中国家或地区来说,谋求产业价值链的高端提升和提升国际分工地位是重要的发展目标。本文不仅从理论上说明了FDI、国际贸易、技术创新、国际分工等因素能够影响产业价值链提升,并且运用面板数据模型... 对于嵌入跨国公司全球生产体系的发展中国家或地区来说,谋求产业价值链的高端提升和提升国际分工地位是重要的发展目标。本文不仅从理论上说明了FDI、国际贸易、技术创新、国际分工等因素能够影响产业价值链提升,并且运用面板数据模型、有偏估计等方法验证了这些因素对长三角制造业发展的影响。扩大吸引外资、积极开展对外贸易、增加研发投入和强化区域分工等可以推动包括长三角在内的我国制造业价值链提升。 展开更多
关键词 面板数据 有偏估计 价值链
下载PDF
面向轨迹数据流的KNN近似查询 被引量:4
18
作者 王考杰 郑雪峰 +1 位作者 宋一丁 曲阜平 《计算机工程》 CAS CSCD 北大核心 2011年第16期17-20,共4页
提出一种基于滑动窗口的K-最近邻(KNN)近似查询算法。将滑动窗口内数据通过聚类划分成若干大小不一的基本窗口,针对每个基本窗口给定一个采样率,对窗口内数据进行偏倚采样,形成数据流摘要,并基于该摘要,采用计算几何平面扫描算法执行分... 提出一种基于滑动窗口的K-最近邻(KNN)近似查询算法。将滑动窗口内数据通过聚类划分成若干大小不一的基本窗口,针对每个基本窗口给定一个采样率,对窗口内数据进行偏倚采样,形成数据流摘要,并基于该摘要,采用计算几何平面扫描算法执行分布式最近邻查询。仿真实验结果表明该算法有效,且具有较好的可扩展性。 展开更多
关键词 轨迹数据流 局部聚类 偏倚采样 数据摘要 K-最近邻查询
下载PDF
Uncertainties in Quantitatively Estimating the Atmospheric Heat Source over the Tibetan Plateau 被引量:8
19
作者 DUAN An-Min WANG Mei-Rong XIAO Zhi-Xiang 《Atmospheric and Oceanic Science Letters》 CSCD 2014年第1期28-33,共6页
As a huge,intense,and elevated atmospheric heat source(AHS) approaching the mid-troposphere in spring and summer,the Tibetan Plateau(TP) thermal forcing is perceived as an important factor contributing to the formatio... As a huge,intense,and elevated atmospheric heat source(AHS) approaching the mid-troposphere in spring and summer,the Tibetan Plateau(TP) thermal forcing is perceived as an important factor contributing to the formation and variation of the Asian summer monsoon.Despite numerous studies devoted to determine the strength and change of the thermal forcing of the TP on the basis of various data sources and methods,uncertainties remain in quantitative estimation of the AHS and will persist for the following reasons:(1) Routine meteorological stations cover only limited regions and show remarkable spatial inhomogeneity with most distributed in the central and eastern plateau.Moreover,all of these stations are situated at an altitude below 5000 m.Thus,the large area above that elevation is not included in the data.(2) Direct observations on heat fluxes do not exist at most stations,and the sensible heat flux(SHF) is calculated by the bulk formula,in which the drag coefficient for heat is often treated as an empirical constant without considering atmospheric stability and thermal roughness length.(3) Radiation flux derived by satellite remote sensing shows a large discrepancy in the algorithm in data inversion and complex terrain.(4) In reanalysis data,besides the rare observational records employed for data assimilation,model bias in physical processes induces visible errors in producing the diabatic heating fields. 展开更多
关键词 Tibetan Plateau atmospheric heat source data bias UNCERTAINTIES
下载PDF
转子故障特征数据分类的KPCA-BFDA方法 被引量:6
20
作者 马再超 赵荣珍 杨文瑛 《振动.测试与诊断》 EI CSCD 北大核心 2013年第2期192-198,334-335,共7页
对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判... 对非线性转子系统故障特征数据的分类方法进行了研究。在提出一种偏费歇判别分析法(biased fisher discriminatory analysis,简称BFDA)的前提下,进一步提出将核主成分分析法(kernel principal component analysis,简称KPCA)与偏费歇判别分析法相结合的数据集降维方法,该方法中的核主成分分析步骤用于构造剔除数据集冗余信息的降维数据集,偏费歇判别分析步骤用于进一步降低数据集维数并提高不同类别数据子集间的分离程度。对实例数据与典型故障数据的分类结果表明,提出的偏费歇判别分析法在具备费歇判别分析降维可分性能的基础上,具有更低计算复杂度的特点。提出的核主成分分析结合偏费歇判别分析的算法,其对应的降维结果能直接应用于线性分类器,且取得了较好的分类效果。 展开更多
关键词 故障特征数据集 数据分类 偏费歇判别分析 核主成分分析
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部