期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
A Novel Method for Cross-Subject Human Activity Recognition with Wearable Sensors
1
作者 Qi Zhang Feng Jiang +4 位作者 Xun Wang Jinnan Duan Xiulai Wang Ningling Ma Yutao Zhang 《Journal of Sensor Technology》 2024年第2期17-34,共18页
Human Activity Recognition (HAR) is an important way for lower limb exoskeleton robots to implement human-computer collaboration with users. Most of the existing methods in this field focus on a simple scenario recogn... Human Activity Recognition (HAR) is an important way for lower limb exoskeleton robots to implement human-computer collaboration with users. Most of the existing methods in this field focus on a simple scenario recognizing activities for specific users, which does not consider the individual differences among users and cannot adapt to new users. In order to improve the generalization ability of HAR model, this paper proposes a novel method that combines the theories in transfer learning and active learning to mitigate the cross-subject issue, so that it can enable lower limb exoskeleton robots being used in more complex scenarios. First, a neural network based on convolutional neural networks (CNN) is designed, which can extract temporal and spatial features from sensor signals collected from different parts of human body. It can recognize human activities with high accuracy after trained by labeled data. Second, in order to improve the cross-subject adaptation ability of the pre-trained model, we design a cross-subject HAR algorithm based on sparse interrogation and label propagation. Through leave-one-subject-out validation on two widely-used public datasets with existing methods, our method achieves average accuracies of 91.77% on DSAD and 80.97% on PAMAP2, respectively. The experimental results demonstrate the potential of implementing cross-subject HAR for lower limb exoskeleton robots. 展开更多
关键词 Human activity Recognition Cross-Subject Adaptation semi-supervised learning Wearable Sensors
下载PDF
Combining Committee-Based Semi-Supervised Learning and Active Learning 被引量:6
2
作者 Mohamed Farouk Abdel Hady Friedhelm Schwenker 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第4期681-698,共18页
Many data mining applications have a large amount of data but labeling data is usually difficult, expensive, or time consuming, as it requires human experts for annotation. Semi-supervised learning addresses this prob... Many data mining applications have a large amount of data but labeling data is usually difficult, expensive, or time consuming, as it requires human experts for annotation. Semi-supervised learning addresses this problem by using unlabeled data together with labeled data in the training process. Co-Training is a popular semi-supervised learning algorithm that has the assumptions that each example is represented by multiple sets of features (views) and these views are sufficient for learning and independent given the class. However, these assumptions axe strong and are not satisfied in many real-world domains. In this paper, a single-view variant of Co-Training, called Co-Training by Committee (CoBC) is proposed, in which an ensemble of diverse classifiers is used instead of redundant and independent views. We introduce a new labeling confidence measure for unlabeled examples based on estimating the local accuracy of the committee members on its neighborhood. Then we introduce two new learning algorithms, QBC-then-CoBC and QBC-with-CoBC, which combine the merits of committee-based semi-supervised learning and active learning. The random subspace method is applied on both C4.5 decision trees and 1-nearest neighbor classifiers to construct the diverse ensembles used for semi-supervised learning and active learning. Experiments show that these two combinations can outperform other non committee-based ones. 展开更多
关键词 data mining classification active learning CO-TRAINING semi-supervised learning ensemble learning randomsubspace method decision tree nearest neighbor classifier
原文传递
Cyberspace Security Using Adversarial Learning and Conformal Prediction
3
作者 Harry Wechsler 《Intelligent Information Management》 2015年第4期195-222,共28页
This paper advances new directions for cyber security using adversarial learning and conformal prediction in order to enhance network and computing services defenses against adaptive, malicious, persistent, and tactic... This paper advances new directions for cyber security using adversarial learning and conformal prediction in order to enhance network and computing services defenses against adaptive, malicious, persistent, and tactical offensive threats. Conformal prediction is the principled and unified adaptive and learning framework used to design, develop, and deploy a multi-faceted?self-managing defensive shield to detect, disrupt, and deny intrusive attacks, hostile and malicious behavior, and subterfuge. Conformal prediction leverages apparent relationships between immunity and intrusion detection using non-conformity measures characteristic of affinity, a typicality, and surprise, to recognize patterns and messages as friend or foe and to respond to them accordingly. The solutions proffered throughout are built around active learning, meta-reasoning, randomness, distributed semantics and stratification, and most important and above all around adaptive Oracles. The motivation for using conformal prediction and its immediate off-spring, those of semi-supervised learning and transduction, comes from them first and foremost supporting discriminative and non-parametric methods characteristic of principled demarcation using cohorts and sensitivity analysis to hedge on the prediction outcomes including negative selection, on one side, and providing credibility and confidence indices that assist meta-reasoning and information fusion. 展开更多
关键词 active learning Adversarial learning Anomaly DETECTION Change DETECTION CONFORMAL PREDICTION Cyber Security Data Mining DENIAL and Deception Human Factors INSIDER Threats Intrusion DETECTION Meta-Reasoning Moving Target Defense Performance Evaluation Randomness semi-supervised learning Sequence Analysis Statistical learning Transduction
下载PDF
基于平衡采样的主动半监督学习人类活动识别研究
4
作者 郇战 刘艳 +3 位作者 李志新 董晨辉 周帮文 秦王盛 《传感器与微系统》 CSCD 北大核心 2024年第7期63-66,71,共5页
基于可穿戴传感器的人类活动识别研究逐渐受到人们的广泛关注。本文提出了一种基于平衡采样的主动半监督模型,在挑选样本进行标注时,将样本的不确定性和多样性一并考虑在内,挑选出类别平衡的不确定性样本。确保训练后的模型对每个类都... 基于可穿戴传感器的人类活动识别研究逐渐受到人们的广泛关注。本文提出了一种基于平衡采样的主动半监督模型,在挑选样本进行标注时,将样本的不确定性和多样性一并考虑在内,挑选出类别平衡的不确定性样本。确保训练后的模型对每个类都有很好的识别性能,从而提升整体分类结果。同时,为了全部利用标记和未标记样本的信息,将主动学习和半监督学习相结合,利用损失项信息不断更新网络参数,提升模型在低注释下的识别性能。该模型在2个公开数据集上得到了验证,在确保获得较优分类准确率的同时,可以大大减少样本的人工标注工作。 展开更多
关键词 主动学习 半监督学习 查询策略 人类活动识别
下载PDF
基于联邦学习的主动半监督短文本分类方法
5
作者 孔德焱 冀振燕 +2 位作者 杨燕燕 刘洋 刘吉强 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3517-3526,共10页
短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered H... 短文本分类应用广泛,是当前的研究热点,但受到短文本标注数据稀缺和数据隐私保护不便集中训练的影响,分类效果不佳.针对上述问题,我们提出了基于联邦学习的主动半监督异质图注意力网络模型(Active Semi-Supervised Learning empowered Heterogeneous Graph ATtention network model based on Federated learning,Fed-ASSL-HGAT),通过设计新颖的主动半监督学习(Active Semi-Supervised Learning,ASSL)框架生成高质量标注样本赋能异质图注意力网络(Heterogeneous Graph ATttention network model,HGAT),引入联邦学习对部署在不同节点的模型进行联合训练以满足数据隐私保护需求.所提出的ASSL框架通过将主动学习的多类别标注转化成二元类别标注,可大大降低标注难度;设计基于信息增益的选择策略筛选软、硬标签,以防止信息损失;通过半监督学习选择高准确率、高稳定性的正负样本打伪标签以确保标注质量.实验结果表明,所提出的ASSL-HGAT(S)在AGNews、Snippets、TagMyNews数据集上相比HGAT基线模型F1值分别提升2.45%、8.11%、7.46%.融合联邦学习所进一步提出的Fed-ASSL-HGAT模型可在不泄漏隐私数据的情况下满足性能要求. 展开更多
关键词 异质图神经网络 主动学习 半监督学习 联邦学习
下载PDF
基于主动学习的深度半监督聚类模型
6
作者 付艳艳 黄瑞章 +3 位作者 薛菁菁 任丽娜 陈艳平 林川 《计算机应用研究》 CSCD 北大核心 2024年第10期2955-2961,共7页
深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深... 深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深度半监督聚类模型(DASCM)。该模型设计了一种主动学习方法,能够挑选出蕴涵丰富信息的边缘文本,并进一步生成蕴涵边缘文本的高价值监督信息。该模型利用这些监督信息指导聚类,从而提升聚类性能。在5个真实文本数据集上的实验表明,DASCM的聚类性能有显著提升。这一结果验证了利用主动学习方法生成的涵盖边缘文本的监督信息对于提升聚类效果是有效的。 展开更多
关键词 深度半监督聚类 主动学习 边缘文本
下载PDF
结合Tri-training半监督学习和凸壳向量的SVM主动学习算法 被引量:6
7
作者 徐海龙 龙光正 +2 位作者 别晓峰 吴天爱 郭蓬松 《模式识别与人工智能》 EI CSCD 北大核心 2016年第1期39-46,共8页
为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向... 为解决监督学习过程中难以获得大量带有类标记样本且样本数据标记代价较高的问题,结合主动学习和半监督学习方法,提出基于Tri-training半监督学习和凸壳向量的SVM主动学习算法.通过计算样本集的壳向量,选择最有可能成为支持向量的壳向量进行标记.为解决以往主动学习算法在选择最富有信息量的样本标记后,不再进一步利用未标记样本的问题,将Tri-training半监督学习方法引入SVM主动学习过程,选择类标记置信度高的未标记样本加入训练样本集,利用未标记样本集中有利于学习器的信息.在UCI数据集上的实验表明,文中算法在标记样本较少时获得分类准确率较高和泛化性能较好的SVM分类器,降低SVM训练学习的样本标记代价. 展开更多
关键词 主动学习 半监督学习 支持向量机(SVM) 凸壳向量 Tri—training算法
下载PDF
基于Tri-training的主动学习算法 被引量:3
8
作者 张雁 吴保国 +1 位作者 吕丹桔 林英 《计算机工程》 CAS CSCD 2014年第6期215-218,229,共5页
半监督学习和主动学习都是利用未标记数据,在少量标记数据代价下同时提高监督学习识别性能的有效方法。为此,结合主动学习方法与半监督学习的Tri-training算法,提出一种新的分类算法,通过熵优先采样算法选择主动学习的样本。针对UCI数... 半监督学习和主动学习都是利用未标记数据,在少量标记数据代价下同时提高监督学习识别性能的有效方法。为此,结合主动学习方法与半监督学习的Tri-training算法,提出一种新的分类算法,通过熵优先采样算法选择主动学习的样本。针对UCI数据集和遥感数据,在不同标记训练样本比例下进行实验,结果表明,该算法在标记样本数较少的情况下能取得较好的效果。将主动学习与Tri-training算法相结合,是提高分类性能和泛化性的有效途径。 展开更多
关键词 半监督学习 主动学习 Tri—training算法 熵优先采样 Tri-EPS算法
下载PDF
一种小样本情境下的高光谱图像分类算法
9
作者 张裕 陈立伟 崔颖 《应用科技》 CAS 2024年第3期135-140,共6页
Gabor滤波器是一种常见的空间特征提取技术,在针对高光谱图像分类中已标记样本稀缺的问题上,该算法通过设置不同方向的多个3D-Gabor滤波器,生成大量多视图。在多视图数据基础上生成多个图连接实现标签传播,将多个图标签传播后的分类结... Gabor滤波器是一种常见的空间特征提取技术,在针对高光谱图像分类中已标记样本稀缺的问题上,该算法通过设置不同方向的多个3D-Gabor滤波器,生成大量多视图。在多视图数据基础上生成多个图连接实现标签传播,将多个图标签传播后的分类结果融合得到预测标结果。而超像素主成分分析法算法则是一种简单但非常有效的无监督特征提取方法,将预测结果与加入了超像素主成分分析法的分类器相加权融合得到更为准确的分类结果。将算法在3个数据集上进行仿真实验,结果表明通过应用Gabor滤波器的传统高光谱图像分类算法存在运算量大且耗时长,而该算法能够在保证精度的同时有效减少计算及时间上的消耗,节约成本。 展开更多
关键词 小样本 高光谱图像分类 3D-Gabor滤波器 多视图 标签传播 超像素分割 半监督学习 主动学习
下载PDF
基于半监督主动学习的小麦叶片病虫害区域分割方法
10
作者 安瑞钰 郝志斌 《天津农学院学报》 CAS 2024年第2期87-93,共7页
小麦叶片病虫害区域的准确分割对实现病虫害检测自动化与智能化有重要作用,对提高农作物经济效益有重要的理论价值和现实意义。为解决现有研究中样本标注工作量大、分类效果差等问题,本研究结合人工干预标注的主动学习策略,提出一种基... 小麦叶片病虫害区域的准确分割对实现病虫害检测自动化与智能化有重要作用,对提高农作物经济效益有重要的理论价值和现实意义。为解决现有研究中样本标注工作量大、分类效果差等问题,本研究结合人工干预标注的主动学习策略,提出一种基于半监督主动学习的小麦叶片病虫害区域分割方法,通过提取边界特征、颜色空间特征和纹理特征,组成特征向量,使用直推式支持向量机作为分类器,在每一轮训练中,结合k-means算法随机生成待标记样本,通过人机交互系统干预样本标签提高分类效率。此外,本文构建了在新的病虫害区域分割方法基础上的对病虫害进行分类的LM神经网络模型。在图像分割实验中所提出模型与经典的小样本SVM模型以及半监督TSVM模型对比,分割效果排名第一,证明了所提出分割策略的优越性。在对病虫害识别实验中,模型验证结果表明采用半监督主动学习方法的LM神经网络分类模型得到的识别准确率为93.75%,具有良好的分类效果,能够为后续的病虫害防治提供有效依据。 展开更多
关键词 半监督学习 主动学习 TSVM 病虫害叶片分割
下载PDF
基于主动学习先验的半监督K-means聚类算法 被引量:4
11
作者 柴变芳 吕峰 +1 位作者 李文斌 王垚 《计算机应用》 CSCD 北大核心 2018年第11期3139-3143,共5页
基于迭代框架的主动半监督聚类框架(IASSCF)是一个流行的半监督聚类框架。该框架存在两个问题:其一,初始先验信息较少导致迭代初期聚类效果不佳,进而影响后续聚类结果;其二,每次迭代只选择信息量最大的一个样本标记,导致运行速度慢、性... 基于迭代框架的主动半监督聚类框架(IASSCF)是一个流行的半监督聚类框架。该框架存在两个问题:其一,初始先验信息较少导致迭代初期聚类效果不佳,进而影响后续聚类结果;其二,每次迭代只选择信息量最大的一个样本标记,导致运行速度慢、性能提升慢。针对这两个问题,设计了一种基于主动学习先验的半监督K-means聚类算法。该方法包含初始化阶段和迭代阶段。初始化阶段主动选择代表性较高的节点集合,并基于代表节点集合构建各类的先验节点集合和约束先验集合。迭代阶段,每次迭代包含三步:1)基于当前约束先验集合,利用约束半监督聚类算法PCK-means对数据进行聚类;2)依据当前聚类结果,主动选择每个簇中最具价值信息的未标注样本点;3)利用选择样本点扩充先验节点集合及约束集合。迭代此过程至达到收敛阈值。实验结果表明,与基于原IASSCF框架的半监督K-means聚类算法相比,所提算法运行速度更快,性能更优。 展开更多
关键词 迭代框架 主动学习 半监督聚类 节点先验 约束先验
下载PDF
基于主动学习的K-Hub聚类算法
12
作者 封建邦 何振峰 《计算机系统应用》 2016年第3期187-193,共7页
K-Hub聚类算法是一种有效的高维数据聚类算法,但是它对初始聚类中心的选择非常敏感,并且对于靠近类边界的实例往往不能正确聚类.为了解决这些问题,提出一种结合主动学习和半监督聚类的K-Hub聚类算法.运用主动学习策略学习部分实例的关... K-Hub聚类算法是一种有效的高维数据聚类算法,但是它对初始聚类中心的选择非常敏感,并且对于靠近类边界的实例往往不能正确聚类.为了解决这些问题,提出一种结合主动学习和半监督聚类的K-Hub聚类算法.运用主动学习策略学习部分实例的关联限制,然后利用这些关联限制指导K-Hub的聚类过程.实验结果表明,基于主动学习的K-Hub聚类算法能有效提升K-Hub的聚类准确率. 展开更多
关键词 高维数据 半监督聚类 关联限制 主动学习 K-Hub
下载PDF
基于半监督聚类方法的管道运行状态识别研究
13
作者 方明月 冯早 朱雪峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期435-445,共11页
目前工业现场采集的大部分数据缺失标记信息,若仅使用其中的标记数据和未标记数据的局部信息会造成学习器的性能下降,而传统半监督学习对标记数据的利用具有随机性且没有考虑监督信息数量的变化对性能的影响.针对上述问题,提出一种主动... 目前工业现场采集的大部分数据缺失标记信息,若仅使用其中的标记数据和未标记数据的局部信息会造成学习器的性能下降,而传统半监督学习对标记数据的利用具有随机性且没有考虑监督信息数量的变化对性能的影响.针对上述问题,提出一种主动学习策略下基于最小生成树的变分贝叶斯推理半监督高斯混合模型,利用主动学习策略在标记信息中重新筛选构建高质量成对约束信息,利用最小生成树聚类来初始化模型参数,提升模型在标记样本数量受扰动时的鲁棒性.选用实验室采集的管道状态检测数据集对提出的模型进行验证,实验结果表明,当标记样本占总体样本的比例从50%下降到10%时,提出的组合模型的预测准确率依旧保持在72.4%以上,而且,当某一类别的样本完全失去监督信息时,该组合模型的聚类效果仍然可以分析判断数据类别的所属类型. 展开更多
关键词 半监督聚类 主动学习策略 高斯混合模型 成对约束
下载PDF
一种结合主动学习的半监督文档聚类算法 被引量:30
14
作者 赵卫中 马慧芳 +1 位作者 李志清 史忠植 《软件学报》 EI CSCD 北大核心 2012年第6期1486-1499,共14页
半监督文档聚类,即利用少量具有监督信息的数据来辅助无监督文档聚类,近几年来逐渐成为机器学习和数据挖掘领域研究的热点问题.由于获取大量监督信息费时费力,因此,国内外学者考虑如何获得少量但对聚类性能提高显著的监督信息.提出一种... 半监督文档聚类,即利用少量具有监督信息的数据来辅助无监督文档聚类,近几年来逐渐成为机器学习和数据挖掘领域研究的热点问题.由于获取大量监督信息费时费力,因此,国内外学者考虑如何获得少量但对聚类性能提高显著的监督信息.提出一种结合主动学习的半监督文档聚类算法,通过引入成对约束信息指导DBSCAN的聚类过程来提高聚类性能,得到一种半监督文档聚类算法Cons-DBSCAN.通过对约束集中所含信息量的衡量和对DBSCAN算法本身的分析,提出了一种启发式的主动学习算法,能够选取含信息量大的成对约束集,从而能够更高效地辅助半监督文档聚类.实验结果表明,所提出的算法能够高效地进行文档聚类.通过主动学习算法获得的成对约束集,能够显著地提高聚类性能.并且,算法的性能优于两个代表性的结合主动学习的半监督聚类算法. 展开更多
关键词 半监督聚类 文档聚类 主动学习 成对约束
下载PDF
基于主动学习和半监督学习的多类图像分类 被引量:74
15
作者 陈荣 曹永锋 孙洪 《自动化学报》 EI CSCD 北大核心 2011年第8期954-962,共9页
多数图像分类算法需要大量的训练样本对分类器模型进行训练.在实际应用中,对大量样本进行标注非常枯燥、耗时.对于一些特殊图像,如合成孔径雷达(Synthetic aperture radar,SAR)图像,对其内容判读非常困难,因此能够获得的标注样本数量非... 多数图像分类算法需要大量的训练样本对分类器模型进行训练.在实际应用中,对大量样本进行标注非常枯燥、耗时.对于一些特殊图像,如合成孔径雷达(Synthetic aperture radar,SAR)图像,对其内容判读非常困难,因此能够获得的标注样本数量非常有限.本文将基于最优标号和次优标号(Best vs second-best,BvSB)的主动学习和带约束条件的自学习(Constrained self-training,CST)引入到基于支持向量机(Support vector machine,SVM)分类器的图像分类算法中,提出了一种新的图像分类方法.通过BvSB主动学习去挖掘那些对当前分类器模型最有价值的样本进行人工标注,并借助CST半监督学习进一步利用样本集中大量的未标注样本,使得在花费较小标注代价情况下,能够获得良好的分类性能.将新方法与随机样本选择、基于熵的不确定性采样主动学习算法以及BvSB主动学习方法进行了性能比较.对3个光学图像集及1个SAR图像集分类问题的实验结果显示,新方法能够有效地减少分类器训练时所需的人工标注样本的数量,并获得较高的准确率和较好的鲁棒性. 展开更多
关键词 主动学习 半监督学习 支持向量机 图像分类
下载PDF
主动学习与图的半监督相结合的高光谱影像分类 被引量:16
16
作者 田彦平 陶超 +2 位作者 邹峥嵘 杨钊霞 何小飞 《测绘学报》 EI CSCD 北大核心 2015年第8期919-926,共8页
针对当前高光谱影像分类时,人工标注样本费时费力以及大量未标记样本未有效利用等问题,提出了一种主动学习与图的半监督相结合的高光谱影像分类方法。首先,将像素的光谱信息与其邻域内的空间信息相结合,利用重排序机制得到一种旋转不变... 针对当前高光谱影像分类时,人工标注样本费时费力以及大量未标记样本未有效利用等问题,提出了一种主动学习与图的半监督相结合的高光谱影像分类方法。首先,将像素的光谱信息与其邻域内的空间信息相结合,利用重排序机制得到一种旋转不变的空谱特征表达。在此基础上,利用主动学习算法选择最不确定性样本(即分类模糊度最大的样本),提交操作者标注得到标记样本集。最后将该标记样本与未标记样本组合,用于图的半监督分类。该算法可保证类别边界样本的选择,利于分类器的边界构造,同时,在较少标记样本情况下,通过引入大量的未标记样本,可以达到较好的分类效果。在3幅真实高光谱影像上的试验表明,该方法可以取得精度较高的分类结果。 展开更多
关键词 高光谱影像分类 图的半监督学习 主动学习 -谱特征
下载PDF
一种基于混合模型的数据流概念漂移检测算法 被引量:13
17
作者 郭躬德 李南 陈黎飞 《计算机研究与发展》 EI CSCD 北大核心 2014年第4期731-742,共12页
由于在信用卡欺诈分析等领域的广泛应用,学者们开始关注概念漂移数据流分类问题.现有算法通常假设数据一旦分类后类标已知,利用所有待分类实例的真实类别来检测数据流是否发生概念漂移以及调整分类模型.然而,由于标记实例需要耗费大量... 由于在信用卡欺诈分析等领域的广泛应用,学者们开始关注概念漂移数据流分类问题.现有算法通常假设数据一旦分类后类标已知,利用所有待分类实例的真实类别来检测数据流是否发生概念漂移以及调整分类模型.然而,由于标记实例需要耗费大量的时间和精力,该解决方案在实际应用中无法实现.据此,提出一种基于KNNModel和增量贝叶斯的概念漂移检测算法KnnM-IB.新算法在具有KNNModel算法分类被模型簇覆盖的实例分类精度高、速度快优点的同时,利用增量贝叶斯算法对难处理样本进行分类,从而保证了分类效果.算法同时利用可变滑动窗口大小的变化以及主动学习标记的少量样本进行概念漂移检测.当数据流稳定时,半监督学习被用于扩大标记实例的数量以对模型进行更新,因而更符合实际应用的要求.实验结果表明,该方法能够在对数据流进行有效分类的同时检测数据流概念漂移及相应地更新模型. 展开更多
关键词 概念漂移 数据流 分类 主动学习 半监督学习
下载PDF
基于监督信息特性的主动半监督谱聚类算法 被引量:33
18
作者 王娜 李霞 《电子学报》 EI CAS CSCD 北大核心 2010年第1期172-176,共5页
半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对... 半监督聚类是利用少部分监督信息辅助大量未标签数据进行非监督的学习,其聚类性能的改善依赖于监督信息,因此挖掘适合半监督聚类的监督信息非常关键.提出了一种基于监督信息特性的主动学习策略,即找出同一类中距离相对较远的数据对象对和不同类中距离相对较近的数据对象对组成监督信息,并将其引入谱聚类算法,构建新颖的主动半监督谱聚类算法ASSC(Active Semi-supervised Spectral Clustering).利用该监督信息调整谱聚类中点与点之间的距离矩阵,使类内各点紧聚,类间散布.通过对UCI基准数据集以及人工数据集的实验结果表明,ASSC算法优于采用随机选取监督信息的谱聚类性能. 展开更多
关键词 谱聚类 半监督聚类 主动学习 监督信息
下载PDF
数据流分类技术研究综述 被引量:18
19
作者 黄树成 曲亚辉 《计算机应用研究》 CSCD 北大核心 2009年第10期3604-3609,共6页
数据流高速、连续无限和动态的特性使得传统的数据分析和挖掘技术无效或需要改进。以数据流分类为重点,分析了数据流分类中的一些关键问题,综述了典型的数据流分类技术;针对现有方法的不足,给出了应用主动学习和半监督学习的新思路。
关键词 数据流挖掘 分类 主动学习 半监督学习
下载PDF
半监督学习和主动学习相结合的浅层语义分析 被引量:13
20
作者 陈耀东 王挺 陈火旺 《中文信息学报》 CSCD 北大核心 2008年第2期70-75,共6页
语义分析是基于内容的文本挖掘领域的重要技术和研究难点。有监督机器学习方法受限于标注语料的规模,在小规模标注样本中难以获取较高性能。本文面向浅层语义分析任务,采用一种新颖的半监督学习方法——直推式支持向量机,并结合其训练... 语义分析是基于内容的文本挖掘领域的重要技术和研究难点。有监督机器学习方法受限于标注语料的规模,在小规模标注样本中难以获取较高性能。本文面向浅层语义分析任务,采用一种新颖的半监督学习方法——直推式支持向量机,并结合其训练特点提出了基于主动学习的样本优化策略。实验表明,本文提出的浅层语义分析方法通过整合主动学习与半监督学习,在小规模标注样本环境中取得了良好的学习效果。 展开更多
关键词 计算机应用 中文信息处理 浅层语义分析 半监督学习 直推式支持向量机 主动学习
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部