期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于标签概念的多标签文本分类方法 被引量:1
1
作者 汪乐乐 张贤坤 《天津科技大学学报》 CAS 2024年第1期73-80,共8页
多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用... 多标签文本分类是自然语言处理中重要且具有挑战性的任务之一。现有的方法注重文本表示学习,关注文本内部信息预测所属标签,忽略了属于某一标签的全体实例中共享的关键信息。鉴于此,本文提出一种基于标签概念的多标签文本分类方法:利用词频和潜在狄利克雷分布(latent Dirichlet allocation,LDA)方法从训练集全体实例中抽取各标签所对应的关键词,接着采取与文本编码相同方式对关键词编码,获得标签概念表示。在训练和预测过程中,检索与文本表示最相似的标签概念辅助分类,增加标签概念表示与文本表示的对比损失,使文本编码过程中能充分学习全局的标签概念信息。将本文方法嵌套在常用的多标签文本分类模型上进行实验,结果表明该方法有效提高了相应模型的性能。 展开更多
关键词 标签概念 全局关键信息 对比损失 多标签文本分类
下载PDF
基于核极限学习机的多标签数据流半监督在线分类方法
2
作者 王雨晨 邱士远 +1 位作者 李培培 胡学钢 《模式识别与人工智能》 EI CSCD 北大核心 2024年第8期741-754,共14页
实际应用中涌现的大量流数据具有高速到达、海量、动态变化等特点,同时,这些数据流常含有多个标签且只有少量数据被标记,从而带来多标签数据环境下的概念漂移与标签缺失问题.为此,文中提出基于核极限学习机的多标签数据流半监督在线分... 实际应用中涌现的大量流数据具有高速到达、海量、动态变化等特点,同时,这些数据流常含有多个标签且只有少量数据被标记,从而带来多标签数据环境下的概念漂移与标签缺失问题.为此,文中提出基于核极限学习机的多标签数据流半监督在线分类方法.首先,针对多标签数据流的标签缺失问题,根据滑动窗口将数据流划分为k块,对每块数据构造特征相似性矩阵和标签相似性矩阵,并加入核极限学习机的训练中.同时为了适应流数据的特点,设计增量式更新机制,构建半监督在线核极限学习机.然后,为了适应数据流中的概念漂移问题,采用基于时间戳丢弃更新的机制,预先设定数据规模,当数据到达指定规模后,丢弃最旧的无标签数据,将新的数据加入更新.最后,在10个多标签数据集上的实验表明,文中方法对标签缺失和概念漂移问题具有较强的适应能力,并能保持较优的分类效果. 展开更多
关键词 数据流分类 半监督分类 多标签分类 核极限学习机 概念漂移
下载PDF
一类离散无向图模型诱导的概念类的样本压缩方案
3
作者 李本崇 郭丰毅 《纯粹数学与应用数学》 2023年第4期494-505,共12页
样本压缩方案是许多学习算法共性的一个自然抽象.离散无向图模型是分类中常用的模型之一.本文考虑一类离散无向图模型诱导的概念类的带标签压缩方案.对于包含两个顶点X_(1),X_(2),无边的无向图,X_(1)∈{0,1}X_(2)∈{0,1,...,k_(2)-1}(k_... 样本压缩方案是许多学习算法共性的一个自然抽象.离散无向图模型是分类中常用的模型之一.本文考虑一类离散无向图模型诱导的概念类的带标签压缩方案.对于包含两个顶点X_(1),X_(2),无边的无向图,X_(1)∈{0,1}X_(2)∈{0,1,...,k_(2)-1}(k_(2)∈N,k_(2)≥2),构建了大小为k_(2)+1的带标签样本压缩方案,证明了所建方案是适当的. 展开更多
关键词 带标签压缩方案 离散无向图模型 概念类
下载PDF
基于随机标记子集的多标记数据流分类算法 被引量:1
4
作者 孙艳歌 尤磊 +1 位作者 卲罕 李艳灵 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2018年第1期119-123,共5页
提出了基于随机标记子集的多标记数据流分类算法,其基本思想是在多标记分类过程中,将原始较大的标记集随机地划分为多个较小的标记子集,并针对每个标记子集训练一个概率分类器链.在充分利用标记间依赖关系的同时,又有效地降低了概率分... 提出了基于随机标记子集的多标记数据流分类算法,其基本思想是在多标记分类过程中,将原始较大的标记集随机地划分为多个较小的标记子集,并针对每个标记子集训练一个概率分类器链.在充分利用标记间依赖关系的同时,又有效地降低了概率分类器链的时间复杂度.同时,在算法中嵌入了自适应滑动窗口算法来检测概念漂移.实验结果表明,同其他算法相比,在大多数数据集合上能够更有效地预测实例的类标集合,更适合概念漂移的环境. 展开更多
关键词 数据流 多标记 集成学习 概念漂移 依赖关系
下载PDF
心理疾病污名内隐测评的类别标签初探 被引量:3
5
作者 王晓刚 岳彩镇 +1 位作者 岳童 黄希庭 《心理科学》 CSSCI CSCD 北大核心 2014年第6期1497-1501,共5页
采用单一类型内隐联想测验,考察概括化心理疾病词和具体心理疾病词作为心理疾病内隐污名间接测量的概念词或类别标签的有效性。结果发现,相较于与积极词配对的任务,两类概念词与消极词(心理疾病态度词)配对的任务反应时更快,正确率更高... 采用单一类型内隐联想测验,考察概括化心理疾病词和具体心理疾病词作为心理疾病内隐污名间接测量的概念词或类别标签的有效性。结果发现,相较于与积极词配对的任务,两类概念词与消极词(心理疾病态度词)配对的任务反应时更快,正确率更高。研究表明概括化概念和具体疾病与反映人们对心理疾病患者真实态度的消极词存在更紧密的自动联结,是人们头脑中表征心理疾病的概念词或类别标签,可作为内隐测量中的心理疾病概念词用于污名评估。 展开更多
关键词 心理疾病内隐污名 概念词 类别标签 单一类型内隐联想测验
下载PDF
儿童数概念发展的影响因素:表面相似性效应与标签效应 被引量:8
6
作者 韩瑽瑽 陈蒲晶 陈英和 《心理发展与教育》 CSSCI 北大核心 2010年第5期449-456,共8页
本研究主要考查表面相似性效应和标签效应对60名3~5岁儿童数概念发展的影响。实验通过等量匹配任务和数量比较任务测查儿童数概念的发展情况,其中等量匹配任务和数量比较任务都包括了一致和不一致两种条件以考查表面相似性效应对儿童... 本研究主要考查表面相似性效应和标签效应对60名3~5岁儿童数概念发展的影响。实验通过等量匹配任务和数量比较任务测查儿童数概念的发展情况,其中等量匹配任务和数量比较任务都包括了一致和不一致两种条件以考查表面相似性效应对儿童数概念的影响,并通过给物取数任务、给数取物任务和等量匹配任务与数量比较任务的关系测查儿童使用数字标签的能力对儿童数概念形成与发展的影响。结果表明:(1)4岁和5岁组儿童完成等量匹配任务和数量比较任务的正确率显著高于3岁组儿童;(2)儿童在一致条件下完成等量匹配和数量比较任务的正确率显著高于不一致条件的正确率,表明物体的高表面相似性有利于儿童数概念的形成;(3)擅长使用数字标签的儿童完成等量匹配任务和数量比较任务的次数超过几率水平,使用数字标签有利于儿童数概念的发展。 展开更多
关键词 数概念 表面相似性效应 标签效应
下载PDF
基于分层校验的多标签数据流概念漂移检测 被引量:6
7
作者 张永 刘浩科 陈天祯 《模式识别与人工智能》 EI CSCD 北大核心 2020年第3期202-210,共9页
现有的概念漂移检测方法大多集中于单标签数据流,难以满足多标签数据流概念漂移检测的需要,因此文中提出基于分层校验的多标签数据流概念漂移检测算法.算法包括检验层和校验层,检验层通过检测数据分布变化判断是否发生概念漂移,校验层... 现有的概念漂移检测方法大多集中于单标签数据流,难以满足多标签数据流概念漂移检测的需要,因此文中提出基于分层校验的多标签数据流概念漂移检测算法.算法包括检验层和校验层,检验层通过检测数据分布变化判断是否发生概念漂移,校验层通过判断标签混淆矩阵的变化程度验证是否真正发生概念漂移.在真实多标签数据集和合成多标签数据集上的实验表明,文中算法表现更优,可以有效检测概念漂移,提升分类性能. 展开更多
关键词 概念漂移 多标签分类 数据流 分层校验
下载PDF
美欧日转基因食品安全管理对我国的重要启示 被引量:3
8
作者 孙静 《沈阳农业大学学报(社会科学版)》 2013年第6期658-661,共4页
通过对美欧日转基因食品管理理念、管理机构、标签制度和立法情况的对比研究,以及对中国转基因食品安全管理现状的分析,中国转基因食品安全管理要借鉴美欧日的经验,完善国家转基因食品安全管理法律法规体系,促成《转基因食品安全法》的... 通过对美欧日转基因食品管理理念、管理机构、标签制度和立法情况的对比研究,以及对中国转基因食品安全管理现状的分析,中国转基因食品安全管理要借鉴美欧日的经验,完善国家转基因食品安全管理法律法规体系,促成《转基因食品安全法》的出台;加强管理制度建设,对转基因食品进行全面细致的规范;优化管理机构的设置,建立行之有效的管理体制;积极参与国际合作,逐步与国际上通行的标准和做法接轨。 展开更多
关键词 转基因食品 食品安全管理 管理理念 管理机构 标签制度
下载PDF
一种基于混合判定模型的复合概念抽取方法 被引量:3
9
作者 欧阳柳波 邹北骥 刘丽杰 《电子学报》 EI CAS CSCD 北大核心 2013年第3期488-495,共8页
从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词... 从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词频,根据词条标签值计算位置亲和度和位置匹配度,判定和筛选可组合成复合概念的原子词条,最后通过设置不同复合深度值,实现多重复合概念抽取.采用不同规模语料库进行抽取实验,实验结果表明本文方法具有更高的召回率和准确率. 展开更多
关键词 语料库 领域概念 复合概念 加权词频 词条标签 位置亲和度 复合深度
下载PDF
知识信息搜索和获取技术的研究
10
作者 郭庆琳 樊孝忠 《北京工业大学学报》 CAS CSCD 北大核心 2003年第4期500-503,共4页
讨论了自然语言处理应用于知识信息搜索和知识信息获取的若干问题,阐述了概念标注、完善基于词典的知识库的处理手段.同时,对中文知识信息获取技术涉及的具体语言处理技术也作了较为详尽的论述,包括知识信息获取的短语句法及语义表示和... 讨论了自然语言处理应用于知识信息搜索和知识信息获取的若干问题,阐述了概念标注、完善基于词典的知识库的处理手段.同时,对中文知识信息获取技术涉及的具体语言处理技术也作了较为详尽的论述,包括知识信息获取的短语句法及语义表示和知识信息获取的实现. 展开更多
关键词 知识库 知识信息搜索 知识信息获取 概念标注
下载PDF
一种面向不完全标记的文本数据流自适应分类方法
11
作者 张玉红 陈伟 胡学钢 《计算机科学》 CSCD 北大核心 2016年第12期179-182,194,共5页
现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记... 现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块,对未标记数据块首先提取标记数据块与未标记数据块之间的特征集,并利用特征在两个数据块间的相似度进行概念漂移检测,最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性,尤其在标记信息较少和概念漂移较为频繁时。 展开更多
关键词 不完全标记 自适应 数据流 概念漂移
下载PDF
医学图像语义概念识别方法研究 被引量:1
12
作者 王序文 张宇 +1 位作者 郭臻 李姣 《中国生物医学工程学报》 CAS CSCD 北大核心 2019年第3期306-314,共9页
医学图像语义概念识别是医学图像知识表示的重要技术环节。研究医学图像语义概念识别方法,有助于机器理解和学习医学图像中的潜在医学知识,在影像辅助诊断和智能读片等应用中发挥重要作用。将医学图像的高频概念识别问题转化为多标签分... 医学图像语义概念识别是医学图像知识表示的重要技术环节。研究医学图像语义概念识别方法,有助于机器理解和学习医学图像中的潜在医学知识,在影像辅助诊断和智能读片等应用中发挥重要作用。将医学图像的高频概念识别问题转化为多标签分类任务,利用基于卷积神经网络的深度迁移学习方法,识别有限数量的高频医学概念;同时利用基于图像检索的主题建模方法,从给定医学图像的相似图像中提取语义相关概念。国际跨语言图像检索论坛ImageCLEF于2018年5月组织ImageCLEFcaption 2018评测,其子任务'概念检测'的目标是给定222 314张训练图片和9 938张测试图片,识别111 156个语义概念。上述两种方法的实验结果已被提交。实验结果表明,利用基于卷积神经网络的深度迁移学习方法识别医学图像高频概念,F1值为0.092 8,在提交团队中排名第二;基于图像检索的主题模型可召回部分低频相关概念,F1值为0.090 7,然而其性能依赖于图像检索结果的质量。基于卷积神经网络的深度迁移学习方法识别医学图像高频概念的鲁棒性优于基于图像检索方法的鲁棒性,但在大规模开放语义概念的识别技术研究上仍需进一步完善。 展开更多
关键词 概念识别 深度迁移学习 多标签分类 医学图像检索 主题模型
下载PDF
基于播存思想的未来互联网次结构 被引量:3
13
作者 杨鹏 李幼平 《复杂系统与复杂性科学》 EI CSCD 北大核心 2015年第2期18-22,31,共6页
以播存思想为指导,提出以广播辐射传输和泛在内容存储为特征的播存结构作为次结构,辅佐现有互联网体系结构而形成的双结构未来互联网研究方案。介绍了双结构未来互联网的主要设计原则及体系结构模型,探讨了未来互联网次结构的主要特征... 以播存思想为指导,提出以广播辐射传输和泛在内容存储为特征的播存结构作为次结构,辅佐现有互联网体系结构而形成的双结构未来互联网研究方案。介绍了双结构未来互联网的主要设计原则及体系结构模型,探讨了未来互联网次结构的主要特征、物理基础及关键实现机制等。为未来互联网研究提供了一种成本高效的创新解决思路。 展开更多
关键词 未来互联网 播存思想 大数据 次结构 统一内容标签
下载PDF
概念间关联依赖多标记视频语义概念分类方法
14
作者 魏维 魏敏 刘凤玉 《中国图象图形学报》 CSCD 北大核心 2010年第6期893-899,共7页
一个镜头中的语义概念通常依赖于其他多个语义概念,几个同时出现的语义概念决定着另一个语义概念的出现。为此提出一种概念间关联依赖多标记视频语义概念分类方法。为得到概念间关联依赖规则,合并和修剪技术用于产生候选的项集;计算各... 一个镜头中的语义概念通常依赖于其他多个语义概念,几个同时出现的语义概念决定着另一个语义概念的出现。为此提出一种概念间关联依赖多标记视频语义概念分类方法。为得到概念间关联依赖规则,合并和修剪技术用于产生候选的项集;计算各候选项集的支持度后,得到满足最小支持度的频繁项集;经过一系列频繁项集迭代,产生具有强关联依赖关系的复合标记;在标记过程中,将具有强关联依赖关系的多个语义标记作为单标记进行标注。实验结果表明,对真实媒体数据本文方法比现有多标记分类方法更能有效进行分类。 展开更多
关键词 视频概念标注 多标记分类 关联规则 语义场景分类
下载PDF
基于核极限学习机的多标签数据流集成分类方法 被引量:8
15
作者 张海翔 李培培 胡学钢 《数据采集与处理》 CSCD 北大核心 2022年第1期183-193,共11页
极限学习机因具有高效处理、性能优越以及更少人工参数设定等优点,已成功应用于批处理多标签分类问题。然而,实际应用领域涌现的数据流呈现海量快速、多标签和概念漂移等特点,使得这些传统的多标签分类算法面临精度与时空的挑战。本文... 极限学习机因具有高效处理、性能优越以及更少人工参数设定等优点,已成功应用于批处理多标签分类问题。然而,实际应用领域涌现的数据流呈现海量快速、多标签和概念漂移等特点,使得这些传统的多标签分类算法面临精度与时空的挑战。本文提出一种基于核极限学习机的多标签数据流集成分类方法。首先,为适应数据流环境,利用滑动窗口机制将数据流划分为数据块,在前k个数据块上构建k个核极限学习机的集成分类模型;同时,考虑类标签相关性,利用Apriori算法得到每个数据块的标签间的关联规则,并将关联规则中的同现标签的置信度引入到基于集成模型的预测过程中,以提高整体的分类精度;其次,引入MUENLForeset模型检测新到来的数据块是否发生概念漂移,对分类器设置损失函数更新集成模型以适应概念漂移问题。最后,在实际多标签数据上的大量实验表明:与经典多标签批处理和流数据分类方法相比,所提方法不仅能适应多标签数据流中的概念漂移问题,同时在分类精度上具有显著优势。 展开更多
关键词 多标签分类 数据流 核极限学习机 标签相关性 概念漂移
下载PDF
基于向量表示和标签传播的半监督短文本数据流分类算法 被引量:2
16
作者 王海燕 胡学钢 李培培 《模式识别与人工智能》 EI CSCD 北大核心 2018年第7期634-642,共9页
社交网络平台产生海量的短文本数据流,具有快速、海量、概念漂移、文本长度短小、类标签大量缺失等特点.为此,文中提出基于向量表示和标签传播的半监督短文本数据流分类算法,可对仅含少量有标记数据的数据集进行有效分类.同时,为了适应... 社交网络平台产生海量的短文本数据流,具有快速、海量、概念漂移、文本长度短小、类标签大量缺失等特点.为此,文中提出基于向量表示和标签传播的半监督短文本数据流分类算法,可对仅含少量有标记数据的数据集进行有效分类.同时,为了适应概念漂移,提出基于聚类簇的概念漂移检测算法.在实际短文本数据流上的实验表明,相比半监督分类算法和半监督数据流分类算法,文中算法不仅提高分类精度和宏平均,还能快速适应数据流中的概念漂移. 展开更多
关键词 短文本数据流 半监督分类 标签传播 概念漂移
下载PDF
一种图像粒标记模型及其实现
17
作者 李仲生 黄同成 蔡则苏 《计算机工程》 CAS CSCD 北大核心 2015年第3期223-227,236,共6页
针对图像分析领域缺乏可扩展的基础模型,对灰度图和彩图的标记模型展开研究。通过分析粗糙集和商空间理论的适用性,综合图像标记处理的特定应用需求,引出概念粒和连通粒2个概念,构建粒标记模型。基于通常情况下图像尤其是彩图标记中粒... 针对图像分析领域缺乏可扩展的基础模型,对灰度图和彩图的标记模型展开研究。通过分析粗糙集和商空间理论的适用性,综合图像标记处理的特定应用需求,引出概念粒和连通粒2个概念,构建粒标记模型。基于通常情况下图像尤其是彩图标记中粒的数量巨大、结构复杂等现状,定义行连通段、潜在连通范围,引入动态预设标记集,简化连通判定,给出实现粒标记模型的线性算法,即图像粒标记算法。用二值图和彩图分别作验证和对比分析,结果表明,该标记算法有效、精确,且较传统标记算法更高速。 展开更多
关键词 行连通段 连通粒 概念粒 图像处理 粒标记模型 图像粒标记算法
下载PDF
强协调决策形式背景的概念格属性约简 被引量:2
18
作者 王艳盼 李涛 《纺织高校基础科学学报》 CAS 2013年第3期351-354,共4页
运用概念的闭标记研究了强协调决策形式背景的核心属性问题.通过概念的闭标记得到了判定强协调决策形式背景的协调集的方法,并且定义了计算约简集的函数,从而得到了约简集,最后通过简单的集合运算得出协调决策形式背景的核心属性.
关键词 决策形式背景 概念格 闭标记 属性约简
下载PDF
概念图构建中概念关系提取方法
19
作者 孙珠婷 《琼州学院学报》 2014年第2期22-27,共6页
针对概念图构建中概念关系提取阶段不能挖掘出复杂概念关系具体名称的问题,提出一种知识数据库匹配算法.首先利用专家预定义关系标签结合知网(How Net)构建知识数据库,该知识数据库包含对预定义关系标签的定义域、值域及属性限制的描述... 针对概念图构建中概念关系提取阶段不能挖掘出复杂概念关系具体名称的问题,提出一种知识数据库匹配算法.首先利用专家预定义关系标签结合知网(How Net)构建知识数据库,该知识数据库包含对预定义关系标签的定义域、值域及属性限制的描述.从领域文本集中抽取概念对关系动词,通过匹配关系动词与知识数据库中关系标签的吻合度,最后提取匹配值超过阀值的概念对关系标签实例.实验表明,该知识数据库匹配算法能够从文本集中自动挖掘出复杂概念关系的具体名称. 展开更多
关键词 概念图 概念关系 知识数据库 概念对 关系标签
下载PDF
利用频繁模式挖掘进行图像标注
20
作者 周祥 周向东 +3 位作者 周浩峰 王智慧 汪卫 施伯乐 《计算机科学》 CSCD 北大核心 2007年第3期170-173,196,共5页
在基于内容的图像检索与计算机视觉研究领域中,如何将底层的视觉特征与高层的语义信息相联系,即如何有效地根据图像的底层特征提取其表达的语义概念是备受关注的难题之一。特别是当图像包含了多个语义概念时,问题就变得更为棘手了。本文... 在基于内容的图像检索与计算机视觉研究领域中,如何将底层的视觉特征与高层的语义信息相联系,即如何有效地根据图像的底层特征提取其表达的语义概念是备受关注的难题之一。特别是当图像包含了多个语义概念时,问题就变得更为棘手了。本文中,我们提出一种基于图像底层特征值频繁模式的语义概念标注方法,针对图像分块的特点实现了一组有效的模式挖掘算法,并设计了标注规则的生成算法。权威的真实数据集上的实验表明我们的方法在对含有多个语义概念的图像进行概念标注时要比之前的一些算法效果更好。 展开更多
关键词 基于内容的图像检索 语义概念 频繁模式 多概念标注
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部