期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
关键细粒度信息指导的多尺度遮挡行人重识别
1
作者 周玉 赵小锋 +2 位作者 汪一 孙彦景 李松 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2578-2586,共9页
为了减轻背景和遮挡等干扰信息对行人身份重识别(ReID)准确率的影响以及充分利用细粒度和粗粒度信息之间的互补性,该文提出关键细粒度信息指导的多尺度遮挡行人重识别网络。首先,将图像划分为两种不同尺寸的重叠图像块,构建同时包含细... 为了减轻背景和遮挡等干扰信息对行人身份重识别(ReID)准确率的影响以及充分利用细粒度和粗粒度信息之间的互补性,该文提出关键细粒度信息指导的多尺度遮挡行人重识别网络。首先,将图像划分为两种不同尺寸的重叠图像块,构建同时包含细粒度和粗粒度信息提取分支的多尺度识别网络,以更好模拟人类观察图像时的多尺度特性以及观察相邻区域时的连续性特性。然后,考虑到细粒度分支能够提取更多的图像细节信息且细粒度和粗粒度信息之间存在一定的共性与差异,进一步通过细粒度注意力模块实现细粒度信息对粗粒度信息学习分支的指导。其中,参与指导的细粒度信息是通过干扰信息剔除(IIE)模块滤除干扰信息后保留的关键信息。最后,通过双次差分获取与行人身份识别相关的关键信息,并通过标签和特征等多维度的联合监督,实现行人身份的预测。在多个公开的行人重识别数据库进行的大量实验证明了该算法的性能优越性以及其中各个模块的有效性和必要性。 展开更多
关键词 遮挡行人重识别 多尺度 粒度信息 粒度信息 干扰信息剔除
下载PDF
融合多粒度信息的用户画像生成方法 被引量:1
2
作者 邵一博 秦玉华 +2 位作者 崔永军 高宝勇 赵彪 《计算机应用研究》 CSCD 北大核心 2024年第2期401-407,共7页
现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该... 现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该方法在嵌入层融合字粒度、词粒度表示向量以扩充特征内容;其次,在改进双向门控循环单元网络基础上,结合降噪自编码器和注意力机制设计一种特征提取混合模型Bi-GRU-DAE-Attention,实现特征降噪和语义增强;最后,将鲁棒性强的特征向量输入到分类器中实现用户画像生成。实验表明,该用户画像生成方法在医疗和互联网两个画像数据集上的分类准确率高于其他基线方法,并通过消融实验验证了各个模块的有效性。 展开更多
关键词 用户画像 粒度信息融合 特征提取 双向控制循环单元
下载PDF
多粒度信息关系增强的多标签文本分类 被引量:3
3
作者 李芳芳 苏朴真 +2 位作者 段俊文 张师超 毛星亮 《软件学报》 EI CSCD 北大核心 2023年第12期5686-5703,共18页
基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,... 基于深度学习的多标签文本分类方法存在两个主要缺陷:缺乏对文本信息多粒度的学习,以及对标签间约束性关系的利用.针对这些问题,提出一种多粒度信息关系增强的多标签文本分类方法.首先,通过联合嵌入的方式将文本与标签嵌入到同一空间,并利用BERT预训练模型获得文本和标签的隐向量特征表示.然后,构建3个多粒度信息关系增强模块:文档级信息浅层标签注意力分类模块、词级信息深层标签注意力分类模块和标签约束性关系匹配辅助模块.其中,前两个模块针对共享特征表示进行多粒度学习:文档级文本信息与标签信息浅层交互学习,以及词级文本信息与标签信息深层交互学习.辅助模块通过学习标签间关系来提升分类性能.最后,所提方法在3个代表性数据集上,与当前主流的多标签文本分类算法进行了比较.结果表明,在主要指标Micro-F1、Macro-F1、nDCG@k、P@k上均达到了最佳效果. 展开更多
关键词 注意力机制 多标签文本分类 标签关系 粒度信息
下载PDF
基于多粒度信息融合的气象知识命名实体识别
4
作者 姚元杰 龚毅光 +1 位作者 刘佳 陈嫚丽 《计算机与数字工程》 2023年第1期186-193,共8页
气象与人们的生活息息相关,运用命名实体识别算法抽取相关实体信息,对于构建知识图谱、问答系统等具有重要意义。由于气象科普知识存在大量专业词汇,普通的实体识别模型并不能很好完成识别任务。为此,论文构建了气象科普知识数据集,并... 气象与人们的生活息息相关,运用命名实体识别算法抽取相关实体信息,对于构建知识图谱、问答系统等具有重要意义。由于气象科普知识存在大量专业词汇,普通的实体识别模型并不能很好完成识别任务。为此,论文构建了气象科普知识数据集,并提出了基于多粒度信息融合的气象科普知识命名实体识别模型MGTNER的算法。模型利用预训练模型、SoftLexicon结构的BiLSTM网络和键值记忆网络从数据集中以不同粒度提取语义特征信息,取得了很好的实体识别效果。在对气象科普知识数据集和公开Resume数据集实施的命名实体识别实验中,与几种基线模型进行了比较,结果表明论文提出的模型具有更好的识别效果。 展开更多
关键词 气象科普 命名实体识别 粒度信息融合 记忆网络 深度学习
下载PDF
突发公共卫生事件背景下融合多粒度信息的虚假新闻检测研究
5
作者 陈锟 潘梦雅 《情报探索》 2023年第6期31-39,共9页
[目的/意义]解决现有突发公共卫生事件中虚假新闻检测存在的检测时效性弱、文本语义特征提取不全面问题。[方法/过程]从多粒度视角出发,通过预训练语言模型BERT抽取句子向量特征和字符向量特征,引入腾讯AI Lab开源词向量获取词语向量特... [目的/意义]解决现有突发公共卫生事件中虚假新闻检测存在的检测时效性弱、文本语义特征提取不全面问题。[方法/过程]从多粒度视角出发,通过预训练语言模型BERT抽取句子向量特征和字符向量特征,引入腾讯AI Lab开源词向量获取词语向量特征,再通过特征融合技术构建起富含多粒度信息的文本特征表示模型,最后利用卷积神经网络实现对融合特征的识别分类,以此构建起融合多粒度信息的虚假新闻检测模型MG-CNN。[结果/结论]本文提出模型的准确率、查全率和召回率分别为97.829%、97.592%和96.986%,其中F1值达到97.283%,较基线模型最大提升7.305%,较次优模型提升0.774%。融合多粒度信息特征的MG-CNN模型能够高效精准地检测出突发公共卫生事件中的虚假新闻。 展开更多
关键词 突发公共卫生事件 虚假新闻检测 粒度信息 特征融合
下载PDF
结合多粒度信息的文本匹配融合模型 被引量:3
6
作者 吕乐宾 刘群 +2 位作者 彭露 邓维斌 王崇宇 《计算机科学》 CSCD 北大核心 2021年第6期196-201,共6页
常规的文本匹配模型大致分为基于表示的文本匹配模型和基于交互的文本匹配模型。由于基于表示的文本匹配模型容易失去语义焦点,而基于交互的文本匹配模型会忽视全局信息,文中提出了结合多粒度信息的文本匹配融合模型。该模型通过交互注... 常规的文本匹配模型大致分为基于表示的文本匹配模型和基于交互的文本匹配模型。由于基于表示的文本匹配模型容易失去语义焦点,而基于交互的文本匹配模型会忽视全局信息,文中提出了结合多粒度信息的文本匹配融合模型。该模型通过交互注意力和表示注意力将两种文本匹配模型进行了融合,然后利用卷积神经网络提取了文本中存在的多个不同级别的粒度信息,使得模型既能抓住局部的重要信息又能获取全局的语义信息。在3组不同的文本匹配任务上的实验结果表明,所提出的模型在NDCG@5评价指标上分别优于其他最优模型5.3%,0.4%,1.5%。通过提取文本中的多个粒度信息并结合交互注意力和表示注意力,提出的模型能够有效地关注不同级别的文本信息,解决了传统模型在文本匹配过程中易失去语义焦点和忽视全局信息的问题。 展开更多
关键词 文本匹配 交互注意力 表示注意力 粒度网络 粒度信息
下载PDF
模态不变性特征学习和一致性细粒度信息挖掘的跨模态行人重识别 被引量:3
7
作者 石林波 李华锋 +1 位作者 张亚飞 谢明鸿 《模式识别与人工智能》 EI CSCD 北大核心 2022年第12期1064-1077,共14页
跨模态行人重识别方法主要通过对齐不同模态的像素分布或特征分布以缓解模态差异,却忽略具有判别性的行人细粒度信息.为了获取不受模态差异影响且更具判别性的行人特征,文中提出模态不变性特征学习和一致性细粒度信息挖掘的跨模态行人... 跨模态行人重识别方法主要通过对齐不同模态的像素分布或特征分布以缓解模态差异,却忽略具有判别性的行人细粒度信息.为了获取不受模态差异影响且更具判别性的行人特征,文中提出模态不变性特征学习和一致性细粒度信息挖掘的跨模态行人重识别方法.方法主要包括模态不变性特征学习模块和语义一致的细粒度信息挖掘模块,联合两个模块,使特征提取网络获取具有判别性的特征.具体地,首先利用模态不变性特征学习模块去除特征图中的模态信息,缓解模态差异.然后,使用语义一致的细粒度信息挖掘模块,对特征图分别进行通道分组和水平分块,在充分挖掘具有判别性的细粒度信息的同时实现语义对齐.实验表明,文中方法性能较优. 展开更多
关键词 跨模态行人重识别 模态差异 粒度信息 语义一致性
下载PDF
局部细粒度信息引导的双循环一致性绝缘子缺陷样本生成 被引量:2
8
作者 赵潇 李仕林 +3 位作者 李凡 余正涛 张林华 杨勇 《计算机科学》 CSCD 北大核心 2021年第S01期581-586,602,共7页
针对绝缘子缺陷样本数据缺乏,现有生成方法又要求训练样本的规模庞大,且在生成过程中绝缘子缺陷的细节常常被丢失或扭曲,提出了一种基于局部细粒度信息引导的双循环一致性绝缘子缺陷样本生成方法。该方法利用粗糙绝缘子图像作为网络输入... 针对绝缘子缺陷样本数据缺乏,现有生成方法又要求训练样本的规模庞大,且在生成过程中绝缘子缺陷的细节常常被丢失或扭曲,提出了一种基于局部细粒度信息引导的双循环一致性绝缘子缺陷样本生成方法。该方法利用粗糙绝缘子图像作为网络输入,提出通过循环一致性生成对抗方法向精细缺陷绝缘子样本学习,生成较为逼真的缺陷样本。为使生成的样本具有丰富的缺陷特征,提出将生成图像中的缺陷区域图像作为判别网络的输入,并利用对抗约束的方式引导生成网络重点关注缺陷的细粒度信息,从而进一步提升生成绝缘子缺陷样本的真实性和多样性。与现有方法相比,所提方法构建的绝缘子缺陷样本数据集具有逼真、多样化等特点,为提升绝缘子缺陷自动识别的准确性提供了重要的数据基础。 展开更多
关键词 绝缘子 样本生成 局部细粒度信息 双循环一致性 对抗式网络
下载PDF
融合多粒度信息与外部知识的短文本匹配模型 被引量:4
9
作者 梁登玉 刘大明 《计算机工程》 CAS CSCD 北大核心 2022年第8期129-135,143,共8页
中文短文本通常使用单词序列而非字符序列进行语义匹配,以获得更好的语义匹配性能。然而,中文分词可能是错误或模糊的,容易引入噪声或者错误传播,从而损害模型的匹配性能。此外,多数中文词汇具有一词多义的特点,短文本由于缺少上下文环... 中文短文本通常使用单词序列而非字符序列进行语义匹配,以获得更好的语义匹配性能。然而,中文分词可能是错误或模糊的,容易引入噪声或者错误传播,从而损害模型的匹配性能。此外,多数中文词汇具有一词多义的特点,短文本由于缺少上下文环境,相比一词多义的长文本更难理解,这对于模型正确捕获语义信息是一个更大的挑战。提出一种短文本匹配模型,使用词格长短期记忆网络(Lattice LSTM)融合字符和字符序列的多粒度信息。引入外部知识HowNet解决多义词的问题,使用软注意力机制获取2个句子间的交互信息,并利用均值池化和最大池化算法进一步提取句子的特征信息,获取句子级语义编码表示。在数据集LCQMC和BQ上的实验结果表明,与ESIM、BIMPM和Lattice-CNN模型相比,该模型能有效提升中文短文本语义匹配的准确率。 展开更多
关键词 短文本语义匹配 词格长短期记忆网络 粒度信息 外部知识 软注意力机制
下载PDF
铝酸钠溶液附聚过程中的粒度信息分析
10
作者 李旺兴 尹建国 +1 位作者 陈启元 尹周澜 《中国稀土学报》 CAS CSCD 北大核心 2004年第z1期227-230,共4页
实验研究了76℃条件下,Na2Ok=140g l-1,αk=1.37的铝酸钠溶液种分附聚过程.通过附聚过程中的粒度信息分析发现:附聚首先发生在0-10 μ m的小粒子之间,然后才是较大粒径的粒子;一定粒径的粒子发生附聚时,其体积分数分布随时间的变化呈现... 实验研究了76℃条件下,Na2Ok=140g l-1,αk=1.37的铝酸钠溶液种分附聚过程.通过附聚过程中的粒度信息分析发现:附聚首先发生在0-10 μ m的小粒子之间,然后才是较大粒径的粒子;一定粒径的粒子发生附聚时,其体积分数分布随时间的变化呈现波峰与波谷相间的规律,波峰与波谷出现的时间基本上是相同的,但随着粒径的增加,波峰、波谷的出现时间略有后移.由此可望进一步计算动力学参数. 展开更多
关键词 铝酸钠溶液 晶种分解 附聚 粒度信息
下载PDF
基于多粒度信息的中医文本关系抽取的研究
11
作者 王亚文 王培 卢苗苗 《电脑知识与技术》 2021年第27期15-16,共2页
中医领域知识主要是以文本的形式存在,具有无规律的语言特性,中医知识的有效挖掘对充分利用文本中蕴藏的经验知识具有重要作用,信息抽取任务是中医知识管理的重要子任务,而关系抽取又是信息抽取任务中的重要环节。针对单粒度信息关系抽... 中医领域知识主要是以文本的形式存在,具有无规律的语言特性,中医知识的有效挖掘对充分利用文本中蕴藏的经验知识具有重要作用,信息抽取任务是中医知识管理的重要子任务,而关系抽取又是信息抽取任务中的重要环节。针对单粒度信息关系抽取方法中存在的句意传递错误和文本语义丢失的问题,提出将句子中的多粒度信息应用于中医文本关系抽取任务,构建多粒度信息抽取模型,将词语级信息整合到字符序列中,多种粒度的文本信息可以为模型提供更多的知识引导,更全面的挖掘语义特征。实验结果证明,此方法能够更加精确的抽取中医文本关系,使模型具有更好的鲁棒性,基本不受噪声的影响。 展开更多
关键词 粒度信息 关系抽取 深度学习 中医文本
下载PDF
融合多粒度语义信息和知识图谱的中文医疗问答匹配模型
12
作者 管立本 李实 《计算机工程与应用》 CSCD 北大核心 2024年第14期152-161,共10页
中文医疗领域问答容易受到医疗特定词汇的噪声影响,相对于开放领域问答其更具有挑战性。以往的中文医疗问答研究主要依赖于字符级别的细粒度信息,忽略了携带更多语义信息的单词级别的粗粒度信息。此外,引入外部医学知识图谱可以进一步... 中文医疗领域问答容易受到医疗特定词汇的噪声影响,相对于开放领域问答其更具有挑战性。以往的中文医疗问答研究主要依赖于字符级别的细粒度信息,忽略了携带更多语义信息的单词级别的粗粒度信息。此外,引入外部医学知识图谱可以进一步丰富问答句子中的细粒度信息,然而目前大多数研究通常只采用句子和外部知识共同表示的简单方式。由此提出一种融合多粒度语义信息和知识图谱的中文医疗问答匹配模型(CMQA-MGSI)。该模型引入Lattice网络,结合Word2Vec和BERT设计了两种特征向量提取模型来选择问答句子中最相关的字符序列和单词序列以获得更丰富的多粒度语义信息;为了更好地融合外部领域知识,设计双通道注意力模块提取问答句子和知识图谱中实体嵌入以及关系嵌入之间多个角度的知识表征信息。该模型在数据集cMedQA1.0和cMedQA2.0上的实验表明,效果优于现有的问答匹配模型。 展开更多
关键词 中文医疗问答 粒度信息 知识图谱 Lattice网络 注意力机制
下载PDF
信息粒度、公众行为对舆论聚合的内生影响与组态效应研究——基于VAR与QCA的混合方法
13
作者 杨洋洋 《情报杂志》 北大核心 2024年第1期167-175,105,共10页
[研究目的]面对复杂的网络环境,探讨影响舆论聚合的关键要素,既有助于舆论信息的高效传播,又能够提高政府舆论调控的速度和精度,具有重要的现实意义。[研究方法]采用VAR和fsQCA相融合的方法,选取28个视频平台负面事件作为研究对象,运用... [研究目的]面对复杂的网络环境,探讨影响舆论聚合的关键要素,既有助于舆论信息的高效传播,又能够提高政府舆论调控的速度和精度,具有重要的现实意义。[研究方法]采用VAR和fsQCA相融合的方法,选取28个视频平台负面事件作为研究对象,运用VAR模型验证了信息粒度、公众行为与舆论聚合之间的两两变量因果关系,在此基础上,运用fsQCA方法探究了信息权威性、信息覆盖度、信息报道率、公众关注度、公众活跃度、公众参与期6个前因条件组合对舆论聚合的影响机制。[研究结论]研究发现,信息粒度、公众行为与舆论聚合之间存在显著的两两变量因果关系,挖掘出了8种导致高舆论聚合的条件组态,信息报道率、公众关注度、公众活跃度为核心条件,提炼归纳了公众行为驱动型、信息粒度驱动型、信息-公众驱动型的三种高舆论聚合的理论模式。 展开更多
关键词 信息粒度 公众行为 舆论聚合 内生影响 组态效应
下载PDF
基于细粒度信息交互注意力的情绪分类方法 被引量:2
14
作者 胡慧君 易洋 +2 位作者 施琦 唐东昕 刘茂福 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2023年第3期400-408,共9页
现有细粒度分析方法未能充分利用细粒度情绪信息来增强上下文与评价目标间的语义关联性,且对多词构成的评价目标仅平均化处理,损失了词间内容与关系信息,导致分类不精准。针对上述问题,本文提出了一种基于细粒度信息交互注意力(interact... 现有细粒度分析方法未能充分利用细粒度情绪信息来增强上下文与评价目标间的语义关联性,且对多词构成的评价目标仅平均化处理,损失了词间内容与关系信息,导致分类不精准。针对上述问题,本文提出了一种基于细粒度信息交互注意力(interactive attention with fine-grained information,FGIA)的情绪分类方法,通过采用更加细粒度的注意力机制来实现评价目标与上下文之间的充分交互,同时得到目标对上下文以及上下文对目标的交互注意力表示,进而辅助完成情绪分类。在本文构建的COVID-19网络舆情中文数据集上进行了实验验证,结果表明,FGIA能够有效地提升网络舆情数据情绪分类的准确性,相比于主流的分类方法,在各项评价指标上均取得了较高的提升。 展开更多
关键词 情绪分类 粒度信息 交互注意力
原文传递
基于熵和信息粒度的粗糙集聚类算法 被引量:6
15
作者 何明 冯博琴 +1 位作者 马兆丰 傅向华 《西安交通大学学报》 EI CAS CSCD 北大核心 2005年第4期343-346,共4页
针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的... 针对多数聚类算法只能单独处理数值特征数据或类属特征数据,而不能分析具有两种混合属性数据的问题,基于熵和信息粒度提出了粗糙集理论框架下不同粒度划分上的聚类算法.该算法利用相似关系,通过计算每个数据点的熵并选取具有最小熵值的数据点作为聚类中心,将与该聚类中心相似度大于阈值β的所有数据点聚集形成数字颗粒结构.在整个聚类过程中无需调整每个数据点的熵值,缩短了计算时间,同时利用粗糙集的不可分辨关系形成字符颗粒结构,通过不断调整、合并这两种颗粒结构,实现了具有混合属性特征数据的聚类分析.实验结果比较表明,该算法是有效、可行的,当β取值为0 8 时,算法的聚类有效性最大值可达0 96,该值较同条件下的其他聚类算法要高. 展开更多
关键词 粗糙集 聚类分析 信息粒度
下载PDF
基于信息粒度的属性权重确定方法 被引量:9
16
作者 周辉 鲁燕飞 +1 位作者 王黔英 袁芳 《统计与决策》 CSSCI 北大核心 2006年第20期134-136,共3页
在多属性评价中,属性权重确定是一个关键问题,许多评价方法在确定属性权重时存在局限性。论文依据属性重要性概念,提出基于信息粒度的属性权重客观确定方法,克服了以往方法的局限,弥补了普遍使用的基于Rough集评价方法的不足。得到的客... 在多属性评价中,属性权重确定是一个关键问题,许多评价方法在确定属性权重时存在局限性。论文依据属性重要性概念,提出基于信息粒度的属性权重客观确定方法,克服了以往方法的局限,弥补了普遍使用的基于Rough集评价方法的不足。得到的客观权重通过偏好系数与主观权重相结合,使权重设置更合理,最后给出实例说明该方法的实用性和可行性。 展开更多
关键词 信息粒度 权重 属性重要性 ROUGH集
下载PDF
基于改进SLIQ算法及多粒度气象信息匹配的短期负荷预测 被引量:15
17
作者 李滨 覃芳璐 +2 位作者 李倍存 吴茵 李佩杰 《电网技术》 EI CSCD 北大核心 2018年第1期291-300,共10页
短期负荷预测容易受到气象等多种因素共同作用的影响,找到关键影响因素是提高短期负荷预测精度的必要手段。电力系统海量数据包含了巨量的运行信息,为挖掘有用信息,提高数据利用效率,提出了一种基于改进SLIQ算法及多粒度气象信息匹配的... 短期负荷预测容易受到气象等多种因素共同作用的影响,找到关键影响因素是提高短期负荷预测精度的必要手段。电力系统海量数据包含了巨量的运行信息,为挖掘有用信息,提高数据利用效率,提出了一种基于改进SLIQ算法及多粒度气象信息匹配的短期负荷预测方法。采用改进的SLIQ决策树算法对气象负荷信息进行聚类,提取同等气象条件下决定负荷波动的关键因素。由动态灵敏度方法建立短期负荷拐点预测模型,再由熵权法选择最佳预测参考日并预测曲线拐点,并在此基础上提出多粒度气象信息匹配算法进行负荷曲线预测。通过对我国南方某地区的多季节负荷进行仿真预测,计算结果表明在任意气象条件下曲线预测精度均能满足电网要求,证明了所提方法的正确性及普适性。 展开更多
关键词 短期负荷预测 大数据挖掘 改进SLIQ气象分类器 动态灵敏度 粒度气象信息匹配
下载PDF
基于信息粒度的交叠类文本分类方法 被引量:7
18
作者 林琛 李弼程 周杰 《情报学报》 CSSCI 北大核心 2011年第4期339-346,共8页
从信息粒度的角度分析了文本分类中出现样本错分的原因,同时结合人类认知方式,提出一种基于信息粒度的交叠类文本分类方法。新方法通过转换描述训练样本集合的粒度空间,对训练样本进行重新划分,加大训练样本之间的差异性,以此增加分类... 从信息粒度的角度分析了文本分类中出现样本错分的原因,同时结合人类认知方式,提出一种基于信息粒度的交叠类文本分类方法。新方法通过转换描述训练样本集合的粒度空间,对训练样本进行重新划分,加大训练样本之间的差异性,以此增加分类的先验知识;根据人类认知方式的特点,在划分后的训练样本集合上构建层次分类器进行分类。实验中采用了不同领域、不同类型的语料库,定量分析了类交叠程度对分类性能的影响并对新方法进行了测试。实验结果表明,新方法能够有效地提高分类性能,尤其适合于类交叠程度较高的情况。 展开更多
关键词 信息粒度 文本分类 认知方式
下载PDF
信息系统中的熵理论和信息粒度 被引量:7
19
作者 滕书华 鲁敏 +2 位作者 张军 谭志国 庄钊文 《计算机工程与科学》 CSCD 北大核心 2012年第4期94-101,共8页
不确定性是人工智能中的研究热点,而熵理论和信息粒度是度量信息系统不确定性的两种主要方法。本文在给出信息系统中熵的物理意义基础上,提出了信息系统中熵增加原理,给出了熵和信息粒度的公理化定义,据此构造了两种新的不确定性度量函... 不确定性是人工智能中的研究热点,而熵理论和信息粒度是度量信息系统不确定性的两种主要方法。本文在给出信息系统中熵的物理意义基础上,提出了信息系统中熵增加原理,给出了熵和信息粒度的公理化定义,据此构造了两种新的不确定性度量函数—α熵和α粒度,它们是已有熵和粒度度量的进一步推广。研究表明,α熵以及现有的熵度量都是广义熵的特殊形式,而α粒度以及现有的粒度度量都是广义粒度的特殊形式,从而统一、规范和发展了完备与不完备信息系统中的不确定性度量方法。 展开更多
关键词 信息系统 信息粒度 粗糙集 不确定性
下载PDF
产品规划中基于群体多粒度语义信息的顾客需求优先度确定研究 被引量:4
20
作者 王增强 李延来 蒲云 《中国机械工程》 EI CAS CSCD 北大核心 2012年第8期980-986,共7页
针对质量屋构建中信息的模糊性和不确定性,提出了基于群体多粒度语义信息的顾客需求优先度确定方法。首先,由各位专家给出顾客需求的主观判定信息,通过一致性转换和近似理想方案的顺序优选技术获取各项需求的基本优先度。然后,依据各项... 针对质量屋构建中信息的模糊性和不确定性,提出了基于群体多粒度语义信息的顾客需求优先度确定方法。首先,由各位专家给出顾客需求的主观判定信息,通过一致性转换和近似理想方案的顺序优选技术获取各项需求的基本优先度。然后,依据各项需求的市场竞争性,计算各项需求的竞争优先度。最后,合成基本优先度和竞争优先度,确定顾客需求的综合优先度。应用实例证明了该方法的有效性和实用性。 展开更多
关键词 质量功能展开 质量屋 优先度 粒度语义信息
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部