期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
结合文本监督和多粒度特征的姿态情绪识别
1
作者 邹卓华 李新德 +1 位作者 胡川飞 徐建平 《指挥信息系统与技术》 2024年第4期69-77,94,共10页
通过分析人体3D骨架的连续运动规律,建模姿态情绪识别方法,在人机交互等领域具有广泛的应用前景。针对姿态特征易混淆导致的骨架局部情绪性特征难捕获问题,提出了一种结合文本监督和多粒度特征的姿态情绪识别方法。通过多粒度特征融合... 通过分析人体3D骨架的连续运动规律,建模姿态情绪识别方法,在人机交互等领域具有广泛的应用前景。针对姿态特征易混淆导致的骨架局部情绪性特征难捕获问题,提出了一种结合文本监督和多粒度特征的姿态情绪识别方法。通过多粒度特征融合网络模块,对情绪识别问题中人体的动态姿态进行建模。同时,采用文本化描述的标签对融合情绪特征进行监督训练,引导网络提取骨架各个部位的情绪性特征。在MPI情绪身体表达数据集上对该方法进行评估,试验结果表明,该方法准确率达80.50%,验证了其有效性。 展开更多
关键词 姿态情绪识别 特征融合 多粒度 文本监督
下载PDF
基于混合神经网络模型的民生监督文本分类方法
2
作者 龙华 华才健 +1 位作者 王琦标 徐尽悦 《四川轻化工大学学报(自然科学版)》 CAS 2024年第2期49-56,共8页
随着民生监督对信息化要求的逐渐提高,高效准确地识别民生监督文本可以帮助纪检监察部门及时搜集和跟踪事件并进行处理。针对民生监督文本分类困难的问题,提出了基于Mengzi模型融合BiLSTM、注意力机制和TextCNN的混合神经网络模型MBC,... 随着民生监督对信息化要求的逐渐提高,高效准确地识别民生监督文本可以帮助纪检监察部门及时搜集和跟踪事件并进行处理。针对民生监督文本分类困难的问题,提出了基于Mengzi模型融合BiLSTM、注意力机制和TextCNN的混合神经网络模型MBC,以提高民生监督文本分类的准确率。该模型首先使用预训练模型Mengzi得到富含丰富语义信息的词向量,后接并行的BiLSTM结合注意力机制网络和TextCNN网络,分别提取文本全局和局部特征,最后将全局与局部特征进行融合,实现对民生监督文本的准确分类。实验结果表明,MBC模型在准确率、召回率和F1值均达到了89%以上,优于传统的文本分类模型,为民生监督文本分类问题提供了新的研究思路。 展开更多
关键词 民生监督文本分类 Mengzi模型 BiLSTM 注意力机制 TextCNN 混合模型MBC
下载PDF
标签语义增强的弱监督文本分类模型 被引量:2
3
作者 林呈宇 王雷 薛聪 《计算机应用》 CSCD 北大核心 2023年第2期335-342,共8页
针对弱监督文本分类任务中存在的类别词表噪声和标签噪声问题,提出了一种标签语义增强的弱监督文本分类模型。首先,基于单词上下文语义表示对类别词表去噪,从而构建高度准确的类别词表;然后,构建基于MASK机制的词类别预测任务对预训练模... 针对弱监督文本分类任务中存在的类别词表噪声和标签噪声问题,提出了一种标签语义增强的弱监督文本分类模型。首先,基于单词上下文语义表示对类别词表去噪,从而构建高度准确的类别词表;然后,构建基于MASK机制的词类别预测任务对预训练模型BERT进行微调,以学习单词与类别的关系;最后,利用引入标签语义的自训练模块来充分利用所有数据信息并减少标签噪声的影响,以实现词级到句子级语义的转换,从而准确预测文本序列类别。实验结果表明,与目前最先进的弱监督文本分类模型LOTClass相比,所提方法在THUCNews、AG News和IMDB公开数据集上,分类准确率分别提高了5.29、1.41和1.86个百分点。 展开更多
关键词 监督文本分类 BERT MASK机制 标签语义 标签噪声 自训练
下载PDF
基于亮度分级和方向密度的无监督文本定位 被引量:2
4
作者 刘琼 周慧灿 王耀南 《计算机应用》 CSCD 北大核心 2008年第6期1523-1526,共4页
提出一种基于RGB亮度分级和方向密度的自然场景无监督文本定位方法,该方法基于场景文本通常与局部背景有较大的对比度这一特性,分别在R、G、B三个颜色层进行亮度分级,以降低背景复杂性;然后,利用文字笔画的显著方向性,以方向密度为依据... 提出一种基于RGB亮度分级和方向密度的自然场景无监督文本定位方法,该方法基于场景文本通常与局部背景有较大的对比度这一特性,分别在R、G、B三个颜色层进行亮度分级,以降低背景复杂性;然后,利用文字笔画的显著方向性,以方向密度为依据进行文本区域粗定位;再进一步利用SVM多类分类器实现文本区域精确判别。新方法克服了一般无监督方法颜色聚类数目选定困难的问题,限制了候选区域的种类,从而降低了SVM分类器的训练难度,具有较高的准确性和鲁棒性。 展开更多
关键词 RGB亮度 梯度方向 监督文本定位 支持向量机多类分类器
下载PDF
半监督语义动态文本聚类算法 被引量:1
5
作者 钱志森 黄瑞章 +2 位作者 魏琴 秦永彬 陈艳平 《电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期803-808,共6页
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中... 针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类.同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果.实验结果表明该文提出的算法是有效可行的. 展开更多
关键词 动态文本聚类 语义学习 监督文本聚类 文本聚类
下载PDF
无监督的财经新闻情感标注和情绪指数生成 被引量:1
6
作者 邵元海 何洋 吕孝敬 《海南大学学报(人文社会科学版)》 CSSCI 2023年第3期84-95,共12页
财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,... 财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,针对财经新闻无标注的问题,本文通过改进的SO-PMI算法构造财经新闻领域情感词典来对新闻进行无监督标注;在第二阶段,为了提取精确的新闻情感强度值,本文构造了新闻情绪指数,先利用已标注的新闻数据训练情感分类模型从而生成类别概率,然后通过概率值计算得到情绪指数。为了进一步验证该方法的有效性,将生成的情绪指数结合股市历史价格数据来对上证股指波动趋势进行预测。结果表明,基于注意力机制的预测模型在添加情绪指数变量后,准确率提升了3%—5%,说明新闻情绪指数对于股指波动有较好的表征作用。 展开更多
关键词 财经新闻 监督文本标注 情绪指数 注意力机制
下载PDF
基于有监督对比学习的航天信息获取与图像生成
7
作者 齐翌辰 赵伟超 《液晶与显示》 CAS CSCD 北大核心 2023年第11期1531-1541,共11页
为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的... 为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM),融合对比学习技术,对开源的信息进行处理并分析,进而高效地筛选出航天类的信息,利用unCLIP(un-Contrastive Language-Image Pre-Training)模型生成信息对应的图像。实验结果表明,对比CNN(Convolutional Neural Networks)、BiLSTM、Transformer和BiL⁃STM-Attention等常用的文本分类方法,该方法在准确率、召回率和F1-Score上均表现良好,其中F1-Score达到0.97,同时以图像的形式呈现信息,使信息更加清晰直观。本文方法可以充分使用网络公开的数据资源,有效地提取开源航天信息并生成对应图像,对航天信息的分析和研究具有重要价值。 展开更多
关键词 监督文本分类 对比学习 文本生成图像 航天信息
下载PDF
基于句子级学习改进CNN的短文本分类方法 被引量:12
8
作者 韩栋 王春华 肖敏 《计算机工程与设计》 北大核心 2019年第1期256-260,284,共6页
为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型... 为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型赋予较高权重,通过加权和构建文本模型。通过文本级CNN监督学习,实现文本分类。在两个评论数据集上的实验结果表明,提出方法具有较高的分类准确性。 展开更多
关键词 文本分类 卷积神经网络 主题句 句子级监督学习 文本监督学习
下载PDF
基于差异性评估对Co-training文本分类算法的改进 被引量:4
9
作者 唐焕玲 林正奎 鲁明羽 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期138-143,共6页
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视... Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法. 展开更多
关键词 监督文本分类 CO-TRAINING 特征视图 差异性评估 标注文本 未标注文本
下载PDF
一个对不带类别标记文本进行分类的方法 被引量:1
10
作者 蒋志方 祝翠玲 吴强 《计算机工程》 CAS CSCD 北大核心 2007年第12期96-98,共3页
利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确... 利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确的分类结果。 展开更多
关键词 文本分类 监督文本聚类 朴素贝叶斯分类 欧氏距离
下载PDF
一种利用近邻和信息熵的主动文本标注方法 被引量:4
11
作者 朱岩 景丽萍 于剑 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1306-1312,共7页
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提... 由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性. 展开更多
关键词 监督文本分类 主动学习 近邻 信息熵 标注方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部