期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合文本监督和多粒度特征的姿态情绪识别
1
作者
邹卓华
李新德
+1 位作者
胡川飞
徐建平
《指挥信息系统与技术》
2024年第4期69-77,94,共10页
通过分析人体3D骨架的连续运动规律,建模姿态情绪识别方法,在人机交互等领域具有广泛的应用前景。针对姿态特征易混淆导致的骨架局部情绪性特征难捕获问题,提出了一种结合文本监督和多粒度特征的姿态情绪识别方法。通过多粒度特征融合...
通过分析人体3D骨架的连续运动规律,建模姿态情绪识别方法,在人机交互等领域具有广泛的应用前景。针对姿态特征易混淆导致的骨架局部情绪性特征难捕获问题,提出了一种结合文本监督和多粒度特征的姿态情绪识别方法。通过多粒度特征融合网络模块,对情绪识别问题中人体的动态姿态进行建模。同时,采用文本化描述的标签对融合情绪特征进行监督训练,引导网络提取骨架各个部位的情绪性特征。在MPI情绪身体表达数据集上对该方法进行评估,试验结果表明,该方法准确率达80.50%,验证了其有效性。
展开更多
关键词
姿态情绪识别
特征融合
多粒度
文本监督
下载PDF
职称材料
基于混合神经网络模型的民生监督文本分类方法
2
作者
龙华
华才健
+1 位作者
王琦标
徐尽悦
《四川轻化工大学学报(自然科学版)》
CAS
2024年第2期49-56,共8页
随着民生监督对信息化要求的逐渐提高,高效准确地识别民生监督文本可以帮助纪检监察部门及时搜集和跟踪事件并进行处理。针对民生监督文本分类困难的问题,提出了基于Mengzi模型融合BiLSTM、注意力机制和TextCNN的混合神经网络模型MBC,...
随着民生监督对信息化要求的逐渐提高,高效准确地识别民生监督文本可以帮助纪检监察部门及时搜集和跟踪事件并进行处理。针对民生监督文本分类困难的问题,提出了基于Mengzi模型融合BiLSTM、注意力机制和TextCNN的混合神经网络模型MBC,以提高民生监督文本分类的准确率。该模型首先使用预训练模型Mengzi得到富含丰富语义信息的词向量,后接并行的BiLSTM结合注意力机制网络和TextCNN网络,分别提取文本全局和局部特征,最后将全局与局部特征进行融合,实现对民生监督文本的准确分类。实验结果表明,MBC模型在准确率、召回率和F1值均达到了89%以上,优于传统的文本分类模型,为民生监督文本分类问题提供了新的研究思路。
展开更多
关键词
民生
监督
文本
分类
Mengzi模型
BiLSTM
注意力机制
TextCNN
混合模型MBC
下载PDF
职称材料
标签语义增强的弱监督文本分类模型
被引量:
2
3
作者
林呈宇
王雷
薛聪
《计算机应用》
CSCD
北大核心
2023年第2期335-342,共8页
针对弱监督文本分类任务中存在的类别词表噪声和标签噪声问题,提出了一种标签语义增强的弱监督文本分类模型。首先,基于单词上下文语义表示对类别词表去噪,从而构建高度准确的类别词表;然后,构建基于MASK机制的词类别预测任务对预训练模...
针对弱监督文本分类任务中存在的类别词表噪声和标签噪声问题,提出了一种标签语义增强的弱监督文本分类模型。首先,基于单词上下文语义表示对类别词表去噪,从而构建高度准确的类别词表;然后,构建基于MASK机制的词类别预测任务对预训练模型BERT进行微调,以学习单词与类别的关系;最后,利用引入标签语义的自训练模块来充分利用所有数据信息并减少标签噪声的影响,以实现词级到句子级语义的转换,从而准确预测文本序列类别。实验结果表明,与目前最先进的弱监督文本分类模型LOTClass相比,所提方法在THUCNews、AG News和IMDB公开数据集上,分类准确率分别提高了5.29、1.41和1.86个百分点。
展开更多
关键词
弱
监督
文本
分类
BERT
MASK机制
标签语义
标签噪声
自训练
下载PDF
职称材料
基于亮度分级和方向密度的无监督文本定位
被引量:
2
4
作者
刘琼
周慧灿
王耀南
《计算机应用》
CSCD
北大核心
2008年第6期1523-1526,共4页
提出一种基于RGB亮度分级和方向密度的自然场景无监督文本定位方法,该方法基于场景文本通常与局部背景有较大的对比度这一特性,分别在R、G、B三个颜色层进行亮度分级,以降低背景复杂性;然后,利用文字笔画的显著方向性,以方向密度为依据...
提出一种基于RGB亮度分级和方向密度的自然场景无监督文本定位方法,该方法基于场景文本通常与局部背景有较大的对比度这一特性,分别在R、G、B三个颜色层进行亮度分级,以降低背景复杂性;然后,利用文字笔画的显著方向性,以方向密度为依据进行文本区域粗定位;再进一步利用SVM多类分类器实现文本区域精确判别。新方法克服了一般无监督方法颜色聚类数目选定困难的问题,限制了候选区域的种类,从而降低了SVM分类器的训练难度,具有较高的准确性和鲁棒性。
展开更多
关键词
RGB亮度
梯度方向
无
监督
文本
定位
支持向量机多类分类器
下载PDF
职称材料
半监督语义动态文本聚类算法
被引量:
1
5
作者
钱志森
黄瑞章
+2 位作者
魏琴
秦永彬
陈艳平
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2019年第6期803-808,共6页
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中...
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类.同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果.实验结果表明该文提出的算法是有效可行的.
展开更多
关键词
动态
文本
聚类
语义学习
半
监督
文本
聚类
文本
聚类
下载PDF
职称材料
无监督的财经新闻情感标注和情绪指数生成
被引量:
1
6
作者
邵元海
何洋
吕孝敬
《海南大学学报(人文社会科学版)》
CSSCI
2023年第3期84-95,共12页
财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,...
财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,针对财经新闻无标注的问题,本文通过改进的SO-PMI算法构造财经新闻领域情感词典来对新闻进行无监督标注;在第二阶段,为了提取精确的新闻情感强度值,本文构造了新闻情绪指数,先利用已标注的新闻数据训练情感分类模型从而生成类别概率,然后通过概率值计算得到情绪指数。为了进一步验证该方法的有效性,将生成的情绪指数结合股市历史价格数据来对上证股指波动趋势进行预测。结果表明,基于注意力机制的预测模型在添加情绪指数变量后,准确率提升了3%—5%,说明新闻情绪指数对于股指波动有较好的表征作用。
展开更多
关键词
财经新闻
无
监督
文本
标注
情绪指数
注意力机制
下载PDF
职称材料
基于有监督对比学习的航天信息获取与图像生成
7
作者
齐翌辰
赵伟超
《液晶与显示》
CAS
CSCD
北大核心
2023年第11期1531-1541,共11页
为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的...
为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM),融合对比学习技术,对开源的信息进行处理并分析,进而高效地筛选出航天类的信息,利用unCLIP(un-Contrastive Language-Image Pre-Training)模型生成信息对应的图像。实验结果表明,对比CNN(Convolutional Neural Networks)、BiLSTM、Transformer和BiL⁃STM-Attention等常用的文本分类方法,该方法在准确率、召回率和F1-Score上均表现良好,其中F1-Score达到0.97,同时以图像的形式呈现信息,使信息更加清晰直观。本文方法可以充分使用网络公开的数据资源,有效地提取开源航天信息并生成对应图像,对航天信息的分析和研究具有重要价值。
展开更多
关键词
有
监督
文本
分类
对比学习
文本
生成图像
航天信息
下载PDF
职称材料
基于句子级学习改进CNN的短文本分类方法
被引量:
12
8
作者
韩栋
王春华
肖敏
《计算机工程与设计》
北大核心
2019年第1期256-260,284,共6页
为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型...
为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型赋予较高权重,通过加权和构建文本模型。通过文本级CNN监督学习,实现文本分类。在两个评论数据集上的实验结果表明,提出方法具有较高的分类准确性。
展开更多
关键词
短
文本
分类
卷积神经网络
主题句
句子级
监督
学习
文本
级
监督
学习
下载PDF
职称材料
基于差异性评估对Co-training文本分类算法的改进
被引量:
4
9
作者
唐焕玲
林正奎
鲁明羽
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期138-143,共6页
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视...
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法.
展开更多
关键词
半
监督
文本
分类
CO-TRAINING
特征视图
差异性评估
标注
文本
未标注
文本
下载PDF
职称材料
一个对不带类别标记文本进行分类的方法
被引量:
1
10
作者
蒋志方
祝翠玲
吴强
《计算机工程》
CAS
CSCD
北大核心
2007年第12期96-98,共3页
利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确...
利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确的分类结果。
展开更多
关键词
文本
分类
无
监督
文本
聚类
朴素贝叶斯分类
欧氏距离
下载PDF
职称材料
一种利用近邻和信息熵的主动文本标注方法
被引量:
4
11
作者
朱岩
景丽萍
于剑
《计算机研究与发展》
EI
CSCD
北大核心
2012年第6期1306-1312,共7页
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提...
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
展开更多
关键词
半
监督
文本
分类
主动学习
近邻
信息熵
标注方法
下载PDF
职称材料
题名
结合文本监督和多粒度特征的姿态情绪识别
1
作者
邹卓华
李新德
胡川飞
徐建平
机构
东南大学自动化学院
南京应用数学中心
东南大学深圳研究院
信息系统工程重点实验室
出处
《指挥信息系统与技术》
2024年第4期69-77,94,共10页
基金
国家自然科学基金(62233003和62073072)
江苏省重点科技发展计划(BE2020006和BE2020006-1)
深圳市科技计划(JCYJ20210324132202005和JCYJ20220818101206014)资助项目。
文摘
通过分析人体3D骨架的连续运动规律,建模姿态情绪识别方法,在人机交互等领域具有广泛的应用前景。针对姿态特征易混淆导致的骨架局部情绪性特征难捕获问题,提出了一种结合文本监督和多粒度特征的姿态情绪识别方法。通过多粒度特征融合网络模块,对情绪识别问题中人体的动态姿态进行建模。同时,采用文本化描述的标签对融合情绪特征进行监督训练,引导网络提取骨架各个部位的情绪性特征。在MPI情绪身体表达数据集上对该方法进行评估,试验结果表明,该方法准确率达80.50%,验证了其有效性。
关键词
姿态情绪识别
特征融合
多粒度
文本监督
Keywords
posture-based emotion recognition
feature fusion
multi-granularity
text-supervision
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于混合神经网络模型的民生监督文本分类方法
2
作者
龙华
华才健
王琦标
徐尽悦
机构
四川轻化工大学计算机科学与工程学院
出处
《四川轻化工大学学报(自然科学版)》
CAS
2024年第2期49-56,共8页
基金
四川省科技计划项目(2021JDRC0011)
四川轻化工大学研究生创新基金项目(Y2022174)。
文摘
随着民生监督对信息化要求的逐渐提高,高效准确地识别民生监督文本可以帮助纪检监察部门及时搜集和跟踪事件并进行处理。针对民生监督文本分类困难的问题,提出了基于Mengzi模型融合BiLSTM、注意力机制和TextCNN的混合神经网络模型MBC,以提高民生监督文本分类的准确率。该模型首先使用预训练模型Mengzi得到富含丰富语义信息的词向量,后接并行的BiLSTM结合注意力机制网络和TextCNN网络,分别提取文本全局和局部特征,最后将全局与局部特征进行融合,实现对民生监督文本的准确分类。实验结果表明,MBC模型在准确率、召回率和F1值均达到了89%以上,优于传统的文本分类模型,为民生监督文本分类问题提供了新的研究思路。
关键词
民生
监督
文本
分类
Mengzi模型
BiLSTM
注意力机制
TextCNN
混合模型MBC
Keywords
text classification for livelihood supervision
Mengzi model
BiLSTM
attention mechanism
TextCNN
hybrid model MBC
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
标签语义增强的弱监督文本分类模型
被引量:
2
3
作者
林呈宇
王雷
薛聪
机构
中国科学院信息工程研究所
中国科学院大学网络空间安全学院
出处
《计算机应用》
CSCD
北大核心
2023年第2期335-342,共8页
基金
国家自然科学基金重点项目(U1636220)。
文摘
针对弱监督文本分类任务中存在的类别词表噪声和标签噪声问题,提出了一种标签语义增强的弱监督文本分类模型。首先,基于单词上下文语义表示对类别词表去噪,从而构建高度准确的类别词表;然后,构建基于MASK机制的词类别预测任务对预训练模型BERT进行微调,以学习单词与类别的关系;最后,利用引入标签语义的自训练模块来充分利用所有数据信息并减少标签噪声的影响,以实现词级到句子级语义的转换,从而准确预测文本序列类别。实验结果表明,与目前最先进的弱监督文本分类模型LOTClass相比,所提方法在THUCNews、AG News和IMDB公开数据集上,分类准确率分别提高了5.29、1.41和1.86个百分点。
关键词
弱
监督
文本
分类
BERT
MASK机制
标签语义
标签噪声
自训练
Keywords
weakly-supervised text classification
BERT(Bidirectional Encoder Representations from Transformers)
MASK mechanism
label semantics
label noise
self-training
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于亮度分级和方向密度的无监督文本定位
被引量:
2
4
作者
刘琼
周慧灿
王耀南
机构
湖南文理学院计算机科学技术学院
湖南大学电气与信息工程学院
出处
《计算机应用》
CSCD
北大核心
2008年第6期1523-1526,共4页
文摘
提出一种基于RGB亮度分级和方向密度的自然场景无监督文本定位方法,该方法基于场景文本通常与局部背景有较大的对比度这一特性,分别在R、G、B三个颜色层进行亮度分级,以降低背景复杂性;然后,利用文字笔画的显著方向性,以方向密度为依据进行文本区域粗定位;再进一步利用SVM多类分类器实现文本区域精确判别。新方法克服了一般无监督方法颜色聚类数目选定困难的问题,限制了候选区域的种类,从而降低了SVM分类器的训练难度,具有较高的准确性和鲁棒性。
关键词
RGB亮度
梯度方向
无
监督
文本
定位
支持向量机多类分类器
Keywords
RGB brightness
gradient orientation
unsupervised text location
Support Vector Machine (SVM) multiclass classifier
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
半监督语义动态文本聚类算法
被引量:
1
5
作者
钱志森
黄瑞章
魏琴
秦永彬
陈艳平
机构
贵州大学计算机科学与技术学院
贵州大学贵州省公共大数据重点实验室
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2019年第6期803-808,共6页
基金
国家自然科学基金联合基金重点项目(U1836205)
国家自然科学基金重大研究计划(91746116)
+3 种基金
黔科合重大专项字([2018]3002)
贵州省重大应用基础研究项目(黔科合JZ字[2014]2001)
贵州省科技重大专项计划(黔科合重大专项字[2017]3002)
贵州省自然科学基金(黔科合基础[2018]1035)
文摘
针对传统的动态文本聚类将描述方式不同的同类文本划分到不同组中;以及聚类类别个数与真实类别数之间差距明显等问题,该文提出了一种半监督语义动态文本聚类算法(SDCS).该算法以语义表征文本的方式来捕获文本间的语义关系,在聚类过程中动态学习类别语义,让文本能根据语义准确聚类.同时该算法利用半监督聚类的方法对新类的产生进行监督,学习符合实际情况的聚类结果.实验结果表明该文提出的算法是有效可行的.
关键词
动态
文本
聚类
语义学习
半
监督
文本
聚类
文本
聚类
Keywords
dynamic text clustering
semantic learning
semi-supervised text clustering
text clustering
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
无监督的财经新闻情感标注和情绪指数生成
被引量:
1
6
作者
邵元海
何洋
吕孝敬
机构
海南大学管理学院
海南大学经济学院
出处
《海南大学学报(人文社会科学版)》
CSSCI
2023年第3期84-95,共12页
基金
国家自然科学基金委面上项目(11871183)
国家自然科学基金委地区项目(61866010)
海南省自然科学基金高层次人才项目(120RC449)。
文摘
财经新闻报道作为金融市场重要的信息来源,其情感倾向与市场走势有着密切联系。然而财经新闻具有专业性、客观性、无标注的特点,对其情感倾向进行精准量化往往十分困难。因此,本文设计了两阶段的财经新闻情绪指数提取方法,在第一阶段,针对财经新闻无标注的问题,本文通过改进的SO-PMI算法构造财经新闻领域情感词典来对新闻进行无监督标注;在第二阶段,为了提取精确的新闻情感强度值,本文构造了新闻情绪指数,先利用已标注的新闻数据训练情感分类模型从而生成类别概率,然后通过概率值计算得到情绪指数。为了进一步验证该方法的有效性,将生成的情绪指数结合股市历史价格数据来对上证股指波动趋势进行预测。结果表明,基于注意力机制的预测模型在添加情绪指数变量后,准确率提升了3%—5%,说明新闻情绪指数对于股指波动有较好的表征作用。
关键词
财经新闻
无
监督
文本
标注
情绪指数
注意力机制
Keywords
financial news
unsupervised text annotation
sentiment index
attention mechanism
分类号
F832.5 [经济管理—金融学]
下载PDF
职称材料
题名
基于有监督对比学习的航天信息获取与图像生成
7
作者
齐翌辰
赵伟超
机构
东北大学计算机科学与工程学院
中国科学院长春光学精密机械与物理研究所网络与信息化技术中心
出处
《液晶与显示》
CAS
CSCD
北大核心
2023年第11期1531-1541,共11页
文摘
为了提高获取开源航天信息的效率并解决开源航天信息内容较长、数量较为有限、应用常用文本分类模型鲁棒性较差以及文本信息不够直观等问题,本文提出一种基于有监督对比学习的航天信息分类方法。该方法基于带有注意力机制(Attention)的双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM),融合对比学习技术,对开源的信息进行处理并分析,进而高效地筛选出航天类的信息,利用unCLIP(un-Contrastive Language-Image Pre-Training)模型生成信息对应的图像。实验结果表明,对比CNN(Convolutional Neural Networks)、BiLSTM、Transformer和BiL⁃STM-Attention等常用的文本分类方法,该方法在准确率、召回率和F1-Score上均表现良好,其中F1-Score达到0.97,同时以图像的形式呈现信息,使信息更加清晰直观。本文方法可以充分使用网络公开的数据资源,有效地提取开源航天信息并生成对应图像,对航天信息的分析和研究具有重要价值。
关键词
有
监督
文本
分类
对比学习
文本
生成图像
航天信息
Keywords
supervised text classification
contrastive learning
text-to-image synthesis
aerospace information
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP751.1 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于句子级学习改进CNN的短文本分类方法
被引量:
12
8
作者
韩栋
王春华
肖敏
机构
黄淮学院信息工程学院
武汉理工大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2019年第1期256-260,284,共6页
基金
河南省科技厅科技计划基金项目(172102210117)
河南省驻马店市科技计划基金项目(17135)
文摘
为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型赋予较高权重,通过加权和构建文本模型。通过文本级CNN监督学习,实现文本分类。在两个评论数据集上的实验结果表明,提出方法具有较高的分类准确性。
关键词
短
文本
分类
卷积神经网络
主题句
句子级
监督
学习
文本
级
监督
学习
Keywords
short text classification
convolution neural network
subject sentence
sentence-level supervised learning
text-level supervised learning
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于差异性评估对Co-training文本分类算法的改进
被引量:
4
9
作者
唐焕玲
林正奎
鲁明羽
机构
大连海事大学信息科学技术学院
烟台职业学院计算机与信息工程系
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期138-143,共6页
基金
国家自然科学基金(No.60773084,J0724003,60603023)
教育部博士点基金(No.20070151009)
文摘
Co-training算法要求两个特征视图满足一致性和独立性假设,但是,许多实际应用中不存自然的划分且满足这种假设的两个视图,且直接评估两个视图的独立性有一定的难度.分析Co-training的理论假设,本文把寻找两个满足一致性和独立性特征视图的目标,转变成寻找两个既满足一定的正确性,又存在较大的差异性的两个基分类器的问题.首先利用特征评估函数建立多个特征视图,每个特征视图包含足够的信息训练生成一个基分类器,然后通过评估基分类器之间的差异性间接评估二者的独立性,选择两个满足一定的正确性和差异性比较大的基分类器协同训练.根据每个视图上采用的分类算法是否相同,提出了两种改进算法TV-SC和TV-DC.实验表明改进的TV-SC和TV-DC算法明显优于基于随机分割特征视图的Co-Rnd算法,而且TV-DC算法的分类效果要优于TV-SC算法.
关键词
半
监督
文本
分类
CO-TRAINING
特征视图
差异性评估
标注
文本
未标注
文本
Keywords
semi-supervised text categorization
Co-training
features views
diversity measures
labeled documents
unlabeled documents
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一个对不带类别标记文本进行分类的方法
被引量:
1
10
作者
蒋志方
祝翠玲
吴强
机构
山东大学计算机科学与技术学院
山东经济学院信息管理学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第12期96-98,共3页
文摘
利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确的分类结果。
关键词
文本
分类
无
监督
文本
聚类
朴素贝叶斯分类
欧氏距离
Keywords
Text classification
Unsupervised text clustering
Nai've Bayes classification
Euclid distance
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种利用近邻和信息熵的主动文本标注方法
被引量:
4
11
作者
朱岩
景丽萍
于剑
机构
北京交通大学计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2012年第6期1306-1312,共7页
基金
中央高校基金科研业务费专项资金项目(2009YJS026)
北京交通大学优秀博士生科技创新基金项目(141097522)
+2 种基金
国家自然科学基金项目(0905028
90820013
60875031)
文摘
由于大规模标注文本数据费时费力,利用少量标注样本和大量未标注样本的半监督文本分类发展迅速.在半监督文本分类中,少量标注样本主要用来初始化分类模型,其合理性将影响最终分类模型的性能.为了使标注样本尽可能吻合原始数据的分布,提出一种避开选择已标注样本的K近邻来抽取下一组候选标注样本的方法,使得分布在不同区域的样本有更多的标注机会.在此基础上,为了获得更多的类别信息,在候选标注样本中选择信息熵最大的样本作为最终的标注样本.真实文本数据上的实验表明了提出方法的有效性.
关键词
半
监督
文本
分类
主动学习
近邻
信息熵
标注方法
Keywords
semi-supervised text classification
active learning
nearest neighbor
informationentropy
labeling strategy
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
结合文本监督和多粒度特征的姿态情绪识别
邹卓华
李新德
胡川飞
徐建平
《指挥信息系统与技术》
2024
0
下载PDF
职称材料
2
基于混合神经网络模型的民生监督文本分类方法
龙华
华才健
王琦标
徐尽悦
《四川轻化工大学学报(自然科学版)》
CAS
2024
0
下载PDF
职称材料
3
标签语义增强的弱监督文本分类模型
林呈宇
王雷
薛聪
《计算机应用》
CSCD
北大核心
2023
2
下载PDF
职称材料
4
基于亮度分级和方向密度的无监督文本定位
刘琼
周慧灿
王耀南
《计算机应用》
CSCD
北大核心
2008
2
下载PDF
职称材料
5
半监督语义动态文本聚类算法
钱志森
黄瑞章
魏琴
秦永彬
陈艳平
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2019
1
下载PDF
职称材料
6
无监督的财经新闻情感标注和情绪指数生成
邵元海
何洋
吕孝敬
《海南大学学报(人文社会科学版)》
CSSCI
2023
1
下载PDF
职称材料
7
基于有监督对比学习的航天信息获取与图像生成
齐翌辰
赵伟超
《液晶与显示》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
8
基于句子级学习改进CNN的短文本分类方法
韩栋
王春华
肖敏
《计算机工程与设计》
北大核心
2019
12
下载PDF
职称材料
9
基于差异性评估对Co-training文本分类算法的改进
唐焕玲
林正奎
鲁明羽
《电子学报》
EI
CAS
CSCD
北大核心
2008
4
下载PDF
职称材料
10
一个对不带类别标记文本进行分类的方法
蒋志方
祝翠玲
吴强
《计算机工程》
CAS
CSCD
北大核心
2007
1
下载PDF
职称材料
11
一种利用近邻和信息熵的主动文本标注方法
朱岩
景丽萍
于剑
《计算机研究与发展》
EI
CSCD
北大核心
2012
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部