期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多卷积核字词特征的中文短文本分类方法
1
作者 李攀 吴亚东 +2 位作者 褚琦凯 张贵宇 付朝帅 《四川轻化工大学学报(自然科学版)》 CAS 2023年第1期73-83,共11页
中文短文本存在字数少、歧义多以及信息不规范等特点,导致其文本特征信息难以提取与表达。目前大多数文本分类方法采用单卷积核的卷积神经网络来提取文本局部特征,这通常会由于网络参数随机初始化不一致而导致模型分类效果不佳。为此,... 中文短文本存在字数少、歧义多以及信息不规范等特点,导致其文本特征信息难以提取与表达。目前大多数文本分类方法采用单卷积核的卷积神经网络来提取文本局部特征,这通常会由于网络参数随机初始化不一致而导致模型分类效果不佳。为此,提出了一种基于多卷积核字词特征的短文本分类模型(Multi-CNNFusionofCharactersandWords,MCFCW)。首先采用预训练ERNIE、Word2vec模型丰富文本字词嵌入表示;然后分别采用多卷积核TextCNN、DPCNN充分提取不同角度的文本语义信息,同时有效降低网络参数随机初始化的影响;最后拼接两个通道提取到的字词高层特征向量作为最终的文本分类特征。在THUCNews新闻标题数据集上进行了模型评估。结果表明,模型在精准率、召回率和F1值3种评价指标上均优于目前的主流模型,具有较好的短文本分类效果。 展开更多
关键词 中文短文本分类 ERNIE Word2vec 多卷积核字词特征 卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部