-
题名ERNIE-CNN文本分类模型
被引量:4
- 1
-
-
作者
齐佳琪
迟呈英
战学刚
-
机构
辽宁科技大学计算机与软件工程学院
-
出处
《辽宁科技大学学报》
CAS
2021年第1期56-61,共6页
-
基金
国家自然科学基金(61672138)。
-
文摘
基于word2vec和BERT词向量技术的方法在文本分类分词过程中存在着错误传播问题,提出了融合ERNIE词向量技术的卷积神经网络模型。针对中文文本,运用ERNIE实体掩码的方式捕获词汇和语义信息,使用卷积神经网络进行特征提取。在THUCNews开源数据集上,准确率达到93.95%,比Word2Vec-CNN高出3.4%,BERT-CNN高出3.07%。实验结果证明了本文模型在缓解错误传播问题的有效性。
-
关键词
文本分类
ERNIE
词向量
卷积神经网络
-
Keywords
text classification
ERNIE
word vector
convolution neural network
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于ERNIE-DPCNN的短文本分类研究
被引量:1
- 2
-
-
作者
齐佳琪
迟呈英
战学刚
-
机构
辽宁科技大学计算机与软件工程学院
-
出处
《电脑编程技巧与维护》
2021年第4期26-27,81,共3页
-
基金
国家自然科学基金(61672138)。
-
文摘
目前采用短文本分类的方法几乎都使用词向量,不管是机器学习还是深度学习本质上都是对数字的处理。将文本汉字转换成计算机可识别的数字信息是词向量的作用。ERNIE是百度提出主要针对中文设计的词向量模型。将ERNIE词向量与深金字塔卷积神经网络相融合,对中文类新闻文本标题进行文本分类处理。通过实验比较,ERNIE词向量与深金字塔卷积神经网络相结合的短文本分类模型具有较高的分类精度。
-
关键词
短文本分类
深度学习
ERNIE词向量
深金字塔卷积神经网络
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
-