-
题名基于BERT的中文新闻标题分类
被引量:8
- 1
-
-
作者
苗将
张仰森
李剑龙
-
机构
北京信息科技大学智能信息处理研究所
-
出处
《计算机工程与设计》
北大核心
2022年第8期2311-2316,共6页
-
基金
国家自然科学基金项目(61772081)
科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室基金项目(PXM2018_014224_000010)
北京市自然科学基金项目(4204100)。
-
文摘
为解决海量新闻标题分类任务准确率低的问题,提出了一种基于BERT的中文新闻标题分类算法。使用BERT预训练的词向量作为嵌入层,根据输入文本进一步优化词向量,使用单向GRU网络提取主要的文本特征,连接注意力机制,对特征加权求和来调整权重比例,连接单向LSTM网络提取上下文特征,进行分类。实验结果表明,BGAL模型在进行中文新闻标题分类任务时,可以有效兼顾分类精度和运算效率,在处理THUCNews数据集时,达到了94.78%的准确度,比BERT_RNN高出1.07%。
-
关键词
中文短文本分类
自然语言处理
深度学习
神经网络
可变的双向编码器
-
Keywords
Chinese short text classification
natural language processing
deep learning
neural network
BERT
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-