-
题名基于改进ERNIE模型的中文文本分类方法
被引量:4
- 1
-
-
作者
邢照野
刘晓群
-
机构
河北省建筑工程学院
-
出处
《信息与电脑》
2021年第8期87-89,共3页
-
基金
基于5G的VR场景下冰雪突发事故高精度定位技术研究(项目编号:20470302D)。
-
文摘
针对中文语言的特点及大多数深度学习模型的预处理容易忽略上下文的语义,笔者提出基于改进ERNIE模型的中文文本分类方法。该方法首先利用知识增强的语义表示预训练模型生成基于上下文信息的词向量,然后通过卷积神经网络和长短期记忆网络对训练后的词向量进一步提取特征信息,最后使用softmax分类器进行分类。实验结果表明,该方法相较于CNN(Convolutional Neural Networks)、BiLSTM等分类模型的效果更好,有效提高了中文文本分类性能。
-
关键词
文本分类
长短期网络
卷积神经网络
-
Keywords
text classification
long-term short-term network
convolutional neural network
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习的文本自动归类系统算法研究
- 2
-
-
作者
邢照野
刘晓群
刘雅军
孙佩杰
-
机构
河北省建筑工程学院
不详
-
出处
《新一代信息技术》
2021年第12期24-31,共8页
-
基金
基于5G的VR场景下冰雪突发事故高精度定位技术研究(项目编号:20470302D)。
-
文摘
本文设计并实现了一个基于机器学习算法的文本自动分类系统,研究首先介绍了文本的自动分类技术,并对预处理、中文分词、文本特征提取,模型的训练和分类四个模块做出介绍。通过探究分类器自身参数和SVM核函数的选择对分类效果的影响,并在此基础上进行改进,最终设计出了较好的中文文本分类模型。
-
关键词
SVM
机器学习
文本分类
核函数
-
Keywords
SVM
machine learning
text classification
kernel function
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-