-
题名基于胶囊网络的多标签罪名预测
- 1
-
-
作者
王之原
张琛
胡叮叮
-
机构
甘肃政法大学网络空间安全学院
-
出处
《计算机仿真》
2024年第1期457-461,517,共6页
-
基金
2022省级产业支撑项目(2022CYZC-57)
甘肃政法大学2020年校级教改项目(GZJG2020-B06)
+3 种基金
甘肃省教育厅高等学校科研项目(2015A-114)
甘肃省教育厅青年博士基金项目(2022QB-132)
甘肃省软科学项目(20CX4ZA074)
甘肃省2020年省级虚拟仿真一流课程(GZYL2020-18)。
-
文摘
针对罪名预测任务中存在的数据不平衡,罪名预测效果不理想的问题,提出了基于胶囊网络的多标签罪名预测模型。使用双向门控循环神经网络与卷积神经网络的并行混合模型提取胶囊网络的初始特征,即提取数据的时序特征和语义特征,提高胶囊网络提取初始特征的能力,然后使用动态路由进行迭代运算提取深层次的空间的信息;在损失函数中引入权值信息,解决因数据不平衡而导致的低频数据训练不足的问题。仿真结果表明,相比其它经典深度学习模型,上述模型有较好的罪名预测效果,能够解决数据不平衡与罪名预测效果不理想的问题。
-
关键词
罪名预测
数据不平衡
胶囊网络
权重信息
低频数据
-
Keywords
Accusation prediction
Data imbalance
Capsule network
Weight information
Low frequency data
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于预训练模型的命名实体识别研究
被引量:1
- 2
-
-
作者
胡叮叮
张琛
王之原
-
机构
甘肃政法大学
-
出处
《现代信息科技》
2023年第15期78-82,共5页
-
基金
甘肃省软科学项目(20CX4ZA074)
甘肃省2020年省级虚拟仿真一流课程(GZYL2020-18)。
-
文摘
目前中文命名实体识别存在的主要的问题有:实体的边界模糊,实体边界和非实体之间也存在边界模糊问题,并且在小数据集下模型识别效果不明显。为了解决以上问题,通过加强对文本上下文语义特征的提取能力,使模型能够根据上下文语义特征来精准地推测出实体,提出一种BERT_Bi LSTM_CRF的模型,BERT可以根据文本上下文信息,使每个词在文本语义中对应一个低纬的稠密的词向量,Bi LSTM可以捕获时序特征,并且使用CRF来对输出标签的顺序进行约束。经实验表明,使用预训练模型获取的动态词向量比随机初始化的词嵌入有显著提高。
-
关键词
预训练模型
命名实体识别
动态词向量
BiLSTM
CRF
-
Keywords
pre-training model
named entity recognition
dynamic word vector
BiLSTM
CRF
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-