-
题名基于BiLSTM-CRF的商情实体识别模型
被引量:39
- 1
-
-
作者
张应成
杨洋
蒋瑞
全兵
张利君
任晓雷
-
机构
四川大学计算机学院
四川省计算机研究院
成都瑞贝英特信息技术有限公司
四川智仟科技有限公司
中移(苏州)软件技术有限公司
四川黑马数码科技有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第5期308-314,共7页
-
基金
四川省科技计划项目(18PTDJ0085
2019YFH0075
+1 种基金
2018GZDZX0030)
泸州市科技计划项目(2017CDLZ-G25)
-
文摘
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。
-
关键词
条件随机场
双向长短时记忆网络
语言模型
命名实体识别
深度学习
-
Keywords
Conditional Random Field(CRF)
Bidirectional Long Short-Term Memory(BiLSTM) network
language model
Named Entity Recognition(NER)
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合词性的双注意力Bi-LSTM情感分析
被引量:13
- 2
-
-
作者
赵富
杨洋
蒋瑞
张利君
任晓雷
-
机构
四川大学计算机学院
四川省计算机研究院
成都瑞贝英特信息技术有限公司
四川智仟科技有限公司
四川黑马数码科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2018年第A02期103-106,147,共5页
-
文摘
针对大多数情感分析文本过短、提取文本特征不足的问题,提出一种融合词性的双注意力机制的双向长短期记忆网络模型(CWPAT-Bi-LSTM)。首先,区别于一般情感分析只用词作为特征,该模型也使用了字和单词的词性作为神经网络的输入来丰富文本的特征;然后,融合字、词和词性的深层语义表达;最后,使用注意力机制关注对情感分析有价值的部分,更好地把握文本的情感,提高情感分类的精度。实验结果表明,与未融合词性的模型(CWATBi-LSTM)相比,该模型在4个数据集上情感分类的准确率分别提高1. 35、1. 25、0. 93、1. 5个百分点,验证了所提方法能够有效提高情感分类的准确率。
-
关键词
情感分析
自然语言处理
字向量
词向量
词性
注意力机制
双向长短期记忆网络
-
Keywords
sentiment analysis
Natural Language Processing(NLP)
character embedding
word embedding
part-of-speech
attention mechanism
Bidirectional Long Short-Term Memory(Bi-LSTM)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-