-
题名融合字位置特征的铁路事故命名实体识别
被引量:3
- 1
-
-
作者
陈业明
戴齐
刘捷
-
机构
西南交通大学计算机与人工智能学院
-
出处
《计算机系统应用》
2022年第12期211-219,共9页
-
基金
国家铁路集团有限公司科技研究开发重点课题(N2020S009)
-
文摘
铁路事故的相关信息以事故概况文本的形式存在,对于铁路安全工作有重要意义.但由于缺乏有效的信息抽取手段,导致分散在文本中的铁路事故知识没有得到充分的利用.命名实体识别是信息抽取的重要子任务,目前关于事故领域的命名实体识别问题研究较少.针对铁路事故命名实体识别问题,提出一种融合字位置特征的命名实体识别模型,该模型通过全连接神经网络获取字的位置特征,并与语义层面的字向量合并作为字的最终向量表示输入BiLSTM-CRF模型获取最优标签序列.实验结果表明,模型在铁路事故文本命名实体识别问题上的准确率、召回率和F1值分别为93.29%、94.77%和94.02%,相比于传统模型,取得了更好的效果,为铁路事故知识图谱的构建奠定基础.
-
关键词
命名实体识别
铁路事故
字位置特征
双向长短期记忆网络(BiLSTM)
条件随机场
知识图谱
自然语言处理
-
Keywords
named entity recognition
railway accident
character position features
bidirectional long short-term memory(BiLSTM)
conditional random field
knowledge graph
natural language processing(NLP)
-
分类号
U298.5
[交通运输工程—交通运输规划与管理]
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于字位置概率特征的条件随机场中文分词方法
被引量:5
- 2
-
-
作者
沈勤中
周国栋
朱巧明
孔芳
丁金涛
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《苏州大学学报(自然科学版)》
CAS
2008年第3期49-54,共6页
-
基金
"863"国家高技术研究发展计划项目(2006AA01Z147)
国家自然科学基金资助项目(60673041)
-
文摘
将分词看成是一个对汉字进行分类的过程,然后利用条件随机场(CRFs)模型对每个汉字进行标记,最后转换为相应的分词结果.在现有CRFs模型的基础上,从字的构词能力角度出发,探索了字位置概率特征,提出了基于字位置概率特征的条件随机场中文分词方法.实验表明,字位置概率特征的引入,使得结果F1值提高了3.5%,达到94.5%.
-
关键词
中文分词
条件随机场
字位置概率特征
-
Keywords
Chinese word segmentation
conditional random fields
character position probability feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-