-
题名融合多特征的骨签释文实体识别
- 1
-
-
作者
石雨梦
王慧琴
王展
刘瑞
王可
-
机构
西安建筑科技大学信息与控制工程学院
陕西省文物保护研究院
中国社会科学院考古研究所
-
出处
《计算机系统应用》
2024年第9期38-47,共10页
-
基金
国家社科基金冷门绝学研究专项(20VJXT001)。
-
文摘
构建适用于汉长安城骨签释文的命名实体识别模型,用来解决由于汉长安城骨签释文关键内容缺失,而导致无法对部分骨签释文进行分类的问题.本文将汉长安城骨签释文原始文本作为数据集,采用BIOE(begin,inside,outside,end)标注方法对释文实体进行数据标注,并提出融合字结构特征、字词结构特征的多特征融合网络模型(multi-feature fusion network,MFFN).该模型不仅考虑了单个字符的结构特征,还融合了字与词的结构特征,以增强模型对骨签释文的理解能力.实验结果表明,MFFN模型能够更好地识别汉长安城骨签释文的命名实体,实现骨签释文分类,优于现有NER模型,为历史学家和研究人员提供更加丰富和准确的数据支持.
-
关键词
骨签
实体识别
BIOE标注方法
多特征融合
释文分类
-
Keywords
bone-sign
entity recognition
BIOE annotation method
multiple features fusion
classification of interpretation
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-