期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于BERT的阅读理解式标书文本信息抽取方法 被引量:3
1
作者 涂飞明 刘茂福 +1 位作者 夏旭 张耀峰 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2022年第3期311-316,共6页
针对标书文本重要信息的抽取需求,提出一种基于BERT(bidirectional encoder representations from transformers)的阅读理解式标书文本信息抽取方法。该方法将信息抽取任务转换为阅读理解任务,根据标书文本内容,生成对应问题,再抽取标... 针对标书文本重要信息的抽取需求,提出一种基于BERT(bidirectional encoder representations from transformers)的阅读理解式标书文本信息抽取方法。该方法将信息抽取任务转换为阅读理解任务,根据标书文本内容,生成对应问题,再抽取标书文本片段作为问题答案。利用BERT预训练模型,得到强健的语言模型,获取更深层次的上下文关联。相比传统的命名实体识别方法,基于阅读理解的信息抽取方法能够很好地同时处理非嵌套实体和嵌套实体的抽取,也能充分利用问题所包含的先验语义信息,区分出具有相似属性的信息。从中国政府采购网下载标书文本数据进行了实验,本文方法总体EM(exact match)值达到92.41%,F1值达到95.03%。实验结果表明本文提出的方法对标书文本的信息抽取是有效的。 展开更多
关键词 标书文本 阅读理解 信息抽取 BERT(bidirectional encoder representations from transformers)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部