一种自动构建数据集的实体关系抽取方法被引量：2

An Entity Relation Extraction Method based on Automatic Data Set Construction

下载PDF

导出

摘要近年来,知识图谱领域中实体关系抽取技术得到快速发展,其准确性也大幅提升。然而,大部分文献都没有提供能够反映其内容的、直观的数据结构。依靠人工阅读文本产生实体、关系的方法,在多源、海量文档数据的今天越来越不能满足实际应用的需求,因此提出一种抽取文本中实体关系的方法。该方法基于哈工大语言技术平台(Language Technology Plantform,LTP)和双向编码器(Bidirectional Encoder Representations from Transformer,BERT)模型,可对文本内容实现自动化解析,解决了数据集生成难的问题。此外,通过对BERT模型的优化调整,解决了以往实体关系的抽取需依赖大量资源计算的问题。 In recent years, entity relation extraction technology in the field of knowledge graphs has developed rapidly, the accuracy has been greatly improved. However, most of the documents do not provide intuitive data structure that can reflect their content. Relying on manual reading of text to generate entities and relations, in today’s multi-source and massive document data, it is increasingly unable to meet the needs of practical applications. Therefore, a scheme for extracting entity relations in texts is proposed. The scheme is based on LTP(Language Technology Plantform) of Harbin industrial university and BERT(Bidirectional Encoder Representations from Transformer) model. This scheme can automatically parse the text context automatically and solve the problem of generating training and test data set effectively. In addition, through the optimization and adjustment of the BERT model, the problem that the extraction of entity relations in the past have to rely on a large number of resource calculations is solved.

作者房冬丽陈正雄黄元稳衡宇峰 FANG Dongli;CHEN Zhengxiong;HUANG Yuanwen;HENG Yufeng(No.30 Institute of CETC,Chengdu Sichuan 610000,China)

机构地区中国电子科技集团公司第三十研究所

出处《通信技术》 2021年第8期1862-1868,共7页 Communications Technology

关键词实体关系抽取语言技术平台(LTP) 双向编码器(BERT) entity relationship extract LTP BERT

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1朱姗.基于规则和本体的实体关系抽取系统研究[J].情报杂志,2010,29(B12):142-143. 被引量：3
2张海楠,伍大勇,刘悦,程学旗.基于深度神经网络的中文命名实体识别[J].中文信息学报,2017,31(4):28-35. 被引量：76
3李建,靖富营,刘军.基于改进BERT算法的专利实体抽取研究——以石墨烯为例[J].电子科技大学学报,2020,49(6):883-890. 被引量：12

二级参考文献14

1陈康,武港山.基于Ontology的信息检索技术研究[J].中文信息学报,2005,19(2):51-57. 被引量：29
2L I Zhanjun, Ramani K. Ontology-based Design Information Extnnction and Retrieval[J]. Artificial Intelligence for Engineering Design, Analysis and Manufacturing ,2007 ( 2 ) : 137 - 154.
3GATE. Developing Language Processing Components with GATFZ Version 5 ( a User Guide ) [ EB/OL]. 2009 - 11. http ://gate. ae. uk/.
4Protege. user docutnentation [ EB/OL]. http ://protegc. stanford. edu/.
5ICTCLAS. ICTCLAS[ GP]. http://ictelas, org/index, htmt.
6ACE. ACE (Automatic Content Extraction) English Annotation Guidelines for Relations[ EB/OL]. http ://www. itl. hist. gov/iad/ mig/tests/ace/.
7车万翔,刘挺,李生.实体关系自动抽取[A].第一届全国内容安全与信息检索学术会议[C].上海,2004.
8赵军.命名实体识别、排歧和跨语言关联[J].中文信息学报,2009,23(2):3-17. 被引量：51
9姜彩红,乔晓东,朱礼军.基于本体的专利摘要知识抽取[J].现代图书情报技术,2009(2):23-28. 被引量：15
10周俏丽,蔡东风,张桂平.面向英文专利文本单语模板的自动抽取方法[J].沈阳航空工业学院学报,2010,27(4):37-40. 被引量：1

共引文献88

1步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
2成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
3段文昱,朱继召,赵浩楠,黄友澎,范纯龙.面向武器装备领域的实体及关系抽取方法研究[J].中国电子科学研究院学报,2022,17(12):1165-1172. 被引量：2
4王卫红,冯倩,吕红燕,曹玉辉.基于Seq2Seq模型的命名实体识别方法[J].智能计算机与应用,2020(7):141-146.
5刘重来.论卢作孚“乡村现代化”思想[J].西南师范大学学报（人文社会科学版）,2000,26(2):134-139. 被引量：6
6高巍,万廷彬.甜菜碱对商品产蛋鸡生产性能的影响[J].中国禽业导刊,2000,17(6):16-17. 被引量：1
7王路路,艾山.吾买尔,买合木提.买买提,卡哈尔江.阿比的热西提,吐尔根.依布拉音.基于CRF和半监督学习的维吾尔文命名实体识别[J].中文信息学报,2018,32(11):16-26. 被引量：13
8帕丽旦.木合塔尔,吾守尔.斯拉木,买买提阿依甫.基于混合模型的维吾尔文词性标注方法[J].计算机仿真,2019,36(1):268-273. 被引量：6
9李勇.基于维基百科的本体构建研究[J].现代计算机（中旬刊）,2015(4):53-57.
10孙安,于英香,罗永刚,王祺.序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例[J].图书情报工作,2018,62(11):103-111. 被引量：9

同被引文献21

1赵浩宇,周琳,罗浩,汪鹏.大数据平台对医院数据抽取方案的研究与应用[J].中国数字医学,2021,16(10):108-112. 被引量：4
2常丽君,钱钢.面向不规则列表的网页数据抽取技术的研究[J].计算机应用研究,2015,32(9):2651-2654. 被引量：1
3仇岗,杨琴.Web数据抽取技术的研究和探讨[J].电子世界,2015(13):36-37. 被引量：1
4朱亚琼,罗伟,高峰雁.数字化校园建设中数据抽取技术研究[J].河南财政税务高等专科学校学报,2015,29(6):91-92. 被引量：2
5陈雅迪,张雪蕾,李娟.面向机构知识库的课程信息元数据抽取系统设计与实现[J].情报探索,2017(7):78-83. 被引量：1
6刘赛,聂庆节,刘军,刘嘉华,姜建飞,付晨.一种关系数据库数据抽取模型研究[J].电子设计工程,2018,26(6):16-21. 被引量：4
7秦彦霞,张民,郑德权.神经网络事件抽取技术综述[J].智能计算机与应用,2018,8(3):1-5. 被引量：17
8张琦.基于.Net技术实现Excel数据抽取及批量入库[J].电脑编程技巧与维护,2018(9):85-88. 被引量：3
9陈巧,丁卫泽,施佺.基于云计算面向网络舆情的Deep Web数据抽取关键技术研究[J].电脑知识与技术,2016,12(5X):23-25. 被引量：1
10陈健鹏,马建辉,王怡君.基于多轮交互的人机对话系统综述[J].南京信息工程大学学报（自然科学版）,2019,11(3):256-268. 被引量：14

引证文献2

1张志强,王伟钧,张修军,施达.一种新闻类WORD格式文件数据抽取算法研究[J].成都大学学报（自然科学版）,2022,41(2):151-156.
2李旭,李玉玺,刘田甜.基于预训练模型Bert的校园领域内智能问答助手[J].电脑编程技巧与维护,2023(5):97-99.

1王洪波.多维度融合创新,助推机器人产业加速发展[J].机器人产业,2021(4):40-44.
2吕远萍.体验,让语文学习真正发生[J].小学教学参考,2021(22):23-24. 被引量：2
3张金川,陈世敬,李中明,郎岳,王春艳,王东升,李振,唐玄,刘飏,李沛,仝忠正.页岩气资源智能评价[J].油气藏评价与开发,2021,11(4):476-486. 被引量：6
4关正昊,唐国维.基于云存储技术的数据库密文验证式检索研究[J].微型电脑应用,2021,37(8):143-146. 被引量：2
5刘永红.仪式写本与民俗生活——平地瑶《富川婚俗诗》研究之一[J].贺州学院学报,2021,37(2):26-31. 被引量：1

通信技术

2021年第8期

浏览历史

内容加载中请稍等...

一种自动构建数据集的实体关系抽取方法被引量：2

参考文献3

二级参考文献14

共引文献88

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种自动构建数据集的实体关系抽取方法 被引量：2

参考文献3

二级参考文献14

共引文献88

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

一种自动构建数据集的实体关系抽取方法被引量：2