基于词性和语序分析的法律知识图谱自动构建方法

Automatic Construction Method of Legal Knowledge Graph Based on Part of Speech and Word Order Analysis

下载PDF

导出

摘要文章挖掘法律文本中的实体和关系,构建法律知识图谱,为实现智能判案提供支持,完善法律知识图谱的构建方法。应用基于LexNLP的自然语言处理方法,分析法律文本,以句子为单位进行词性分析,标注出名词且为主语或宾语时作为实体,动词且为谓语时标注为关系。在这一基础上,将同一个句子中的实体和关系按照<实体1,关系,实体2>进行排列组合,生成不重复的知识三元组,以生成高质量的法律知识图谱。提出了一种基于词性和语序分析的法律知识图谱自动构建方法,并基于美国Caselaw Access Project项目所含的法律判例为原始数据,并对生成三元组进行质量评估,最后生成了关于法律的知识图谱。 The paper constructed a legal Knowledge Graph through mining the entities and their relationships in the legal text,aiming to facilitate intelligent judgment and enhance the methodology of legal Knowledge Graph construction.This paper employs Natural Language Processing techniques rooted in LexNLP,analyzes the legal texts,and conducts sentence-level partof-speech analysis,wherein nouns functioning as subjects or objects are labeled as entities,while verbs serving as predicates are labeled as relationships.Based on this framework,the entities and relationships within each sentence are permuted and combined according to the format<entity 1,relationship,entity 2>,resulting in the generation of non-repetitive knowledge triplets so as to generate a high-caliber legal knowledge graph.The paper proposes an automated construction approach for the legal Knowledge Graph based on part-of-speech and word order analyses,takes the legal precedents contained in the Caselaw Access Project in the US as the raw data,and assesses the quality of the generated triplets and presents a legal Knowledge Graph.

作者唐明伟赵煌涛李文雯 TANG Mingwei;ZHAO Huangtao;LI Wenwen(School of Computer Science,Nanjing Audit University,Nanjing 211815,China)

机构地区南京审计大学计算机学院

出处《现代信息科技》 2024年第22期85-91,共7页 Modern Information Technology

基金教育部人文社会科学研究规划基金项目(23YJA870009) 江苏省高校哲学社会科学研究重大项目(2021SJZDA153) 江苏高校“青蓝工程”项目。

关键词知识图谱构建实体识别关系抽取自然语言处理 construction of Knowledge Graph entity recognition relation extraction Natural Language Processing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献23

1帅奕男.人工智能辅助司法裁判的现实可能与必要限度[J].山东大学学报（哲学社会科学版）,2020(4):101-110. 被引量：24
2杨波,杨美芳.知识图谱研究综述及其在风险管理领域应用[J].小型微型计算机系统,2021,42(8):1610-1618. 被引量：18
3王思宇,邱江涛,洪川洋,江岭.基于知识图谱的在线商品问答研究[J].中文信息学报,2020,34(11):104-112. 被引量：12
4武家伟,孙艳春.融合知识图谱和深度学习方法的问诊推荐系统[J].计算机科学与探索,2021,15(8):1432-1440. 被引量：15
5陶天一,王清钦,付聿炜,熊贇,俞枫,苑博.基于知识图谱的金融新闻个性化推荐算法[J].计算机工程,2021,47(6):98-103. 被引量：20
6王宁,刘玮,兰剑.基于法院判决文书的法律知识图谱构建和补全[J].郑州大学学报（理学版）,2021,53(3):23-29. 被引量：4
7周琦,陆叶,李婷玉,王亚,张再跃,曹存根.基于语义文法的地理实体位置关系的获取[J].计算机科学,2016,43(7):208-216. 被引量：4
8李艳燕,张香玲,李新,杜静.面向智慧教育的学科知识图谱构建与创新应用[J].电化教育研究,2019,40(8):60-69. 被引量：95
9袁琦,刘渊,谢振平,陆菁.宠物知识图谱的半自动化构建方法[J].计算机应用研究,2020,37(1):178-182. 被引量：8
10洪文兴,胡志强,翁洋,张恒,王竹,郭志新.面向司法案件的案情知识图谱自动构建[J].中文信息学报,2020,34(1):34-44. 被引量：27

二级参考文献310

1李菁,黄仁彦,徐鸿飞.基于知识图谱的高校数字档案资源数据知识化实现[J].兰台内外,2019(35):3-5. 被引量：3
2朱琳,赵英伟,刘黎明.我国草地旅游资源及其合理开发保护[J].商业研究,2004(14):169-172. 被引量：15
3鲁川,缑瑞隆,董丽萍.现代汉语基本句模[J].世界汉语教学,2000,14(4):11-24. 被引量：28
4赵红洲,蒋国华.知识单元与指数规律[J].科学学与科学技术管理,1984,5(9):39-41. 被引量：62
5朱康辛,杨宇航,诸鸿文.远程医疗系统结构模型研究[J].计算机工程,1997,23(S1):126-128. 被引量：6
6陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253. 被引量：7514
7郝晓兰.内蒙古草原生态旅游开发模式研究[J].干旱区资源与环境,2004,18(6):112-117. 被引量：29
8黄茂军,杜清运,杜晓初.地理本体空间特征的形式化表达机制研究[J].武汉大学学报（信息科学版）,2005,30(4):337-340. 被引量：28
9陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154. 被引量：825
10刘林青.作品共被引分析与科学地图的绘制[J].科学学研究,2005,23(2):155-159. 被引量：57

共引文献8791

1吴源.基于文献计量的国内产教融合研究综述[J].职业技术,2022,21(1):62-69. 被引量：4
2饶斌,谢勇旗.近20年我国职业院校教师培训研究可视化分析——研究现状、热点主题与前沿趋势[J].教育科学论坛,2024(15):64-71. 被引量：1
3刘琪.高质量职业教育的研究现状与热点分析——基于Cite Space的可视化分析[J].教育科学论坛,2022(27):78-80.
4张秦,陈铁.基于CiteSpace的我国高职院校在线课程研究热点与趋势的知识图谱分析[J].教育科学论坛,2021(24):76-80. 被引量：3
5肖越,吴吉惠.近十年我国幼儿园课程研究的热点与发展趋势——基于Cite Space的可视化分析[J].教育科学论坛,2020(28):36-38. 被引量：4
6王小璇,焦楠,袁娜,吴越,翟双庆.《中医教育》近25年载文的热点分析[J].中医教育,2020,39(3):42-46. 被引量：1
7严加红.干部教育培训研究热点及其发展趋势知识图谱研究——基于CSSCI数据库(1998-2021年)可视化分析[J].中国延安干部学院学报,2022,15(4):128-136. 被引量：1
8田阡,唐欢.明清以来中国南方汉族移民研究的知识图谱分析[J].中央民族大学学报（哲学社会科学版）,2020,47(1):99-109. 被引量：1
9吕君,栾慧.习近平思想政治理论课重要论述研究的文献计量分析[J].中学政治教学参考,2021(44):10-11.
10代瑞玲,王焕霞,仇立岗,井玉潇.我国中学数学核心素养的知识图谱:热点、现状与趋势分析——基于CiteSpace的分析[J].中学数学杂志,2023(5):1-5. 被引量：1

1吴乐舟,钱晓龙,张迪.基于因果模型的破碎机故障树自动构建方法[J].控制工程,2024,31(10):1905-1912.
2公确多杰,索南才让.基于卷积神经网络的藏语情感词典自动构建方法[J].高原科学研究,2024,8(3):117-124.
3曾祥鑫.人工智能的司法应用困境及完善路径[J].争议解决,2024,10(9):8-15.
4孙婷婷.基于区块链技术的“时间银行”互助养老模式研究[J].热带农业工程,2024,48(5):144-147.
5程琳,张宏杰.人工智能时代网络意识形态建设的机遇、挑战与路径[J].邢台学院学报,2024,39(4):71-78.
6苏亮广,肖丽娜.水工环地质勘查在绿色矿山开采中的重要性探讨[J].中国金属通报,2024(18):35-37.
7赵超,于浩,刘健.“双减”政策背景下上门体育培训的兴起动因、面临挑战与未来展望[J].武汉体育学院学报,2024,58(11):82-88.
8李保川.城市化进程下水土保持监管问题及策略研究[J].水上安全,2024(22):61-63.
9张静.山东省发展蓝碳经济的现实困境及突破路径研究[J].产业创新研究,2024(21):20-22.
10杨金锟,张世光.强化行政诉讼监督精准做深做实检察为民——张某申请工伤认定检察监督再审改判案分析[J].人民检察,2024(18):34-36.

现代信息科技

2024年第22期

浏览历史

内容加载中请稍等...

基于词性和语序分析的法律知识图谱自动构建方法

参考文献23

二级参考文献310

共引文献8791

相关作者

相关机构

相关主题

浏览历史