基于权利要求层级特征的专利相似度计算方法研究

Computing Patent Similarity Based on Hierarchical Feature of Claims

导出

摘要【目的】现有专利相似度计算方法对专利文本独有特征利用不足,并一定程度上忽视了专利内容与结构的特性,本文就上述问题提出一种新的专利相似度计算方法。【方法】通过权利要求层级特征生成技术组合句并进行信息核心度、信息丰富度的加权,兼顾技术内容范围与技术信息重点进行专利表示,在此基础上进行专利相似度计算。通过相关性指标与专利分类的对比实验证明方法的合理性。【结果】本文提出的方法较同类基准方法可以更充分地表达专利信息,更适用于专利相似度计算;技术组合句的重构对模型表现提升作用明显,在该基础上的信息核心度、信息丰富度的加权能进一步提高模型表现。【局限】仅在量子计算领域进行实验,技术领域是否会对方法表现造成影响仍待探究。【结论】权利要求树与技术组合句的信息组织形式能够提高专利文本的利用效率;基于专利权利要求层级特征的技术组合句与对应信息特征加权能够提升专利表示效果及其在相似度任务中的表现。 [Objective]This paper proposes a new model to compute patent similarity,which fully leverages the characteristics of patent texts and their structural and context features.[Methods]First,we used technical compound sentences,the weighting of information core degree,and information richness to represent patents.Then,we calculated patent-to-patent similarity with the representation.Finally,we conducted comparative experiments with correlation scores and patent classification.[Results]The proposed method outperformed benchmark methods in computing patent similarities.The technical compound sentences and weighting of information core degree and richness further improved the model’s performance.[Limitations]We only examined the model with quantum computing.[Conclusions]Using a claim tree and technical compound sentences to organize patent information can improve the efficiency of patent text processing.The weighting of information core degree and richness based on hierarchical features of patents can improve their representation and patent similarity computing tasks.

作者向姝璇操玉杰毛进 Xiang Shuxuan;Cao Yujie;Mao Jin(Laboratory of Data Intelligence and Interdisciplinary Innovation,Nanjing University,Nanjing 210023,China;School of Information Management,Central China Normal University,Wuhan 430074,China;School of Information Management,Wuhan University,Wuhan 430072,China;Center for Studies of Information Resources,Wuhan University,Wuhan 430072,China)

机构地区南京大学数据智能与交叉创新实验室华中师范大学信息管理学院武汉大学信息管理学院武汉大学信息资源研究中心

出处《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第2期33-43,共11页 Data Analysis and Knowledge Discovery

基金国家自然科学基金创新研究群体项目(项目编号:71921002) 湖湘高层次人才聚集计划项目(项目编号:2021RC5029)的研究成果之一。

关键词权利要求专利相似度权利要求层级 Patent Claims Patent Similarity Hierarchy of Claims

分类号 TP393 [自动化与计算机技术—计算机应用技术] G255 [文化科学—图书馆学]

引文网络
相关文献

参考文献11

1刘小玲,谭宗颖.基于专利多属性融合的技术主题划分方法研究[J].数据分析与知识发现,2022,6(2):45-54. 被引量：13
2寇园园,陈会英,徐华杰,刘凯.海外跨国公司在华人工智能专利布局及竞争态势研究[J].情报杂志,2022,41(9):48-54. 被引量：3
3吕学强,罗艺雄,李家全,游新冬.中文专利侵权检测研究综述[J].数据分析与知识发现,2021,5(3):60-68. 被引量：3
4俞琰,鞠鹏,尚明杰.基于信息增益与相似度的专利关键词抽取算法评价模型[J].图书情报工作,2022,66(6):108-117. 被引量：4
5高楠,彭鼎原,傅俊英,赵蕴华.基于专利IPC分类与文本信息的前沿技术演进分析——以人工智能领域为例[J].情报理论与实践,2020,43(4):123-129. 被引量：41
6俞琰,陈磊,姜金德,赵乃瑄.结合词向量和统计特征的专利相似度测量方法[J].数据分析与知识发现,2019,3(9):53-59. 被引量：11
7李睿,王堂蓉,龙瑞.专利引证与专利维持时间的相关性实证[J].情报杂志,2022,41(7):71-76. 被引量：8
8康旭东,邓乐乐,王宇开,杨中楷.基于全代引证的专利累积影响力评价——一个诺奖得主专利的案例研究[J].情报学报,2021,40(3):267-277. 被引量：12
9张杰,魏鹏涛,翟东升.基于权利要求分解和相似度排序的专利无效检索研究[J].情报理论与实践,2019,42(12):108-114. 被引量：2
10向姝璇,李睿.基于专利文献整体相似度计算的竞争对手发现——以5G领域为例[J].情报理论与实践,2021,44(5):100-105. 被引量：14

二级参考文献142

1钟春平,徐长生.技术(产品)替代、创造性破坏与周期性经济增长[J].经济学（季刊）,2005,4(4):865-890. 被引量：15
2罗鹏,魏浩.跨国公司国际研发的新趋势与发展中国家的对策[J].亚太经济,2006(6):97-100. 被引量：1
3肖国华,王春,姜禾,郭婕婷.专利分析评价指标体系的设计与构建[J].图书情报工作,2008,52(3):96-99. 被引量：57
4路炜,肖沪卫.专利侵权检索与分析报告的规范研究[J].图书情报工作,2008,52(2):73-76. 被引量：5
5刘玉琴,汪雪锋,吕琳.基于权利要求结构信息的中文专利无效检索模型[J].计算机应用研究,2008,25(7):2068-2070. 被引量：4
6杨中楷,梁永霞,刘则渊.USPTO中我国专利引用状况的统计分析[J].图书情报工作,2009,53(2):42-46. 被引量：21
7章成志,周冬敏.自动标引通用评价模型研究[J].情报学报,2009,28(1):40-47. 被引量：6
8汪雪锋,刘玉琴,刘佳.中文专利侵权检索模型研究[J].计算机工程与应用,2009,45(9):212-215. 被引量：6
9张忠平,赵海亮,张志惠.基于本体的概念相似度计算[J].计算机工程,2009,35(7):17-19. 被引量：30
10段异兵,孔妍.高影响力中国海外发明专利的引文分析[J].科学学研究,2009,27(5):678-681. 被引量：4

共引文献101

1卢彦池,卞艺杰.基于技术相似度和标杆分析的企业竞争对手及技术机会识别[J].知识管理论坛,2021(3):143-157. 被引量：1
2叶利春,王晨雨,袁琴,胡俊杰,郑国华,肖本大,廖新安,石召华.基于incopat专利数据库的艾专利分析[J].世界科学技术-中医药现代化,2023(6):1881-1894. 被引量：2
3张宗毅.农机“卡脖子”技术识别:综述与展望[J].农业农村部管理干部学院学报,2022(2):34-40.
4邓笛莎,陈涛.省域高校专利质量水平与高技术产业创新能力的耦合分析[J].科技促进发展,2022,18(6):758-766.
5刘贤莹.核能领域工业互联网平台技术专利态势浅析[J].电子技术应用,2024,50(S01):88-92.
6谢赛赛.语音识别专利技术综述[J].电声技术,2021,45(10):27-29.
7何欣,那英.跨学科交叉技术专利文献的筛选方法及其应用[J].北京服装学院学报（自然科学版）,2022,42(4):74-82. 被引量：1
8马建国,杨金山,赵静,赵秀云.综合物探在宾州浸出油厂找水的应用[J].黑龙江水利科技,2000,28(2):64-65.
9龙丽娜,刘晃.国内南极磷虾产业专利技术状况分析[J].农学学报,2020,10(9):66-71. 被引量：2
10李荣,刘静,李梦辉,罗梓超.基于基金项目数据的人工智能技术前沿性测度研究——技术创新决策视角分析[J].情报杂志,2020,39(9):81-87. 被引量：7

1魏雯婕,张更平.基于图神经网络的专利文本分类研究[J].竞争情报,2024,20(2):24-34.
2林珊玲,彭雪玲,王栋,林志贤,林坚普,郭太良.多尺度增强特征融合的钢表面缺陷目标检测[J].光学精密工程,2024,32(7):1075-1086. 被引量：1
3马吉康,范桂利,杨静文,张汉青,朱致远.基于专利分类系统的核心专利筛选和评价[J].涂层与防护,2024,45(3):51-55.
4黎啦啦,苏颖君,郑少金.基于绿色技术专利分类体系的专利信息分析——以二氧化碳捕集技术为例[J].中国发明与专利,2023,20(S01):23-32.
5唐恒,张星星,汪满容.基于内容理解与指标融合的高价值专利识别[J].情报杂志,2024,43(4):168-174.
6郭露,王峰.“增量”是否“提质”:数字经济对灵活就业质量的影响[J].财经科学,2024(3):118-133. 被引量：4

数据分析与知识发现

2024年第2期

浏览历史

内容加载中请稍等...

基于权利要求层级特征的专利相似度计算方法研究

参考文献11

二级参考文献142

共引文献101

相关作者

相关机构

相关主题

浏览历史