基于专利文件知识结构的中文专利知识单元挖掘被引量：6

Chinese Patent Knowledge Unit Mining Based on Patent Document Knowledge Structure

下载PDF

导出

摘要文章从知识单元的角度,提出了一个基于专利文件知识结构的知识单元挖掘方法,并结合最大字符串匹配算法、停用词去除、词性标注预处理等自然语言处理手段,以及知识单元的位置权重,用程序实现了基于知识单元的中文专利知识挖掘。通过对比试验表明,这是一种有效分析专利文件技术细节的方法。 From the perspective of knowledge unit, this paper proposes a knowledge unit mining method based on patent document knowledge structure. And integrating with the natural language processing methods such as the Maximally Repeated String Algorithm, stop-word dismissal and POS tagging, and the weight of the position of knowl- edge unit, the paper uses the program to implement the Chinese patent knowledge mining based on knowledge uniL The contrast test shows that it is an effective method to analyze the technical details of patent documents.

作者高继平丁堃

机构地区大连理工大学

出处《情报理论与实践》 CSSCI 北大核心 2011年第6期83-86,共4页 Information Studies:Theory & Application

基金国家社会科学基金项目"学科知识测度体系及其应用研究"的成果之一项目编号:08BTQ025

关键词专利文献知识单元知识结构知识挖掘 patent document knowledge unit knowledge structure knowledge mining

分类号 G353 [文化科学—情报学]

引文网络
相关文献

参考文献13

1TSENG Y H, LIN C J, LIN Y I. Text mining techniques for patent analysis [ J ]. Information Processing and Management, 2007, 43 (5): 1216-1247.
2YOON B, PHAAL R, PROBERT D. Morphology analysis for technology madmapping: application of text mining [ J ]. R and D Management, 2008, 38 (1) : 51.
3BASSECOULARD E, ZITT M. Patents and publications [ M]. MODE H F, GLANZEL W, SCHMOCH U (Eds) . Handbook of Quantitative Science and Technology Research. [ S. l. ]: Springer, 2004 : 665-694.
4CHEN C, et al. The structure and dynamics of cocitation clus- ters: a multiple-perspective cocitation analysis [J]. Journal of The American Society for Information Science and Technology, 2010, 61 (7): 1386-1409.
5赵红州,唐敬年,蒋国华,郑文艺.物理定律的知识熵表示问题[J].自然辩证法研究,1991,7(8):14-22. 被引量：8
6刘则渊.知识图谱的若干问题思考[R].大连:大连理工大学,2010.
7徐如镜.开发知识资源发展知识产业服务知识经济[J].现代图书情报技术,2002(S1):4-6. 被引量：18
8温有奎,张卓奎,焦玉英.知识信息谱的分析与提取[J].情报学报,2008,27(5):677-682. 被引量：6
9徐文海,温有奎.一种基于TFIDF方法的中文关键词抽取算法[J].情报理论与实践,2008,31(2):298-302. 被引量：65
10王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量：40

二级参考文献40

1李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
2王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量：40
3温有奎 ,温浩 ,徐端颐 ,潘龙法 .基于创新点的知识元挖掘[J].情报学报,2005,24(6):663-668. 被引量：37
4索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
5刘佳宾,陈超,邵正荣,吉翔华.基于机器学习的科技文摘关键词自动提取方法[J].计算机工程与应用,2007,43(14):170-172. 被引量：15
6Gilchrist, A. D. Classification and thesauri [ A ]. In: Vickery, B. (ed.). Fifty Years of Information Progress: a Journal of Documentation Review [C]. London: ASLIB. 1994. 85- 118.
7Foskett, D.J. Thesaurus [A]. In:A. Kent, H. Lancours, and J.E. Daily (Eds.) Encyclopedia of Library and Informarion Science[C], NY: Marcel Dekker. 1980. Vol.30, 416 - 462.
8张琪玉.当代中国的分类法与主题词表[A]..张琪玉情报语言学文集[c].北京:北京图书馆出版社,1999.211-229.
9Shiri, A. A.. Thesauri on the Web: current developments and trends [J], Online Information Review, 2000, 24(4):273 - 279.
10Schütze, et al. A cooccurrence - based thesaurus and two applications to information retrieval [J], Info. Processing and Management: an Int. J, 2000, 33(3):307- 318.

共引文献131

1孙星恺,王晓,陆浩.面向活动的网络媒体监测与建模分析:IVFC案例解析[J].智能科学与技术学报,2019,1(4):352-368. 被引量：1
2聂卉.结合词向量和词图算法的用户兴趣建模研究[J].数据分析与知识发现,2019,3(12):30-40. 被引量：8
3曾金,张耀峰,黄新杰,黄廷海.面向用户评论的主题挖掘研究——以美团为例[J].情报科学,2022,40(11):78-84. 被引量：7
4XIA Lixin,BAI Yang,ZHANG Xinyi.Integration and reconstruction: A new development pattern of the smart library[J].Journal of Library Science in China,2018(1):37-57.
5高岚.加强我国医学信息资源建设的若干思考[J].现代图书情报技术,2002(S1):10-12.
6解世雄.从熵概念的发展看科学概念的功能[J].科学技术与辩证法,1993,10(2):48-52. 被引量：3
7侯筱婷,苏变萍,鲁萍.建设法规政策知识库智能化查询分析与设计[J].微电子学与计算机,2006,23(6):176-177. 被引量：4
8索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
9王灿辉,张敏,马少平,黄宇.基于相邻词的中文关键词自动抽取[J].广西师范大学学报（自然科学版）,2007,25(2):161-164. 被引量：10
10廖浩,李志蜀,王秋野,张意.基于词语关联的文本特征词提取方法[J].计算机应用,2007,27(12):3009-3012. 被引量：10

同被引文献108

1赵红州,唐敬年,蒋国华,郑文艺.物理定律的知识熵表示问题[J].自然辩证法研究,1991,7(8):14-22. 被引量：8
2梁立明,赵红州.物理定律静智荷值分布规律的分维表征[J].自然辩证法研究,1991,7(11):53-54. 被引量：2
3赵红州,唐敬年,蒋国华,郑文艺.知识单元的动荷值确定方法[J].科学学与科学技术管理,1990,11(9):11-17. 被引量：3
4赵红洲,蒋国华.知识单元与指数规律[J].科学学与科学技术管理,1984,5(9):39-41. 被引量：62
5唐琳.从硕士、博士学位论文看北京大学人文地理学研究热点和发展趋势[J].图书情报工作,2013,57(S2):218-223. 被引量：3
6刘志瑾,任宝平,魏辅文,李明.关于物种形成机制及物种定义的新观点[J].动物分类学报,2004,29(4):827-830. 被引量：8
7马费成.数字时代情报学发展展望（笔谈）——在数字环境下实现知识的组织和提供[J].郑州大学学报（哲学社会科学版）,2005,38(4):5-7. 被引量：54
8冯之浚.赵红州同志五周年祭[J].管理观察,2003(3):41-41. 被引量：1
9王兴成.纪念赵红州展望科学学[J].管理观察,2003(3):42-42. 被引量：1
10毛荐其.技术创新为何进化?——一个原动力追问[J].自然辩证法研究,2006,22(2):60-62. 被引量：13

引证文献6

1胡冰,张建立.基于统计分布的中文专利自动分类方法研究[J].现代图书情报技术,2013(7):101-106. 被引量：6
2高继平,丁堃,潘云涛,袁军鹏.多词共现分析方法的实现及其在研究热点识别中的应用[J].图书情报工作,2014,58(24):80-85. 被引量：25
3高继平,丁堃,潘云涛,袁军鹏.技术领域中的专利知识群分析——以SIPOD中的H04L领域为例[J].情报理论与实践,2015,38(6):83-87. 被引量：4
4高继平,高翠玲.技术縻母视角下的技术进化过程研究[J].科学学研究,2015,33(7):967-974. 被引量：4
5胡菊香,吕学强,徐丽萍.面向专利的技术主题检测[J].计算机工程与设计,2016,37(12):3260-3265. 被引量：1
6林德明,王宇开,杨中楷,刘则渊.赵红州与知识单元——兼论科学学的新进展[J].科学学研究,2019,37(8):1345-1352. 被引量：3

二级引证文献43

1梁艳平,安璐,刘静.同类突发公共卫生事件微博话题共振研究[J].数据分析与知识发现,2020,4(2):122-133. 被引量：13
2高继平,丁堃,潘云涛,袁军鹏.知识元研究述评[J].情报理论与实践,2015,38(7):134-138. 被引量：20
3高继平,丁堃,潘云涛,袁军鹏.国内外知识网络研究现状分析[J].情报理论与实践,2015,38(9):120-125. 被引量：7
4乔永忠,姚清晨.中国授权不同性质专利技术领域布局实证研究[J].科技进步与对策,2015,32(24):16-20. 被引量：3
5茹丽洁,张娴.专利技术相关性研究方法进展评述与展望[J].图书情报工作,2016,60(6):128-134. 被引量：7
6梁丽,孙巍,张学福.基于信息可视化的动物资源育种领域研究态势分析[J].中国农学通报,2016,32(20):155-164.
7刘红光,马双刚,刘桂锋.基于机器学习的专利文本分类算法研究综述[J].图书情报研究,2016,9(3):79-86. 被引量：19
8吕璐成,赵亚娟,王学昭,赵萍.基于关联规则挖掘的研发团队识别方法[J].科技管理研究,2016,36(17):148-152. 被引量：7
9刘桂锋,汪满容,刘海军.基于概率超图半监督学习的专利文本分类方法研究[J].情报杂志,2016,35(9):187-191. 被引量：5
10邬群勇,方祺伟,孙振海.基于多词共现模型的灾害应急任务提取方法[J].自然灾害学报,2016,25(5):1-8. 被引量：3

1权利要求书的撰写（1）—你懂得如何撰写专利文件吗？（七）[J].发明与革新,1992(2):32-33.
2赵映诚.专利说明书及其摘要的写作[J].应用写作,2005(9):25-26.
3你懂得如何撰写专利文件吗？（三）说明书的撰写（1）[J].发明与革新,1991(10):30-32.
4许伯严.你懂得如何撰写专利文件吗？（四）说明书的撰写（2）[J].发明与革新,1991(11):28-30.
5张进.对高效字符串匹配算法的再研究——与王永成先生商榷[J].情报学报,1991,10(1):65-71.
6鲁程.三大中文专利全文数据库的比较研究[J].农业图书情报学刊,2006,18(11):109-111. 被引量：3
7王力德.为专利转化支招[J].发明与创新（大科技）,2006(4):27-28.
8杨引雪.提高专利申请质量的重要条件：发明人和代理人的通力合作[J].电子知识产权,1994(9):18-20.
9李天铎.有关欧亚专利申请和专利正式信息的来源[J].管理观察,1999,0(1):27-27.
10杨敏锋.客车侵权第一案尘埃未定[J].中国市场,2010(47):40-41.

情报理论与实践

2011年第6期

浏览历史

内容加载中请稍等...

基于专利文件知识结构的中文专利知识单元挖掘被引量：6

参考文献13

二级参考文献40

共引文献131

同被引文献108

引证文献6

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

基于专利文件知识结构的中文专利知识单元挖掘 被引量：6

参考文献13

二级参考文献40

共引文献131

同被引文献108

引证文献6

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

基于专利文件知识结构的中文专利知识单元挖掘被引量：6