基于序列模式的科技文献中知识元抽取研究被引量：5

Extraction of Knowledge Elements in Scientific Literature Based on Sequential Patterns

下载PDF

导出

摘要为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。 In order to improve the efficiency of the extraction of various types of knowledge elements(KEs)in the scientific literature.This paper proposes a knowledge model extraction model based on sequential patterns.Firstly,based on the description rules of each type of KEs,the KEs sentence is analyzed by dependency parsing,and to generate the semantic integrated KEs sequence pattern.Then,based on the KEs sequence pattern,each type of knowledge element is extracted by pattern matching algorithm.Finally,we use the Prefixspan algorithm to mining new new sequence pattern describing the KEs from the extracted KEs,and to realize the continuous dynamic update and expansion of the KEs sequence pattern,and then improve the knowledge element extraction efficiency.The method of extracting KEs in the scientific literature based on sequential patterns overcomes the semantic limitations based on rules matching,has discipline extensibility,and improves the efficiency of KEs extraction.

作者石义金王忠义沈雪莹郑鑫 Shi Yijin

机构地区华中师范大学信息管理学院

出处《情报理论与实践》 CSSCI 北大核心 2020年第11期144-149,共6页 Information Studies:Theory & Application

基金华中师范大学中央高校基本科研业务费项目“数字馆藏资源多粒度层级结构挖掘研究”的成果之一,项目编号:CCNU19TS043。

关键词科技文献序列模式知识元知识元抽取依存句法 PREFIXSPAN scientific and technical literature sequence pattern knowledge element knowledge element extraction dependency parse Prefixspan

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1原小玲.基于知识元的知识标引[J].图书馆学研究,2007(6):45-47. 被引量：31
2张静,刘延申,卫金磊.论中小学多媒体知识元库的建设[J].现代教育技术,2005,15(5):68-71. 被引量：30
3毕崇武,王忠义,宋红文.基于知识元的数字图书馆多粒度集成知识服务研究[J].图书情报工作,2017,61(4):115-122. 被引量：52
4温有奎,温浩,徐端颐,潘龙法.基于知识元的文本知识标引[J].情报学报,2006,25(3):282-288. 被引量：65
5廖开际,熊会会,叶东海.基于知识元理论的应急文档结构化建模[J].计算机应用研究,2011,28(1):175-178. 被引量：13
6王步康,王红玲,袁晓虹,周国栋.基于依存句法分析的中文语义角色标注[J].中文信息学报,2010,24(1):25-29. 被引量：23
7赵蓉英,张心源.基于知识元抽取的中文智库成果描述规则研究[J].图书与情报,2017(1):119-127. 被引量：18
8段湘煜,赵军,徐波.基于动作建模的中文依存句法分析[J].中文信息学报,2007,21(5):25-30. 被引量：11
9王斌,黄晓芳,袁平.基于PrefixSpan序列模式挖掘的改进算法[J].西南科技大学学报,2016,31(4):68-72. 被引量：6
10王忠义,沈雪莹,黄京.基于知识元的中文文本层级分割[J].图书情报工作,2019,63(7):105-115. 被引量：5

二级参考文献106

1温有奎.基于“知识元”的知识组织与检索[J].计算机工程与应用,2005,41(1):55-57. 被引量：74
2刘植惠.两种新型的情报产品──《超级杂志》和《科学地图册》[J].情报理论与实践,1994,17(6):47-48. 被引量：6
3姜永常.论数字图书馆的知识构建[J].现代图书情报技术,2005(6):10-13. 被引量：19
4李湖生.浅谈知识量及其测定[J].情报理论与实践,1995,18(2):3-5. 被引量：8
5张静,刘延申,卫金磊.论中小学多媒体知识元库的建设[J].现代教育技术,2005,15(5):68-71. 被引量：30
6温有奎 ,温浩 ,徐端颐 ,潘龙法 .基于创新点的知识元挖掘[J].情报学报,2005,24(6):663-668. 被引量：37
7周宁,余肖生,刘玮,张芳芳.基于XML平台的知识元表示与抽取研究[J].中国图书馆学报,2006,32(3):41-45. 被引量：31
8温有奎,温浩,徐端颐,潘龙法.基于知识元的文本知识标引[J].情报学报,2006,25(3):282-288. 被引量：65
9周明建,陶俊才.知识管理系统中的知识推送[J].计算机辅助设计与图形学学报,2006,18(8):1218-1223. 被引量：24
10杨杨,赵政.模糊决策树在公共危机应急系统中的应用[J].计算机应用,2006,26(10):2457-2459. 被引量：1

共引文献179

1高霄云,杨建林.基于规则的中文时间词和数词的自动识别算法[J].现代图书情报技术,2007(3):46-50. 被引量：2
2周春雷,成江东.基于xml的知识创新管理工具开发[J].农业图书情报学刊,2007,19(5):27-28.
3王燕,温有奎.文本单元向知识单元转化的研究[J].情报理论与实践,2007,30(3):409-411. 被引量：7
4苏海燕,刘瑞瑞,王芳.“长尾理论”对高校图书馆信息服务的启示[J].数字图书馆论坛,2007(9):43-45. 被引量：2
5文庭孝.知识单元的演变及其评价研究[J].图书情报工作,2007,51(10):72-76. 被引量：65
6化柏林.基于NLP的知识抽取系统架构研究[J].现代图书情报技术,2007(10):38-41. 被引量：16
7文庭孝,侯经川,龚蛟腾,刘晓英,汪全莉.中文文本知识元的构建及其现实意义[J].中国图书馆学报,2007,33(6):91-95. 被引量：49
8文庭孝.知识计量单元的比较与评价研究[J].情报理论与实践,2007,30(6):731-736. 被引量：13
9夏火松,陈国栋,范昭岩,章伟.知识网格研究综述[J].情报学报,2007,26(6):869-876. 被引量：5
10张云英.浅谈网络时代的图书馆服务[J].中华女子学院山东分院学报,2008(3):87-89.

同被引文献101

1李如森,彭彩红,赵福荣.科技论文创新性判断方法[J].鞍山钢铁学院学报,2001,24(3):234-236. 被引量：16
2周露阳.论审评学术论文创新因素的指标体系[J].编辑学报,2006,18(1):68-70. 被引量：27
3张新民,化柏林,罗卫东.认知信息检索研究的发展与展望[J].图书情报工作,2007,51(10):6-9. 被引量：15
4温有奎,成鹏.基于知识单元间隐含关联的知识发现[J].情报学报,2007,26(5):653-658. 被引量：20
5化柏林.国内外知识抽取研究进展综述[J].情报杂志,2008,27(2):60-62. 被引量：13
6谈春梅,颜世伟,刘子牧.网络专题知识组织知识元自动抽取系统的设计与实现[J].现代图书情报技术,2008(3):62-67. 被引量：10
7丁振国,李成家,田宛欣.Web呼叫中心路由和排队策略研究[J].现代图书情报技术,2009(7):65-69. 被引量：3
8温有奎,焦玉英.Wiki知识元语义图研究[J].情报学报,2009,28(6):870-877. 被引量：21
9谢守美.国内知识生态系统研究综述[J].情报科学,2010,28(5):797-800. 被引量：9
10郑彦宁,化柏林.句子级知识抽取在情报学中的应用分析[J].情报理论与实践,2011,34(12):1-4. 被引量：18

引证文献5

1柴庆凤,史霖炎,梅珊,熊海涛,贺惠新.基于人工特征和机器特征融合的科技文献知识元抽取[J].数据分析与知识发现,2021,5(8):132-143. 被引量：11
2曹树金,赵浜,岳文玉,闫欣阳.学术论文创新点的识别与检索入口研究——以情报学期刊论文为例[J].现代情报,2021,41(12):17-27. 被引量：12
3董坤.基于依存关系与主题差异的非遗知识元抽取方法研究[J].图书情报导刊,2023,8(1):72-79.
4戎军涛,王丽华.图书情报领域知识元技术研究述评[J].图书馆学研究,2023(7):9-15.
5庞瑞欣,李秀霞.基于知识元迁移的学科领域方法库构建研究[J].情报理论与实践,2024,47(5):204-212.

二级引证文献21

1徐绪堪,薛梦瑶,钱进.基于知识元语义描述模型的红色文化数字资源知识抽取研究[J].科技情报研究,2022,4(1):23-33. 被引量：9
2熊回香,叶佳鑫.面向科技文献检索的关键词层次结构构建[J].情报理论与实践,2022,45(9):157-163. 被引量：3
3魏绪秋,申力旭.学术论文创新性研究述评[J].图书情报知识,2022,39(4):68-79. 被引量：10
4曹树金,闫颂.基于语义角色信息的科技论文创新段落定位及功能句识别方法研究——以中文情报学领域论文为例[J].情报理论与实践,2022,45(11):1-9. 被引量：8
5曹树金,曹茹烨.基于知识图谱支持科研创新的跨学科知识发现研究[J].情报理论与实践,2022,45(11):10-20. 被引量：12
6曹树金,李睿婧.基于专利文献摘要的创新知识图谱构建与应用[J].情报理论与实践,2022,45(11):21-28. 被引量：8
7曹树金,王雅琪.创新导向的研究生课程论文写作情境中情报需求特征实证研究[J].现代情报,2022,42(12):4-16. 被引量：1
8曹树金,赵浜.创新视角的论文间关联挖掘研究[J].现代情报,2022,42(12):17-27.
9曹树金,曹茹烨.基于知识图谱的科技论文创新点动态识别研究[J].现代情报,2022,42(12):28-41. 被引量：7
10任亮,杜薇薇,刘伟利.面向科技文献知识元的知识图谱构建研究[J].情报科学,2022,40(9):26-31. 被引量：7

1乔永凤,周晓莉,冯志永,王凯.基于大数据和深度学习的语音识别研究[J].山西师范大学学报（自然科学版）,2020,34(3):23-26. 被引量：2
2卢文浩,余天伦,杨立洪,魏勇军,刘有志,李东旭,胡杨.AVC系统电压预测及控制研究[J].应用数学进展,2020,9(9):1604-1611. 被引量：1
3张培,张旭,熊德意.基于补全信息的篇章级神经机器翻译[J].中文信息学报,2020(7):60-67. 被引量：2
4熊建国.自然语言处理工具在语料驱动批评话语分析中的运用——以英语洗钱新闻为例[J].解放军外国语学院学报,2020,43(5):10-19. 被引量：3
5邵琦,牟冬梅,王萍,靳春妍.基于语义的突发公共卫生事件网络舆情主题发现研究[J].数据分析与知识发现,2020,4(9):68-80. 被引量：22
6方伟,黄羿,马新强.基于机器学习的虚拟网络感知数据缺陷自动检测[J].吉林大学学报（工学版）,2020,50(5):1844-1849. 被引量：2
7赵华,邹若飞.基于Tree LSTM+CRF的属性级观点挖掘[J].山东科技大学学报（自然科学版）,2020,39(6):115-122. 被引量：1
8李静,戴丽娜.基于整数线性模拟的多样性关键信息抽取仿真[J].计算机仿真,2020,37(10):365-368.
9刘金龙,刘鹏,裴帅,田冲.基于关联规则的网络异常检测系统设计与实现[J].信息技术与网络安全,2020,39(11):14-22. 被引量：6

情报理论与实践

2020年第11期

浏览历史

内容加载中请稍等...

基于序列模式的科技文献中知识元抽取研究被引量：5

参考文献10

二级参考文献106

共引文献179

同被引文献101

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于序列模式的科技文献中知识元抽取研究 被引量：5

参考文献10

二级参考文献106

共引文献179

同被引文献101

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于序列模式的科技文献中知识元抽取研究被引量：5