基于隐马尔可夫模型的引文信息提取被引量：11

Citation Extraction Based on Hidden Markov Model

下载PDF

导出

摘要提出一种基于符号特征提取的HMM结构学习方法，并利用修改的Viterbi算法进行引文信息提取。在实验结果的评价上，除了常用的准确率(Precision)、查全率(Recall)、综合评价指标(F)之外，引入了两个评价标准：宏平均和微平均来综合评价算法的性能。试验表明该方法用于引文信息提取的正确率较高。 This paper puts forward a method of HMM structure learning which is based on the extraction of tokens' features, uses a variation of Viterbi algorithm to extract citation. For evaluating the method, it introduces two standards: Macro-averaging and Mico-averaging in addition to commonly used Precision, Recall and F.

作者张玲黄铁军高文

机构地区中国科学院计算技术研究所中国科学院研究生院

出处《计算机工程》 CAS CSCD 北大核心 2003年第20期33-34,54,共3页 Computer Engineering

基金国家科学数字图书馆智能化网络信息搜索技术与机制研究项目(CSDL2002-18)

关键词隐马尔可夫模型信息提取引文特征提取宏平均微平均科技文章 Hidden Markov model(HMM) Information extraction Citation Feature extraction Macro-averaging Mico-averaging

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Zhang N R.Hidden Markov Models for Information Extraction. Technical Report,Stanford Natural Language Processing Group,2001-07.
2Freitag D,MaCallum A K.lnformation Extraction with HMMs and Shrinkage,AAA199.
3Freitag D,McCallum A.lnformation Extraction with HMM Structures Learned by Stochastic Optimization. Proceedings of AAAI-2000.
4Leek T R.lnformation Extraction Using Hidden Markov Models [Masters Thesis].UC San Diego, 1997.
5Seymore K,McCallum A,Rosenfel R.Leaming Hidden Markov Model Structure for Information Extraction.AAA199 Workshop on Machine Learning for Information Extraction.
6Connan J,Omlin C W,Bibliography Extraction with Hidden Markov Models.Technical Report US-CS-TR-00-6.Department of Computer Sclence,University of Stellenbosch.2000-02-24.
7Freitag D.Machine Learning for Information Extraction in Informal Domains [PhD Thesis].Computer Science Department,Carnegie Mellon University, Pittsburgh,PA, 1998-11.

同被引文献84

1赵英环,郭贵锁.基于主题词迭代提取的信息检索算法[J].华南理工大学学报（自然科学版）,2004,32(z1):77-80. 被引量：3
22003 CES消费电子展专题报道(二)[J].消费电子,2003,0(4):8-11. 被引量：1
3刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
4王卫平,郭长旺.基于文本挖掘的企业竞争情报系统[J].现代情报,2004,24(9):188-189. 被引量：7
5蒲群莹.基于数据挖掘的竞争情报系统模型[J].情报杂志,2005,24(1):38-39. 被引量：28
6林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
7王源,陈亚军.基于高斯混合模型的EM学习算法[J].山西师范大学学报（自然科学版）,2005,19(1):46-49. 被引量：18
8齐再前,白守礼,郭广生.不断创新教学管理切实提高毕业设计(论文)质量[J].中国大学教学,2005(8):33-34. 被引量：24
9王守芳,狄涤,潘金贵.基于自动规约规则的HTML文档元数据提取[J].模式识别与人工智能,2005,18(4):405-411. 被引量：3
10钟敏娟,郝谦,刘云中.基于多模板隐马尔可夫模型的文本信息抽取算法[J].计算机工程,2006,32(2):203-205. 被引量：9

引证文献11

1王胜,朱明.基于最大熵马尔可夫模型的地址信息抽取[J].计算机工程与应用,2005,41(21):192-194. 被引量：7
2余丰,朱东华.信息抽取技术在竞争情报研究中的应用[J].情报杂志,2006,25(3):25-26. 被引量：11
3于江德,樊孝忠,尹继豪,顾益军.基于隐马尔可夫模型的中文科研论文信息抽取[J].计算机工程,2007,33(19):190-192. 被引量：9
4于江德,樊孝忠,尹继豪.基于条件随机场的中文科研论文信息抽取[J].华南理工大学学报（自然科学版）,2007,35(9):90-94. 被引量：11
5于江德,樊孝忠,尹继豪.隐马尔可夫模型在自然语言处理中的应用[J].计算机工程与设计,2007,28(22):5514-5516. 被引量：14
6金砚硕,迟呈英,战学刚.一种基于隐马尔可夫聚类的信息提取方法[J].情报杂志,2008,27(3):96-98. 被引量：6
7武帅.基于条件随机域模型的事实信息抽取方法应用[J].现代图书情报技术,2010(10):59-64.
8梁吉光,田俊华,姜杰.基于改进HMM的文本信息抽取模型[J].计算机工程,2011,37(20):178-179. 被引量：9
9王向东,金玉玕.石炭纪年代地层学研究概况[J].地层学杂志,2000,24(2):90-98. 被引量：27
10王洁,周宽久,侯刚.本科毕业论文文献质量评价方法和工具研究[J].实验室研究与探索,2015,34(2):160-162. 被引量：7

二级引证文献102

1张雪英,闾国年,叶鹏.大数据地理信息系统:框架、技术与挑战[J].现代测绘,2020(6):1-8. 被引量：8
2王向东,胡科毅,郄文昆,盛青怡,陈波,林巍,要乐,王秋来,祁玉平,陈吉涛,廖卓庭,宋俊俊.中国石炭纪综合地层和时间框架[J].中国科学：地球科学,2019,49(1):139-159. 被引量：21
3于文喜,卢富德,蒋海云,滑广军,段华伟,吴若梅,薛琼.新工科背景下包装工程专业本科毕业设计(论文)质量提升方法探索与实践[J].包装工程,2021,42(S01):131-133.
4衣春霞.高校学生网络舆情引导机制研究[J].沙洲职业工学院学报,2013,16(4):62-64. 被引量：2
5祁玉平,王志浩,罗辉.全球维宪阶与谢尔普霍夫阶界线层的生物地层研究进展及展望[J].地层学杂志,2004,28(3):281-287. 被引量：1
6王向东,金玉玕.石炭系全球界线层型研究进展[J].地层学杂志,2005,29(2):147-153. 被引量：16
7赵兵,刘登忠,陶晓风,马润则,胡新伟.西藏仲巴县昂拉仁错—塔若错一带拉嘎组的地层特征及沉积环境[J].地质通报,2006,25(7):800-805. 被引量：5
8邓尚民,孙玉伟.国内外信息抽取研究的文献计量分析[J].图书情报工作,2006,50(12):92-94. 被引量：2
9王昊.基于层次模式匹配的命名实体识别模型[J].现代图书情报技术,2007(5):62-68. 被引量：8
10郑彦宁,化柏林,张新民.信息检索与信息抽取差异性探析[J].图书情报工作,2007,51(10):17-20. 被引量：1

1陈艾华,张桂华.科技文章中精确绘制图形[J].微电脑世界,2000(35):68-69.
2唐建生.用WPS编辑科技文章的技巧[J].电脑技术——Hello-IT,1995(5):34-38.
3王文丽,王银河.巧用中文WORD编辑科技文章[J].电脑学习,1998(4):28-29.
4魏永昌.撰写科技文章应注意的几个问题[J].电源技术应用,2010,13(2).
5刘景彬.在Word2000中插入用Protel99SE画的电路图[J].中国有线电视,2005(15):1519-1519.
6张运凯,王方伟,戴敬书,黄文艳,陈艳红.基于模糊聚类和信息熵的综合评价算法[J].吉林大学学报（信息科学版）,2004,22(6):643-647. 被引量：15
7尹利霞,陈艾华.浅谈科技文章中工程图形的精确绘制[J].建材与装饰,2007(08Z):266-267.
8夏家超.剽窃文章太缺德[J].致富天地,2008(4):8-8.
9李强.Word中嵌入动态数学表达式[J].科学之友（下）,2009(7):158-159.
10周青,郑泽奇.相关的科技文章的智能搜索[J].计算机工程与应用,2004,40(12):48-51.

计算机工程

2003年第20期

浏览历史

内容加载中请稍等...

基于隐马尔可夫模型的引文信息提取被引量：11

参考文献7

同被引文献84

引证文献11

二级引证文献102

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的引文信息提取 被引量：11

参考文献7

同被引文献84

引证文献11

二级引证文献102

相关作者

相关机构

相关主题

浏览历史

基于隐马尔可夫模型的引文信息提取被引量：11