会议文献开放资源采集与服务系统的元数据抽取被引量：1

Metadata Extraction from the Open Conference Literatures Acquisition and Service System

下载PDF

导出

摘要在会议文献开放资源采集与服务系统中实现了自动抽取+人工校对的元数据抽取流程,并设计了一个自动抽取器。针对会议文献开放资源本身的特点,该自动抽取器集成了多个基础抽取模板,并易于构建针对某个会议文献集的处理模板,能实现对多种格式的文献进行自动抽取,具有较高的准确度。 The paper realizes a metadata extraction workflow of automatic extraction plus manual proofreading in the acquisition and service system of open conference literatures, and designs an automatic extractor. In view of the features of the open conference literatures themselves, the automatic extractor integrates several basic extraction templates, and is easy to construct the processing template for certain conference literature collections. It can automatically extract literatures with different formats and have relatively high accuracy.

作者刘春江朱江

机构地区中国科学院国家科学图书馆成都分馆

出处《情报理论与实践》 CSSCI 北大核心 2012年第9期117-119,共3页 Information Studies:Theory & Application

基金中国科学院科学数字图书馆二期先期启动项目"重要会议开放资源采集与服务系统"和"十二五"重点建设任务"开放资源服务系统建设"的研究成果

关键词开放获取会议文献元数据信息抽取 open access conference literature metadata information extraction

分类号 G351 [文化科学—情报学]

引文网络
相关文献

参考文献5

1朱江,尚玮姣,姜恩波,柴苗岭,黄筱瑾.会议文献开放资源采集与服务系统的建设[J].情报理论与实践,2010,33(7):117-119. 被引量：13
2李朝光,张铭,邓志鸿,杨冬青,唐世渭.论文元数据信息的自动抽取[J].计算机工程与应用,2002,38(21):189-191. 被引量：38
3黄豫清,戚广志,张福炎.从WEB文档中构造半结构化信息的抽取器[J].软件学报,2000,11(1):73-78. 被引量：47
4HU Yunhua, LI Hang, CAO bo, et al. Automatic extraction of titles from general documents using machine learning [ J ]. Information Processing and Management, 2006, 42 ( 1 ) : 1276- 1293.
5张秀秀,马建霞.PDF科技论文语义元数据的自动抽取研究[J].现代图书情报技术,2009(2):102-106. 被引量：10

二级参考文献12

1陈俊林,张文德.基于XSLT的PDF论文元数据的优化抽取[J].现代图书情报技术,2007(2):18-23. 被引量：9
2Min Yuh Day, Richard Tzong Han Tsai, Cheng Lung Sung, et al. Reference Metadata Extraction Using a Hierarchical Knowledge Representation Framework [ J ]. Decision Support Systems, 2007 ( 43 ) : 152 - 167.
3Hu Y H, Li H, Cao Y B, et al. Automatic Extraction of Titles from General Documents Using Machine Learning [ J ]. Information Processing and Management, 2006,42 ( ! ) :! 276 - 1293.
4Yu J D, Fan X Z. Metadata Extraction from Chinese Research Papers Based on Conditional Random Fields[ J/OL]. [2008 -10- 21 ]. http://ieeexplore, ieee. org/stamp/stamp, jsp? arnumber = 4405975 &isnumber = 4405869.
5Giles C L, Bollacker K D, Lawrence S. CiteSeer: An Automatic Citation Indexing System[ J/OL]. [ 2008 - 10 - 21 ]. http ://clgiles. ist. psu. edu/papers/DL - 1998 - citeseer, pdf.
6PDF Reference [ EB/OL]. [ 2008 - 04 - 15 ]. http ://www. adobe. com/devnet/pdf/pdfs/PDFReferencel3, pdf.
7http: //www. iccaworld, com/dcps/doe, cfm? docid = 876.
8http: //www. google, cn./search? client = aff-os-maxthon&forid = l&ie = uff-S&oe = utf-S&hl = zh-CN&q = proceedings.
9http://www, waset, org/proeeedings, php.
10Ham mar J，SIGMOD Record，1997年，26卷，2期，18页

共引文献100

1明廷波,左志宏,史永刚,林琳.Web信息抽取中基于神经网络的规则学习方法[J].南京大学学报（自然科学版）,2005,41(z1):1-6. 被引量：1
2胡晓江,苑伟政,朱名铨.IIE环境下数字民航的虚拟数据仓库研究[J].小型微型计算机系统,2003,24(1):68-71. 被引量：4
3GU Ning.A Semantic Approach for Web Document Processing[J].Journal of Shanghai University(English Edition),2001,5(z1):82-85.
4李文奇,张忠能.页面包装器自动生成的改进算法[J].计算机工程与应用,2004,40(22):113-115. 被引量：3
5陈漪红,朱江.会议开放资源采集与服务系统用户参与机制研究[J].图书情报工作,2011,55(S1):61-62. 被引量：1
6周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量：34
7满颖,杨增秀.外文科技会议文献采访研究[J].图书情报工作,2013,57(S1):92-95.
8李泽文.基于Web的数据挖掘技术[J].现代计算机,2004,10(7):29-33. 被引量：10
9刘金红,夏阳,陆余良.基于Ontology的网络元数据抽取系统的研究与实现[J].安徽电子信息职业技术学院学报,2004,3(5):10-13. 被引量：3
10程渤,浮花玲,杨国纬.基于工作流及集成中间件技术的电力信息一体化设计及实现[J].电力系统自动化,2004,28(19):80-83. 被引量：15

同被引文献10

1Matgorzata, K. Crowdsourcing in Libraries [EB/OL]. [2014-05 - 12]. http://eprints.rclis.org/18807/.
2张媛.大众参与众包的行为影响因素研究[D].沈阳:东北财经大学,2010.
3Academia.edu-学术型社交网站[EB/OL].[2014-05-12].http://www.it-times.tom.cn/wangzhidaohang/13722.jhtml.
4百度百科Mendeley[EB/OL].[2014-05-12].http://baike.baidu.corn/view/4465169.htm?fr=Aladdin.
5百度百科ResearchGate[EB/0L].[2014-05-12].http://baike.baidu.corn/view/9239650.htm.
6李红培.基于科研社交网络的学科热点分析[D].北京:中国科学院大学,2014.
7冉伟,卢远添.科研社交网络与众包平台研究报告[EB/OL].[2014-02-11].http://www.coinsay.corn/article/coinsay-.3165.html.
8Rose Holley. Crowdsourcing and social engagement: potential, power and freedom for libraries and users. Proceedings of Pacific Rim Digital Library Alliance (PRDLA) Annual meeting[C], 2010.
9肖岚,高长春.“众包”改变企业创新模式[J].上海经济研究,2010,22(3):35-41. 被引量：51
10朱江,尚玮姣,姜恩波,柴苗岭,黄筱瑾.会议文献开放资源采集与服务系统的建设[J].情报理论与实践,2010,33(7):117-119. 被引量：13

引证文献1

1朱江,雷炳旭,姜恩波.开放会议资源众包建设机制研究[J].图书馆杂志,2014,33(11):18-22.

1陈漪红,朱江.会议开放资源采集与服务系统用户参与机制研究[J].图书情报工作,2011,55(S1):61-62. 被引量：1
2朱江,尚玮姣,姜恩波,柴苗岭,黄筱瑾.会议文献开放资源采集与服务系统的建设[J].情报理论与实践,2010,33(7):117-119. 被引量：13
3韩红,朱江,王春明,姜恩波,柴苗岭.开放学术会议文献信息服务模式探索——以中国科学院重要会议开放资源采集与服务系统为例[J].图书馆理论与实践,2015(6):83-86.
4高波.电子资源引用信息的元数据抽取[J].科技情报开发与经济,2007,17(27):72-73.
5陈淑平,梁东魁.基于特征分析的数字化期刊元数据自动抽取算法[J].情报杂志,2010,29(3):143-146. 被引量：1
6朱江,雷炳旭,姜恩波.开放会议资源众包建设机制研究[J].图书馆杂志,2014,33(11):18-22.
7张铭,邓志鸿,陈捷,杨冬青,唐世渭.数字图书馆科技文献知识导航[J].计算机工程与应用,2002,38(17):1-3. 被引量：9
8韩毅,李睿.基于CWM的网络报纸元数据抽取框架模型[J].情报科学,2010,28(3):438-441. 被引量：2
9林爱群.机构知识库元数据的自动生成与评估研究[J].图书馆学研究,2009(7):21-23. 被引量：18
10赵勇宏.人工智能与数字化图书馆建设[J].晋图学刊,2008(1):42-45. 被引量：9

情报理论与实践

2012年第9期

浏览历史

内容加载中请稍等...

会议文献开放资源采集与服务系统的元数据抽取被引量：1

参考文献5

二级参考文献12

共引文献100

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

会议文献开放资源采集与服务系统的元数据抽取 被引量：1

参考文献5

二级参考文献12

共引文献100

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

会议文献开放资源采集与服务系统的元数据抽取被引量：1