期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
论文元数据信息的自动抽取 被引量:38
1
作者 李朝光 张铭 +2 位作者 邓志鸿 杨冬青 唐世渭 《计算机工程与应用》 CSCD 北大核心 2002年第21期189-191,235,共4页
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有... 为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。 展开更多
关键词 论文 元数据信息 自由抽取 科技文献检索系统 信息抽取 正则表达式规则 WEB
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部