期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
论文元数据信息的自动抽取
被引量:
38
1
作者
李朝光
张铭
+2 位作者
邓志鸿
杨冬青
唐世渭
《计算机工程与应用》
CSCD
北大核心
2002年第21期189-191,235,共4页
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有...
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。
展开更多
关键词
论文
元数据信息
自由抽取
科技文献检索系统
信息
抽取
正则表达式规则
WEB
下载PDF
职称材料
题名
论文元数据信息的自动抽取
被引量:
38
1
作者
李朝光
张铭
邓志鸿
杨冬青
唐世渭
机构
北京大学视觉与听觉处理国家重点实验室
北京大学计算机科学与技术系
北京大学计算机科学与技术系
出处
《计算机工程与应用》
CSCD
北大核心
2002年第21期189-191,235,共4页
基金
国家重点基础研究发展规划"973项目"(编号:G1999032705)
北京大学"创建世界一流大学计划"学科建设项目"985项目
文摘
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者、摘要和关键字等元数据信息。在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文元数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。
关键词
论文
元数据信息
自由抽取
科技文献检索系统
信息
抽取
正则表达式规则
WEB
Keywords
metadata from these documents.This paper introduces a metadata extractor based on regular expression rules,which is used in the knowledge navigation system at Peking University Digital Library.By taking full advantage of the nature structure o
分类号
G354.4 [文化科学—情报学]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
论文元数据信息的自动抽取
李朝光
张铭
邓志鸿
杨冬青
唐世渭
《计算机工程与应用》
CSCD
北大核心
2002
38
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部