期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多种规则的课程元数据自动抽取 被引量:7
1
作者 杨宇 张铭 周宝曜 《计算机科学》 CSCD 北大核心 2008年第3期94-96,共3页
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则... 在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。 展开更多
关键词 元数据抽取 正则表达式 信息精化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部