期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多种规则的课程元数据自动抽取 被引量:7
1
作者 杨宇 张铭 周宝曜 《计算机科学》 CSCD 北大核心 2008年第3期94-96,共3页
在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则... 在线课程组织和管理系统就是为了使学习更加便利而提供的一个教育资源的集成平台。作为系统中重要环节的元数据抽取模块,需要对半结构化网页能够达到较好的抽取精确性,并具有处理结构松散文档的能力。本文设计并实现了一种按照指定规则自动抽取的元数据方法。该方法能够按照多优先级规则匹配网页元数据,并按照两步抽取的方法进行精细化处理。针对不同的问题域使用不同规则抽取,不需对程序进行特定修改。实验证明,这种方法能够很好地处理半结构化网页,F测度达到85%以上,具有较好的实用价值。 展开更多
关键词 元数据抽取 正则表达式 信息精化
下载PDF
发现维基百科文章相关图片
2
作者 寿思聪 姚从磊 李晓明 《计算机科学与探索》 CSCD 2011年第7期577-587,共11页
维基百科(Wikipedia)提供了海量的描述著名概念的高质量文章,丰富的图片使它们有更高的价值。但大部分Wikipedia文章都没有图片或图很少,为此给出了综合的框架WIMAGE来为Wikipedia文章发现高精度、高召回度和高多样性图片。WIMAGE包括... 维基百科(Wikipedia)提供了海量的描述著名概念的高质量文章,丰富的图片使它们有更高的价值。但大部分Wikipedia文章都没有图片或图很少,为此给出了综合的框架WIMAGE来为Wikipedia文章发现高精度、高召回度和高多样性图片。WIMAGE包括生成查询的方法及两种图片排序方法。采用Wikipedia中4个常见类别的40篇文章进行实验,结果显示WIMAGE能有效地为Wikipedia文章发现高精度、高召回度以及高多样性的图片,且同时考虑了视觉相似度和文本相似度的排序方法效果最好。 展开更多
关键词 维基百科 图片发现 多样性 图片排序
下载PDF
基于混合正则化的无标签领域的归纳迁移学习 被引量:5
3
作者 庄福振 罗平 +1 位作者 何清 史忠植 《科学通报》 CAS CSCD 北大核心 2009年第11期1618-1625,共8页
近年来迁移学习已经引起了越来越广泛的兴趣,签数据以及源领域数据是不同分布的分类问题,且建立一个归纳分类模型对新来的目标数据进行预测.首先分析了直推式迁移学习(transductive transfer learning)中存在的类别比例漂移问题,然后提... 近年来迁移学习已经引起了越来越广泛的兴趣,签数据以及源领域数据是不同分布的分类问题,且建立一个归纳分类模型对新来的目标数据进行预测.首先分析了直推式迁移学习(transductive transfer learning)中存在的类别比例漂移问题,然后提出归一化的方法使得预测的类别比例接近于实际样本类别比例.更进一步,提出了一种基于混合正则化框架的归纳迁移学习算法.其中包括目标领域分布结构的流形正则化,预测概率的熵正则化,以及类别比例的期望正则化.这个框架被用于从源领域到目标领域学习的归纳模型中.最后,在实际文本数据集上的实验结果表明,提出的归纳迁移学习模型是有效的,同时该模型可以直接对新来的目标数据进行预测. 展开更多
关键词 迁移学习 归纳学习 直推式学习 混合正则化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部