期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多Web数据源环境下的重复实体识别方法研究 被引量:3
1
作者 刘伟 肖建国 《计算机科学与探索》 CSCD 2010年第7期599-607,共9页
Web中大量可访问的数据源为人们获取有用的信息带来了极大的便利。作为Web数据源集成的一个必要的步骤,需要将存在于不同数据源表达形式各异的重复Web实体准确地识别出来。在已有的重复实体识别的工作中,主要是在两个数据源之间进行。由... Web中大量可访问的数据源为人们获取有用的信息带来了极大的便利。作为Web数据源集成的一个必要的步骤,需要将存在于不同数据源表达形式各异的重复Web实体准确地识别出来。在已有的重复实体识别的工作中,主要是在两个数据源之间进行。由于Web数据源数量众多,使得这些方法无法应用于多个Web数据源之间的重复实体识别。针对这个问题提出了一种基于迭代训练的Web重复实体识别方法,可以在较小规模的训练样本上实现在多个Web数据源上的重复实体识别。通过在图书和计算机产品两个不同领域中多个Web数据源上的广泛实验,表明了提出方法的有效性。 展开更多
关键词 Web实体 重复实体识别 WEB数据集成 迭代训练
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部