期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
数据驱动的细粒度中文属性对齐方法 被引量:1
1
作者 黄廷磊 张伟莉 +1 位作者 梁霄 付琨 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第4期660-666,共7页
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计... 为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对齐方法不仅提高了同义属性识别的准确性,而且可识别出相互包含和相关的属性,证明了其在中文开源数据集上的有效性. 展开更多
关键词 中文属性对齐 属性数据类型判别 属性相似度 异构数据集成 知识图谱构建
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部