期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数据驱动的细粒度中文属性对齐方法
被引量:
1
1
作者
黄廷磊
张伟莉
+1 位作者
梁霄
付琨
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第4期660-666,共7页
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计...
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对齐方法不仅提高了同义属性识别的准确性,而且可识别出相互包含和相关的属性,证明了其在中文开源数据集上的有效性.
展开更多
关键词
中文
属性
对齐
属性数据类型判别
属性
相似度
异构
数据
集成
知识图谱构建
下载PDF
职称材料
题名
数据驱动的细粒度中文属性对齐方法
被引量:
1
1
作者
黄廷磊
张伟莉
梁霄
付琨
机构
中科院空间信息处理与应用系统技术重点实验室
中国科学院电子学研究所
中国科学院大学
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第4期660-666,共7页
基金
国家高技术研究发展计划(863计划)资助项目(2012AA011005)
文摘
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对齐方法不仅提高了同义属性识别的准确性,而且可识别出相互包含和相关的属性,证明了其在中文开源数据集上的有效性.
关键词
中文
属性
对齐
属性数据类型判别
属性
相似度
异构
数据
集成
知识图谱构建
Keywords
Chinese property alignment
property data type determination
similarity of properties
heterogeneous data integration
construction of knowledge graphs
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
数据驱动的细粒度中文属性对齐方法
黄廷磊
张伟莉
梁霄
付琨
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部