期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于属性权重的实体解析技术
被引量:
5
1
作者
甄灵敏
杨晓春
+1 位作者
王斌
ahmed a hussein
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S1期281-289,共9页
实体解析是将在同一个数据源或者不同数据源中,指向现实世界同一实体的元组识别出来并合并的过程.如何高效而准确地将指向同一实体的记录识别出来一直是研究人员不懈追求的目标.在基于规则的匹配算法中,大多数算法是将所有的属性都作为...
实体解析是将在同一个数据源或者不同数据源中,指向现实世界同一实体的元组识别出来并合并的过程.如何高效而准确地将指向同一实体的记录识别出来一直是研究人员不懈追求的目标.在基于规则的匹配算法中,大多数算法是将所有的属性都作为匹配属性进行计算,并且各个属性的权重都是一样的,然而这样不能充分体现关键属性的重要性.主要针对关系数据库数据源中实体解析准确性的问题,采用信息增益的方法和概率统计的方法计算数据属性的权重,用来代表该属性在记录中的重要性,达到提高实体解析准确度的目的.并且在此基础上采用top-k算法,选择出最佳分类属性集合,减少匹配属性的个数,从而加快了实体解析的速度.
展开更多
关键词
实体解析
属性权重
信息增益
实体识别
TOP-K
下载PDF
职称材料
题名
基于属性权重的实体解析技术
被引量:
5
1
作者
甄灵敏
杨晓春
王斌
ahmed a hussein
机构
东北大学信息科学与工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S1期281-289,共9页
基金
国家自然科学基金项目(61272178
61173031)
+3 种基金
国家自然科学基金海外及港澳学者合作基金项目(61129002)
教育部高等学校博士学科点专项科研基金项目(2011004211028)
中央高校基本科研业务费专项资金项目(N120504001
N110404015)
文摘
实体解析是将在同一个数据源或者不同数据源中,指向现实世界同一实体的元组识别出来并合并的过程.如何高效而准确地将指向同一实体的记录识别出来一直是研究人员不懈追求的目标.在基于规则的匹配算法中,大多数算法是将所有的属性都作为匹配属性进行计算,并且各个属性的权重都是一样的,然而这样不能充分体现关键属性的重要性.主要针对关系数据库数据源中实体解析准确性的问题,采用信息增益的方法和概率统计的方法计算数据属性的权重,用来代表该属性在记录中的重要性,达到提高实体解析准确度的目的.并且在此基础上采用top-k算法,选择出最佳分类属性集合,减少匹配属性的个数,从而加快了实体解析的速度.
关键词
实体解析
属性权重
信息增益
实体识别
TOP-K
Keywords
entity resolution
attribute weight
information gain
entity identification
top-k
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于属性权重的实体解析技术
甄灵敏
杨晓春
王斌
ahmed a hussein
《计算机研究与发展》
EI
CSCD
北大核心
2013
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部