期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
用属性单值表示的决策表简化算法及属性核计算 被引量:2
1
作者 李淑智 徐光华 华成 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第1期87-90,共4页
为了降低决策表的存储空间,提高计算属性核的效率,提出了一种用属性单值表示的决策表简化算法.给出了条件属性的尺度、权值、属性单值和简化决策表的定义,以及尺度运算、权值运算、每个对象的条件属性值集合转换为一个属性单值的简化运... 为了降低决策表的存储空间,提高计算属性核的效率,提出了一种用属性单值表示的决策表简化算法.给出了条件属性的尺度、权值、属性单值和简化决策表的定义,以及尺度运算、权值运算、每个对象的条件属性值集合转换为一个属性单值的简化运算的严密公式,并通过决策表的可逆定理证明了简化决策表与原始决策表具有相同的信息表达能力.利用该算法简化决策表,条件属性的表达由多维降低为一维,从而有效地降低了决策表的存储空间.实验结果表明,简化决策表属性核的计算效率明显比现有决策表属性核的计算效率高,尤其是对于大型决策表,这种优势更加明显. 展开更多
关键词 决策表 属性单值表示 简化算法 属性
下载PDF
ATD4MA:多属性数据的联合真值发现方法
2
作者 何杰 卢菁 +1 位作者 邵清 刘丛 《计算机应用研究》 CSCD 北大核心 2020年第6期1729-1734,共6页
目前已提出的真值发现方法无法解决对象由多个单值属性与多值属性共同组成的情况,若将这些属性拆分后分别处理则会破坏属性间原有的关联,导致计算结果不准确。为此提出一种多属性数据的联合真值发现方法 ATD4MA,将对象各观察值通过遗传... 目前已提出的真值发现方法无法解决对象由多个单值属性与多值属性共同组成的情况,若将这些属性拆分后分别处理则会破坏属性间原有的关联,导致计算结果不准确。为此提出一种多属性数据的联合真值发现方法 ATD4MA,将对象各观察值通过遗传算法中的染色体进行建模,针对问题特性对群体初始化算法和染色体基本动作进行改进,控制染色体的演化行为对各属性进行约束,以各对象的真值染色体与各数据源提供的观察值染色体间的差异加权和达到最小为目标建立优化模型,解决了对象包含多个属性的真值发现问题。在两个真实数据集上的实验证明了提出方法的正确性和有效性。 展开更多
关键词 真值发现 数据相关性 单值属性 多值属性 遗传优化算法
下载PDF
MTruths:Web信息多真值发现方法 被引量:9
3
作者 马如霞 孟小峰 +1 位作者 王璐 史英杰 《计算机研究与发展》 EI CSCD 北大核心 2016年第12期2858-2866,共9页
Web已成为一个浩瀚的信息海洋,其信息分散在不同的数据源中.不同数据源常常为同一对象实体提供冲突的属性值.如何从这些冲突属性值中找到真值被称为真值发现问题.根据属性值数量可将对象属性分为单值属性和多值属性,现有的多数真值发现... Web已成为一个浩瀚的信息海洋,其信息分散在不同的数据源中.不同数据源常常为同一对象实体提供冲突的属性值.如何从这些冲突属性值中找到真值被称为真值发现问题.根据属性值数量可将对象属性分为单值属性和多值属性,现有的多数真值发现算法对单值属性的真值发现比较有效.针对多值属性的真值发现问题,提出了一个多真值发现方法 MTruths,该方法将多真值发现问题转化为一个最优化问题,其目标是:各对象的真值与各数据源提供的观察值之间的相似性加权和达到最大.对象真值求解过程中,提出2种方法求真值列表的最优解:基于枚举的方法和贪心算法.与已有方法不同的是MTruths可以直接得到对象的多个真值.最后,通过图书和电影2个真实数据集上的实验表明,MTruths的2种实现方法的准确性以及贪心算法的效率优于现有真值发现方法. 展开更多
关键词 真值发现 数据冲突 单值属性 多值属性 数据源质量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部