期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
一种新的基于属性-值对的决策树归纳算法 被引量:6
1
作者 郭茂祖 刘扬 《小型微型计算机系统》 CSCD 北大核心 2001年第4期459-461,共3页
决策树归纳算法 ID3是实例学习中具有代表性的学习方法 .文中针对 ID3易偏向于值数较多属性的缺陷 ,提出一种新的基于属性 -值对的决策树归纳算法 AVPI,它所产生的决策树大小及测试速度均优于 ID3.该算法应用于色彩匹配系统 。
关键词 属性-值对 决策树归纳算法 符号学习 实例学习
下载PDF
基于属性-值对的信息增益优化算法 被引量:2
2
作者 孙超利 张继福 《太原科技大学学报》 2005年第3期199-202,共4页
偏向于取值较多的属性是ID3算法的一个缺陷,目前已提出的决策树的优化算法对ID3算法的改进,部分解决了该缺陷,但仅适用于两值属性的样例集,对于多值属性效果并不明显。针对该优化算法的不足,通过将属性和属性值对应成一个属性,提出了属... 偏向于取值较多的属性是ID3算法的一个缺陷,目前已提出的决策树的优化算法对ID3算法的改进,部分解决了该缺陷,但仅适用于两值属性的样例集,对于多值属性效果并不明显。针对该优化算法的不足,通过将属性和属性值对应成一个属性,提出了属性-值对的信息增益优化算法GBT。通过理论和实验分析,表明该算法不仅克服了ID3算法偏向于取值多属性的缺陷,同时解决了优化算法对多值属性效果不明显的不足。 展开更多
关键词 数据挖掘 决策树 信息增益 信息熵 属性-值对
下载PDF
基于小生境完全属性-值空间树的属性序约简优化算法 被引量:3
3
作者 丁卫平 王建东 +2 位作者 管致锦 施佺 陈森博 《南京理工大学学报》 EI CAS CSCD 北大核心 2012年第1期37-42,共6页
为了克服传统粗糙集属性约简方法求解效率不高,且难以搜索出满足用户需求的最优属性约简集的问题,提出了一种属性序约简优化算法。该算法基于决策表的完全属性-值空间树结构,在属性约简空间自适应构造小生境超球面邻域半径,并进行约简... 为了克服传统粗糙集属性约简方法求解效率不高,且难以搜索出满足用户需求的最优属性约简集的问题,提出了一种属性序约简优化算法。该算法基于决策表的完全属性-值空间树结构,在属性约简空间自适应构造小生境超球面邻域半径,并进行约简树的生成、剪枝、约简及动态优化等,快速找到满足用户需求的最优属性序约简集。相关仿真实验表明该算法在保证收敛速度的同时具有较强的属性约简优化性能,是一种能满足用户需求的高效属性序约简算法。 展开更多
关键词 小生境邻域半径 属性约简 属性 完全属性-空间树
下载PDF
一种基于属性-值树的求核与约简方法 被引量:2
4
作者 王晓帆 王宝树 柴慧敏 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2010年第6期1111-1118,共8页
为快速计算粗糙集的一个属性约简与核,提出一种基于属性-值树模型的改进约简与求核算法,并证明了算法的完备性.该算法充分利用树型结构,引进树的合并方法,使得计算复杂度从O(|U||C|2)降低为O(|U||C|),提高了计算效率(其中|U|和|C|分别... 为快速计算粗糙集的一个属性约简与核,提出一种基于属性-值树模型的改进约简与求核算法,并证明了算法的完备性.该算法充分利用树型结构,引进树的合并方法,使得计算复杂度从O(|U||C|2)降低为O(|U||C|),提高了计算效率(其中|U|和|C|分别代表对象个数和属性个数). 展开更多
关键词 粗糙集 决策表 属性约简 属性-
下载PDF
网页中商品“属性—值”关系的自动抽取方法研究 被引量:7
5
作者 唐伟 洪宇 +2 位作者 冯艳卉 姚建民 朱巧明 《中文信息学报》 CSCD 北大核心 2013年第1期21-29,38,共10页
商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品"属性—值"关系。该方法包含四个关... 商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品"属性—值"关系。该方法包含四个关键技术:1)利用商品网页标题构建领域相关的属性词包;2)基于预设分隔符细化文本节点;3)结合领域商品属性词包获取种子"属性—值"关系;4)结合网页布局信息和字符信息来筛选与构建模板。该文的实验基于相机和手机两个领域展开,获得94.68%的准确率和90.57%的召回率。 展开更多
关键词 商品"属性-"关系抽取 WEB数据挖掘 模板构建
下载PDF
云制造中的制造能力服务形式化描述方法 被引量:10
6
作者 肖莹莹 李伯虎 +1 位作者 柴旭东 公静 《系统仿真学报》 CAS CSCD 北大核心 2015年第9期2096-2107,共12页
针对云制造系统对制造能力服务的应用需求,研究了制造能力服务的统一描述及其形式化方法。分析了云制造环境下的制造能力服务的内涵,给出了其定义和分类框架;定义了制造能力服务的元模型及详细描述属性,使用基于对象-值-属性(entity-val... 针对云制造系统对制造能力服务的应用需求,研究了制造能力服务的统一描述及其形式化方法。分析了云制造环境下的制造能力服务的内涵,给出了其定义和分类框架;定义了制造能力服务的元模型及详细描述属性,使用基于对象-值-属性(entity-value-attribute,EVA)数据模型的持久化方法实现异构制造能力服务的形式化。上述制造能力描述及形式化方法在智慧云制造系统(Tian Zhi Net)中的应用效果初步验证了成果的可行性。 展开更多
关键词 云制造 制造能力 形式化描述方法 元模型 对象--属性模型
下载PDF
未定义类型的关系抽取的半监督学习框架研究 被引量:7
7
作者 程显毅 朱倩 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期466-474,共9页
设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文本的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.本文描述了一个提取"实体-属性... 设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文本的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.本文描述了一个提取"实体-属性-值"关系的半监督的机器学习框架,在半监督学习任务中,种子主要从维基百科的信息表格中获取,首先用线性分类器找出一些强反例,然后迭代的使用已有的反例数据重新训练分类器再应用到余下的未标注数据上找出更多反例.经过半监督学习得到了一个关系候选实例集,接下来讨论了关系类别验证问题,对于噪声模式,给出关系模式置信度评价指标,对于冲突模式提出了控制匹配顺序(高置信度模式优先匹配的原则)算法.经过这两个算法后,关系类别的描述仍具一定的多样性,提出凝聚型层次聚类算法,该算法将维基百科描述的结构特征表示为向量{DW,CW,IW,BW},进而给出两个关系模式相关度计算模式,完成关系类别聚类.最后,在WikipediaXML数据集进行了相关的实验,结果表明:根据维基百科的结构特征,动态的确定关系类别,减少了对预定义类型的依赖,提高了关系识别系统的可移植性. 展开更多
关键词 关系抽取 半监督学习 维基百科 实体-属性-
下载PDF
卫生数据标准化方法研究 被引量:16
8
作者 娄苗苗 杨喆 +1 位作者 刘丹红 徐勇勇 《中国卫生信息管理杂志》 2013年第5期440-443,共4页
目的尝试通过构建概念数据模型,提出科学、系统的卫生数据标准化方法体系。方法分析整理健康档案中的数据项,采用自底向上的路线提出对象类及其属性,构建数据模型;采用自顶向下的路线,通过定义实体-属性-值,构建标准化数据元。结果构建... 目的尝试通过构建概念数据模型,提出科学、系统的卫生数据标准化方法体系。方法分析整理健康档案中的数据项,采用自底向上的路线提出对象类及其属性,构建数据模型;采用自顶向下的路线,通过定义实体-属性-值,构建标准化数据元。结果构建了实验室检查概念数据模型,并对实验室检查及其子类设置属性和数据类型,定义属性的取值及其表示,提炼出了标准化数据元。结论通过对类、属性及值集的管理和维护,体现数据标准化工作的稳定性、开放性和可持续性。 展开更多
关键词 标准化 数据模型 数据元 实体-属性-三联体
下载PDF
基于不完备信息的直升机传动系统故障诊断规则提取方法 被引量:4
9
作者 王珉 胡茑庆 秦国军 《振动与冲击》 EI CSCD 北大核心 2011年第12期185-190,共6页
在直升机传动系统诊断知识获取中,从不完备信息中获取故障诊断决策规则是一个难题,为此提出一种基于最大特征相似集,从不完备诊断决策表中提取传动系统最优广义诊断决策规则的方法,分析了未知属性值的两种类型,以属性-值集的形式表示不... 在直升机传动系统诊断知识获取中,从不完备信息中获取故障诊断决策规则是一个难题,为此提出一种基于最大特征相似集,从不完备诊断决策表中提取传动系统最优广义诊断决策规则的方法,分析了未知属性值的两种类型,以属性-值集的形式表示不完备诊断决策表中实例的关系,引入特征关系,给出最大特征相似集的定义,介绍了广义决策规则,以最大特征相似集为单位构造了不完备决策表的分辨函数矩阵,结合命题逻辑中的基本等价式,实现了不完备诊断决策表中的规则提取与约简,结合直升机尾减轴承振动信号的故障诊断实例对所提出的方法进行工程应用,给出应用步骤,并证明了该方法的有效性。 展开更多
关键词 直升机传动系统 知识获取 不完备信息 属性- 特征关系 最大特征相似集 规则提取
下载PDF
粒度粗糙理论研究 被引量:2
10
作者 陈波 周明天 《软件学报》 EI CSCD 北大核心 2008年第3期565-583,共19页
从动机、理论和实现三方面系统地阐述了粒度粗糙理论体系.分析了构建粒度粗糙理论的3点动机:1)通过显式编码语义上下文的信息表示模型,强调粗糙性的表示语义;2)通过半结构化思想设计表示模型,扩展粗糙性方法适用的信息源;3)通过构建纯... 从动机、理论和实现三方面系统地阐述了粒度粗糙理论体系.分析了构建粒度粗糙理论的3点动机:1)通过显式编码语义上下文的信息表示模型,强调粗糙性的表示语义;2)通过半结构化思想设计表示模型,扩展粗糙性方法适用的信息源;3)通过构建纯粹总分学关系上的粗糙性,描述丰富的信息结构应用语境,扩展粗糙性方法到总分学推动的领域,并展示结合总分学和计算机科学创建新型跨学科方法学的潜力.理论上定义了粒度表示演算,使其兼具一般信息源和粗糙性方法底层表示系统的双重功能,在此基础上构造内核、外壳及主体信息颗粒,分别对应粗糙性的下界近似、边界区域及上界近似概念.实现上,提出了通过"实体-属性-值"模型开源系统进行粒度粗糙理论快速原型化的思路,从而提供实验平台验证理论的正确性,同时,更自然地对临床数据进行粗糙性分析.作为总结,阐述了粒度粗糙理论的意义、未解决问题及未来的研究方向. 展开更多
关键词 粒度表示演算 粒度粗糙理论 纯粹总分学粗糙性 半结构化数据表示 实体-属性-模型
下载PDF
基于智能多agent的推荐系统 被引量:1
11
作者 王卫平 赵明 +1 位作者 刘迎意 王选 《计算机系统应用》 2010年第2期1-5,共5页
针对传统推荐系统存在的用户评分稀疏性和系统扩展性问题,提出了一种基于智能多agent的推荐系统MASRS。首先采用余弦公式处理用户-项评分矩阵得到用户初始邻居集;然后将用户评分映射到相应项的属性值上,生成用户-属性值偏好矩阵UPm,并... 针对传统推荐系统存在的用户评分稀疏性和系统扩展性问题,提出了一种基于智能多agent的推荐系统MASRS。首先采用余弦公式处理用户-项评分矩阵得到用户初始邻居集;然后将用户评分映射到相应项的属性值上,生成用户-属性值偏好矩阵UPm,并基于此矩阵进行用户相似性度量,得到用户产品推荐集,该方法有效缓解用户评分稀疏性问题;通过智能多agent架构推荐系统,使大量复杂计算在线下进行,从而改善系统存在的扩展性问题。同时实验表明新系统在推荐精度上收敛性更好。 展开更多
关键词 推荐系统 稀疏性 用户-属性偏好矩阵 智能多agent
下载PDF
Creating customized data services from web pages
12
作者 季光 Wang Guiling Han Yanbo 《High Technology Letters》 EI CAS 2013年第2期203-207,共5页
To extract structured data from a web page with customized requirements,a user labels some DOM elements on the page with attribute names.The common features of the labeled elements are utilized to guide the user throu... To extract structured data from a web page with customized requirements,a user labels some DOM elements on the page with attribute names.The common features of the labeled elements are utilized to guide the user through the labeling process to minimize user efforts,and are also utilized to retrieve attribute values.To turn the attribute values into a structured result,the attribute pattern needs to be induced.For this purpose,a space-optimized suffix tree called attribute tree is built to transform the document object model(DOM) tree into a simpler form while preserving its useful properties such as attribute sequence order.The pattern is induced bottom-up on the attribute tree,and is further used to build the structured result.Experiments are conducted and show high performance of our approach in terms of precision,recall and structural correctness. 展开更多
关键词 web data extraction structured data user labeling CUSTOMIZATION data service
下载PDF
基于结构化病例报告表的EDC构建策略 被引量:5
13
作者 蒋志伟 夏结来 +2 位作者 李婵娟 王陵 张春茂 《中国新药杂志》 CAS CSCD 北大核心 2009年第23期2199-2204,共6页
目前,电子数据捕获(EDC)系统日益受到制药企业、CRO和临床研究人员的青睐,并逐步应用于新药临床试验中。不同临床试验eCRF设计的可复用性问题是EDC系统构建中的关键问题。根据新药临床试验病例报告表具有高度结构性的特点,通过建立临床... 目前,电子数据捕获(EDC)系统日益受到制药企业、CRO和临床研究人员的青睐,并逐步应用于新药临床试验中。不同临床试验eCRF设计的可复用性问题是EDC系统构建中的关键问题。根据新药临床试验病例报告表具有高度结构性的特点,通过建立临床试验的通用数据库模型、病例报告表元数据库和采用XML技术实现eCRF设计中数据库和录入界面的自动生成以及临床试验数据的提交与读取。利用基于结构化病例报告表的构建策略逐步实现电子数据捕获。 展开更多
关键词 电子数据捕获 病例报告表 通用数据库模型 实体-属性- 可扩展标记语言 元数据库
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部