期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
最大化独立有效分类信息率的属性选择
1
作者 柳叶 代建华 陈姣龙 《计算机科学与探索》 CSCD 北大核心 2022年第11期2619-2627,共9页
粗糙集中的属性选择有着十分重要的应用价值。现有的属性选择方法大多忽视了衡量待选属性所提供的分类信息和冗余信息,以及新增待选属性时已选属性所保留的分类信息三者之间的关联。因此,首先利用传统互信息,定义了有效分类信息率的属... 粗糙集中的属性选择有着十分重要的应用价值。现有的属性选择方法大多忽视了衡量待选属性所提供的分类信息和冗余信息,以及新增待选属性时已选属性所保留的分类信息三者之间的关联。因此,首先利用传统互信息,定义了有效分类信息率的属性重要性评估函数,并提出了一种基于有效分类信息率的属性选择方法。该属性选择方法可以有效地选择能提供大量有效分类信息同时携带较少冗余信息的待选属性。另外,考虑到新增待选属性对已选属性所保留的分类信息的影响,进一步提出了独立有效分类信息率的概念,并构造一种基于独立分类有效信息率的改进属性选择方法。该改进的属性选择方法能够有助于平衡属性的有效分类信息和冗余信息的关系,同时提高属性子集的整体识别能力。最后,从分类性能和统计学检验等方面分别与现有的属性选择方法进行了对比实验,实验结果表明了所提出的两种属性选择方法的有效性。 展开更多
关键词 粗糙集理论 属性选择 独立有效分类信息率 信息
下载PDF
基于图文有效信息量的网页正文定位 被引量:2
2
作者 梁正友 欧杰 俞闽敏 《计算机工程》 CAS CSCD 北大核心 2011年第23期276-278,共3页
在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量... 在现有的网页抽取技术中,正文定位方法仅考虑网页文本信息,当正文图片信息较多、文本信息偏少时,容易出现偏差,且定位准确率较低。针对该问题,从信息论角度出发,结合网页中的文本信息图片信息,设计一种对网页中图片信息量和有效信息量的估算方法,在此基础上,提出一种基于图文信息量的网页正文定位算法。实验结果表明,该算法在不同正文文本量的情况下,均具有较高的定位准确率。 展开更多
关键词 正文定位 最小正文子树 有效信息率 网页 图文
下载PDF
基于网页格式信息量的博客文章和评论抽取模型 被引量:15
3
作者 曹冬林 廖祥文 +1 位作者 许洪波 白硕 《软件学报》 EI CSCD 北大核心 2009年第5期1282-1291,共10页
从信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算... 从信息论的角度出发,提出了一个基于网页格式信息量的博客文章和评论抽取模型.首先,结合网页视觉上的位置信息和文本的有效信息来定位网页正文.其次,利用博客网页中的格式信息作为信息单元并计算每个信息块所包含的格式信息量,通过计算最小切分位置信息量来切分正文中的文章和评论.该模型具有与语言无关的特点,因此具有一定的通用性.实验结果表明,该模型在博客正文定位和正文切分方面达到了较高的精确率. 展开更多
关键词 博客信息抽取 最小正文子树 有效信息率 网页格式信息 视觉信息 切分位置信息
下载PDF
基于信息量的Web表格信息抽取方法 被引量:2
4
作者 曾广朴 陶维安 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期159-163,共5页
提出一种基于有效信息量的Web表格信息抽取模型,该模型主要由表格定位和表格信息抽取二个模块组成,根据Web表格的内容特征来识别主题表格,通过检查格式、语法的特征将表格分割成值域与属性域.实验结果表明该模型能够很好地应用于Web表... 提出一种基于有效信息量的Web表格信息抽取模型,该模型主要由表格定位和表格信息抽取二个模块组成,根据Web表格的内容特征来识别主题表格,通过检查格式、语法的特征将表格分割成值域与属性域.实验结果表明该模型能够很好地应用于Web表格信息的抽取. 展开更多
关键词 WEB表格 有效信息率 文档对象模型 信息抽取
下载PDF
An interval effective independence method for optimal sensor placement based on non-probabilistic approach 被引量:6
5
作者 YANG Chen LU ZiXing 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2017年第2期186-198,共13页
This paper presents an interval effective independence method for optimal sensor placement, which contains uncertain structural information. To overcome the lack of insufficient statistic description of uncertain para... This paper presents an interval effective independence method for optimal sensor placement, which contains uncertain structural information. To overcome the lack of insufficient statistic description of uncertain parameters, this paper treats uncertainties as non-probability intervals. Based on the iterative process of classical effective independence method, the proposed study considers the eliminating steps with uncertain cases. Therefore, this method with Fisher information matrix is extended to interval numbers, which could conform to actual engineering. As long as we know the bounds of uncertainties, the interval Fisher information matrix could be obtained conveniently by interval analysis technology. Moreover, due to the definition and calculation of the interval relationship, the possibilities of eliminating candidate sensors in each iterative process and the final layout of sensor placement are both presented in this paper. Finally, two numerical examples, including a five-storey shear structure and a truss structure are proposed respectively in this paper. Compared with Monte Carlo simulation, both of them can indicate the veracity of the interval effective independence method. 展开更多
关键词 optimal sensor placement interval effective independence method non-probabilistic approach interval Fisher information matrix interval possibility
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部