期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
Static-based early-damage detection using symbolic data analysis and unsupervised learning methods
1
作者 Joao Pedro SANTOS Christian CREMONA +2 位作者 Andre D. ORCESI Paulo SILVEIRA Luis CALADO 《Frontiers of Structural and Civil Engineering》 CSCD 2015年第1期1-16,共16页
A large amount of researches and studies have been recently performed by applying statistical and machine learning techniques for vibration-based damage detection. However, the global character inherent to the limited... A large amount of researches and studies have been recently performed by applying statistical and machine learning techniques for vibration-based damage detection. However, the global character inherent to the limited number of modal properties issued from operational modal analysis may be not appropriate for early-damage, which has generally a local character. The present paper aims at detecting this type of damage by using static SHM data and by assuming that early-damage produces dead load redistribution. To achieve this objective a data driven strategy is proposed, consisting of the combination of advanced statistical and machine learning methods such as principal component analysis, symbolic data analysis and cluster analysis. From this analysis it was observed that, under the noise levels measured on site, the proposed strategy is able to automatically detect stiffness reduction in stay cables reaching at least 1%. 展开更多
关键词 structural health monitoring early-damage detection principal component analysis symbolic data symbolic dissimilarity measures cluster analysis numerical model damage simulations
原文传递
Hierarchical Clustering of Complex Symbolic Data and Application for Emitter Identification 被引量:1
2
作者 Xin Xu Jiaheng Lu Wei Wang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2018年第4期807-822,共16页
It is well-known that the values of symbolic variables may take various forms such as an interval, a set of stochastic measurements of some underlying patterns or qualitative multi-values and so on. However, the major... It is well-known that the values of symbolic variables may take various forms such as an interval, a set of stochastic measurements of some underlying patterns or qualitative multi-values and so on. However, the majority of existing work in symbolic data analysis still focuses on interval values. Although some pioneering work in stochastic pattern based symbolic data and mixture of symbolic variables has been explored, it still lacks flexibility and computation efficiency to make full use of the distinctive individual symbolic variables. Therefore, we bring forward a novel hierarchical clustering method with weighted general Jaccard distance and effective global pruning strategy for complex symbolic data and apply it to emitter identification. Extensive experiments indicate that our method has outperformed its peers in both computational efficiency and emitter identification accuracy. 展开更多
关键词 symbolic data analysis stochastic pattern fuzzy interval hierarchical clustering emitter identification
原文传递
Improving symbolic data visualization for pattern recognition and knowledge discovery 被引量:1
3
作者 Kadri Umbleja Manabu Ichino Hiroyuki Yaguchi 《Visual Informatics》 EI 2020年第1期23-31,共9页
This paper examines the visualization of symbolic data and considers the challenges rising from its complex structure.Symbolic data is usually aggregated from large data sets and used to hide entry specific details an... This paper examines the visualization of symbolic data and considers the challenges rising from its complex structure.Symbolic data is usually aggregated from large data sets and used to hide entry specific details and to transform huge amounts of data(like big data)into analyzable quantities.It is also used to offer an overview in places where general trends are more important than individual details.Symbolic data comes in many forms like intervals,histograms,categories and modal multi-valued objects.Symbolic data can also be considered as a distribution.Currently,the de facto visualization approach for symbolic data is zoomstars which has many limitations.The biggest limitation is that the default distributions(histograms)are not supported in 2D as additional dimension is required.This paper proposes several new improvements for zoomstars which would enable it to visualize histograms in 2D by using a quantile or an equivalent interval approach.In addition,several improvements for categorical and modal variables are proposed for a clearer indication of presented categories.Recommendations for different approaches to zoomstars are offered depending on the data type and the desired goal.Furthermore,an alternative approach that allows visualizing the whole data set in comprehensive table-like graph,called shape encoding,is proposed.These visualizations and their usefulness are verified with three symbolic data sets in exploratory data mining phase to identify trends,similar objects and important features,detecting outliers and discrepancies in the data. 展开更多
关键词 data visualization symbolic data Zoomstar Shape encoding Exploratory data analysis
原文传递
基于区间型符号数据的群组推荐算法研究 被引量:7
4
作者 郭均鹏 宁静 史志奇 《计算机应用研究》 CSCD 北大核心 2013年第1期67-71,共5页
传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorf... 传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorff距离基础上,采用区间内部点数据的描述统计量,提出了一种全新的区间数距离度量方法,并利用这种距离对区间型符号数据描述的群组实施K-均值聚类,由此确定相似群组,最后通过最近邻的评分预测目标群组的评分。将这种全新的群组推荐算法与传统方法进行推荐精度与效率的对比实验,结果表明,在各种实验条件下,基于区间型符号数据的群组推荐算法均优于传统点数据的群组推荐算法。 展开更多
关键词 群组推荐 符号数据分析 聚类分析
下载PDF
一般分布区间型符号数据的K均值聚类方法 被引量:11
5
作者 郭均鹏 陈颖 李汶华 《管理科学学报》 CSSCI 北大核心 2013年第3期21-28,共8页
对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计... 对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计.基于Hausdorff距离,考虑区间数所包含个体的分布信息,提出了一种新的区间型符号数据距离度量.给出了一般分布的区间型符号数据K均值聚类算法.通过随机模拟试验对该方法进行了有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的K均值聚类算法有效性均优于均匀分布假设下的K均值聚类算法.最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势. 展开更多
关键词 区间数 一般分布 符号数据分析 聚类分析
下载PDF
一种海量数据的分析技术——符号数据分析及应用 被引量:19
6
作者 胡艳 王惠文 《北京航空航天大学学报(社会科学版)》 2004年第2期40-44,共5页
传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的... 传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的原始数据在不破坏其原有内在逻辑关系的前提下,可以进行变量和样本点空间的双重降维,并将传统的统计分析技术扩展到符号数据分析体系中。符号数据的方法体系是知识发现和数据管理领域的最新研究方向之一,目前在国内鲜有相关的研究资料。文章详细阐述了符号数据因素分析技术的原理和概念,并以中国股票市场为案例研究背景,结果表明,SDA因素分析技术对综合简化大规模多维数据系统是十分有效的。 展开更多
关键词 符号数据分析(sda) 海量数据 数据打包 双重降维 股票市场
下载PDF
一种基于符号数据的群体推荐算法 被引量:6
7
作者 郭均鹏 高成菊 赵旻昊 《系统工程学报》 CSCD 北大核心 2015年第1期127-134,共8页
基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和... 基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和消极子模型来表示.进而计算目标群体模型与目标项目积极子模型、消极子模型之间的相似度,最终产生推荐.选取为群体用户推荐美食作为实例,通过大众点评网收集用户评分数据,对文中算法进行评价,结果表明该算法能取得良好的推荐精度,且在群体较小及数据稀疏时,推荐质量明显优于传统基于点数据描述群体用户模型的协同过滤算法. 展开更多
关键词 符号数据分析 群体推荐 区间型符号数据 分布式符号数据
下载PDF
改进的基于符号数据的协同过滤推荐算法 被引量:3
8
作者 郭均鹏 陈莹莹 《计算机应用》 CSCD 北大核心 2011年第11期3060-3062,3067,共4页
随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数... 随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中。在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法。 展开更多
关键词 协同过滤 符号数据分析 奇异值分解 稀疏性 推荐系统
下载PDF
区间型符号数据回归分析及其应用 被引量:13
9
作者 李汶华 郭均鹏 《管理科学学报》 CSSCI 北大核心 2010年第4期38-43,共6页
介绍了符号数据分析方法的基本理论.针对一种最常用的符号数据——区间型符号数据,基于误差传递的理论,提出了区间回归分析的方法.方法包括了线性回归分析和可线性化的非线性回归分析两种情形.讨论了基于Hausdorff距离的区间数距离,基... 介绍了符号数据分析方法的基本理论.针对一种最常用的符号数据——区间型符号数据,基于误差传递的理论,提出了区间回归分析的方法.方法包括了线性回归分析和可线性化的非线性回归分析两种情形.讨论了基于Hausdorff距离的区间数距离,基于此定义了回归模型的评价指标.进行了方法的应用研究,选取沪深300指数与中信规模风格指数,从时间维上对其日内数据进行"数据打包",形成区间型符号数据;建立了区间线性回归分析模型,从全局上揭示了两类指数间的相关性.结论表明,与针对点数据的传统回归分析相比,区间型符号数据的回归分析方法不仅实现了样本空间的降维,而且有利于从整体上把握变量之间的内在关系. 展开更多
关键词 符号数据 回归分析 区间数 误差传递 指数
下载PDF
一种电力设备状态监测大数据的分布式联机分析处理方法 被引量:32
10
作者 王德文 周青 《中国电机工程学报》 EI CSCD 北大核心 2016年第19期5111-5121,5392,共12页
电力设备状态监测大数据分析是一个热点研究课题,对保障电力设备的安全稳定运行具有重要意义。联机分析处理(on-line analytical processing,OLAP)可以多角度、快速存取与分析数据,是实现电力设备状态监测大数据分析的一种重要技术手段... 电力设备状态监测大数据分析是一个热点研究课题,对保障电力设备的安全稳定运行具有重要意义。联机分析处理(on-line analytical processing,OLAP)可以多角度、快速存取与分析数据,是实现电力设备状态监测大数据分析的一种重要技术手段。通过分析大数据环境下的OLAP技术,设计一种电力设备状态监测大数据分析平台,给出3种分布式数据分析方案,包括基于Hive的关系型联机分析、基于Impala的关系型联机分析和基于HBase的多维联机分析。分布式关系型联机分析虽然在一定程度上满足电力企业的需求,但其数据模型中表之间频繁的连接操作,导致其出现性能瓶颈。针对分布式关系型联机分析数据模型连接操作开销大、查询速度慢等问题,提出了基于无连接层次编码的电力设备状态监测数据模型,对常规数据模型进行改进,把维表的层次信息进行编码存储到事实表中,减少连接操作,以优化性能。采用Hive和Impala等大数据分析工具,在不同规模监测数据集上对本模型的数据加载、上卷操作、存储开销等方面进行实验测试。实验结果表明,数据加载速度约是常规模型的42%,上卷执行时间比常规数据模型缩短40%至49%,存储开销大约比常规星型模型减少37%,验证了本方法的有效性与可行性,给电力设备状态监测大数据分析带来一种新的思路。 展开更多
关键词 状态监测 大数据 关系型联机分析 数据模型 层次编码
下载PDF
两种区间数据主成分分析方法的比较研究 被引量:2
11
作者 王惠文 李岩 关蓉 《北京航空航天大学学报(社会科学版)》 CSSCI 2011年第4期86-89,共4页
针对顶点主成分分析算法(VPCA)计算量会随着变量个数的增加而按指数速度增长的问题,Cazes P提出一种简化算法,通过直接计算VPCA的相关系数矩阵,可以消除大量的冗余计算,解决VPCA的维数灾难问题。文章通过对这两种方法的计算过程和计算... 针对顶点主成分分析算法(VPCA)计算量会随着变量个数的增加而按指数速度增长的问题,Cazes P提出一种简化算法,通过直接计算VPCA的相关系数矩阵,可以消除大量的冗余计算,解决VPCA的维数灾难问题。文章通过对这两种方法的计算过程和计算结果进行比较,说明这两种方法在计算结果上是完全等价的,但是,Cazes P提出的简化算法的计算过程更简单、所占据的存储空间更小、计算速度更快,实验分析进一步验证了理论分析的相关结论。 展开更多
关键词 符号数据分析 区间数据 主成分分析 VPCA 相关系数矩阵
下载PDF
精确的程序静态分析 被引量:36
12
作者 张健 《计算机学报》 EI CSCD 北大核心 2008年第9期1549-1553,共5页
程序的静态分析是程序语言和编译领域的一个重要研究方向,已经被研究了很多年.近年来,它也引起形式方法和软件工程领域的重视,被用于程序测试和正确性验证.文中从程序的语法特征、所关心的数据类型和程序性质等方面比较了一些静态分析技... 程序的静态分析是程序语言和编译领域的一个重要研究方向,已经被研究了很多年.近年来,它也引起形式方法和软件工程领域的重视,被用于程序测试和正确性验证.文中从程序的语法特征、所关心的数据类型和程序性质等方面比较了一些静态分析技术.着重描述基于路径的分析方法,特别是符号执行技术,讨论了程序路径可行性分析问题及其分类、复杂度.针对程序分析精度的一种量化指标,说明了其计算方法. 展开更多
关键词 静态分析 程序路径 符号执行 数据覆盖
下载PDF
考虑内部散点的区间型符号数据的回归分析 被引量:2
13
作者 郭均鹏 赵茹 李汶华 《管理科学学报》 CSSCI CSCD 北大核心 2018年第4期114-126,共13页
研究通过对样本"点"数据打包形成的区间型符号数据的回归分析.针对现有区间数回归分析只利用区间数的端点信息这一问题,分析如何充分利用原始的样本"点"数据信息,即区间数的内部散点信息.首先从理论上推导了当假设... 研究通过对样本"点"数据打包形成的区间型符号数据的回归分析.针对现有区间数回归分析只利用区间数的端点信息这一问题,分析如何充分利用原始的样本"点"数据信息,即区间数的内部散点信息.首先从理论上推导了当假设原始样本点数据误差项满足回归分析所假定的三条性质时,区间数据回归分析的误差项也满足这三条性质.然后,在考虑散点的区间型符号数据描述性统计量的基础上,提出了一种新的区间型符号数据回归分析的参数估计方法.随之给出了区间预测方法.最后选取常用的CCRM作为对比算法,分别通过随机模拟和实例分析,验证了文中方法的有效性. 展开更多
关键词 回归分析 区间型符号数据 描述统计量
下载PDF
数据挖掘中区间数据模糊聚类研究——基于Wasserstein测度 被引量:2
14
作者 李红 孙秋碧 《计算机工程与应用》 CSCD 2012年第12期24-28,37,共6页
针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的... 针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的优势。该算法在海量、堆积如山的数据挖掘中有着重要的实践意义。 展开更多
关键词 模糊聚类 区间数据 符号数据分析 自适应
下载PDF
区间型符号数据的特征选择方法 被引量:2
15
作者 郭崇慧 刘永超 《运筹与管理》 CSSCI CSCD 北大核心 2015年第1期67-74,共8页
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样... 对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。 展开更多
关键词 符号数据分析 特征选择 最近邻分类器 区间型数据
下载PDF
区间型符号数据的因子分析及其应用 被引量:1
16
作者 李汶华 郭均鹏 高峰 《管理工程学报》 CSSCI 北大核心 2009年第4期100-103,共4页
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到... 符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到因子得分的中点值。然后将半径样本阵按照误差传递公式,得到因子得分的极限误差。由因子得分的中点值和极限误差最终得到因子得分的区间值。最后以股票的市场综合表现评价问题为案例,进行了应用研究。 展开更多
关键词 符号数据分析 因子分析 区间数 误差分析 股票
下载PDF
基于路径信息的谓词关系分析 被引量:1
17
作者 沈立 王志英 鲁建壮 《电子学报》 EI CAS CSCD 北大核心 2004年第2期191-195,共5页
谓词执行技术能够将多个基本块合并为一个超块 ,扩大指令调度范围 ,开发更多的指令级并行 .但它也给编译优化带来一些新问题 ,使得传统的编译器在进行指令调度或寄存器分配等优化工作时往往只能得到保守的结果 .受所用谓词表示方法的限... 谓词执行技术能够将多个基本块合并为一个超块 ,扩大指令调度范围 ,开发更多的指令级并行 .但它也给编译优化带来一些新问题 ,使得传统的编译器在进行指令调度或寄存器分配等优化工作时往往只能得到保守的结果 .受所用谓词表示方法的限制 ,目前的谓词关系分析方法必须首先重构控制流信息 ,这就影响了编译优化的效果和效率 .本文提出了一种基于路径编码的谓词表示方法 ,将谓词定义信息转换为等价的域编码 ,并以此为基础实现了一个全局谓词关系分析子系统 .模拟结果表明 ,该子系统能够准确高效地实现全局谓词关系分析 ,在保证编译效率的同时 。 展开更多
关键词 谓词执行 谓词分析 路径
下载PDF
大尺度IP网络流量异常特征的多时间序列数据挖掘方法 被引量:2
18
作者 贺伟凇 胡光岷 《计算机应用研究》 CSCD 北大核心 2011年第3期1130-1132,1154,共4页
提出了一种大规模通信网络流量异常特征分析的多时间序列数据挖掘方法,把多个网络流量特征参数构成的时间序列作为一个整体进行分析研究,进行多时间序列数据挖掘产生网络流量异常相关的有效关联规则,对整个通信网络的安全威胁进行描述。... 提出了一种大规模通信网络流量异常特征分析的多时间序列数据挖掘方法,把多个网络流量特征参数构成的时间序列作为一个整体进行分析研究,进行多时间序列数据挖掘产生网络流量异常相关的有效关联规则,对整个通信网络的安全威胁进行描述。Abilene网络数据验证了该方法。 展开更多
关键词 符号时间序列分析 独立分量分析 多时间序列数据挖掘
下载PDF
基于支持向量机的软件缺陷预测模型 被引量:14
19
作者 王涛 李伟华 +1 位作者 刘尊 史豪斌 《西北工业大学学报》 EI CAS CSCD 北大核心 2011年第6期864-870,共7页
软件缺陷预测在软件系统开发的各个阶段发挥着极为重要的作用。利用机器学习的相关方法建立更好的预测模型已经被广泛研究。文章分析了支持向量机SVM作为二值分类模型应用到软件缺陷预测中的实现方法,构造了基于SVM的可迭代增强的缺陷... 软件缺陷预测在软件系统开发的各个阶段发挥着极为重要的作用。利用机器学习的相关方法建立更好的预测模型已经被广泛研究。文章分析了支持向量机SVM作为二值分类模型应用到软件缺陷预测中的实现方法,构造了基于SVM的可迭代增强的缺陷预测模型SVM-DP。在13个基准数据集上开展比较实验,定量地分析了应用各种核函数对SVM-DP模型性能的影响。实验结果显示,应用线性内积核函数的SVM-DP具有最优的预测性能。同时,在与J48的比较实验中,最高超过J48预测模型20%的性能进一步证明了SVM-DP模型应用于软件缺陷预测的有效性。 展开更多
关键词 软件缺陷预测 软件度量 支持向量机
下载PDF
铁路货车技术管理信息系统平台的优化研究 被引量:1
20
作者 寇玮华 徐扬 《中国铁道科学》 EI CAS CSCD 北大核心 2004年第3期115-121,共7页
针对铁路货车定检、施修、调度、技术管理等方面的工作特点,提出铁路货车技术管理信息系统(HMIS)平台。HMIS平台分为四个分平台,三个层次。根据平台网络体系、逻辑结构、数据结构进行归类分析。车间级分平台是货车技术数据的起始点,主... 针对铁路货车定检、施修、调度、技术管理等方面的工作特点,提出铁路货车技术管理信息系统(HMIS)平台。HMIS平台分为四个分平台,三个层次。根据平台网络体系、逻辑结构、数据结构进行归类分析。车间级分平台是货车技术数据的起始点,主要包括运用子系统、站修子系统、段修子系统、修配子系统、轮轴子系统。结合编码规范、系统特点及现场情况,提出故障略层快速定位算法。 展开更多
关键词 货车运用 铁路货车技术管理信息系统(HMIS) 故障编码 系统优化
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部