期刊文献+
共找到85篇文章
< 1 2 5 >
每页显示 20 50 100
基于中心对数比变换的分布型符号数据时间序列建模研究
1
作者 陈梅玲 俞翰君 《统计与信息论坛》 北大核心 2024年第6期3-14,共12页
针对分布型符号数据线性运算不封闭的问题,提出了一种新的分布型符号数据时间序列模型。分布型符号数据分析为处理和分析大规模数据提供了一种全新而有效的思想,具有广泛的应用前景。然而由于表征分布型数据单元为概率分布函数,其特殊... 针对分布型符号数据线性运算不封闭的问题,提出了一种新的分布型符号数据时间序列模型。分布型符号数据分析为处理和分析大规模数据提供了一种全新而有效的思想,具有广泛的应用前景。然而由于表征分布型数据单元为概率分布函数,其特殊表达形式和内在约束导致缺乏合适的运算规则,极大地限制了统计技术的灵活运用。为此,采用中心对数比变换方法,先将表征分布型数据单元的概率密度函数等距变换成普通函数,变换后的函数可以采用函数空间中的线性运算和内积运算,在保持样本空间形态不发生改变的前提下,有效克服了概率分布函数内在约束的影响。进一步提出了分布型时间序列数据的模型识别和参数估计方法,并通过仿真实验和实际数据验证了所提模型方法的合理性和有效性。 展开更多
关键词 符号数据 分布型数据 中心对数比变换 时间序列 贝叶斯空间
下载PDF
一种基于符号数据的群体推荐算法 被引量:6
2
作者 郭均鹏 高成菊 赵旻昊 《系统工程学报》 CSCD 北大核心 2015年第1期127-134,共8页
基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和... 基于符号数据分析所具有的能够有效地对海量数据进行降维并从整体上把握样本属性的优势,设计了基于区间型和分布式符号数据的模型建立方法,分别建立符号数据描述的目标群体用户模型和目标项目模型,并将目标项目模型分解为积极子模型和消极子模型来表示.进而计算目标群体模型与目标项目积极子模型、消极子模型之间的相似度,最终产生推荐.选取为群体用户推荐美食作为实例,通过大众点评网收集用户评分数据,对文中算法进行评价,结果表明该算法能取得良好的推荐精度,且在群体较小及数据稀疏时,推荐质量明显优于传统基于点数据描述群体用户模型的协同过滤算法. 展开更多
关键词 符号数据分析 群体推荐 区间型符号数据 分布式符号数据
下载PDF
一般分布区间型符号数据的K均值聚类方法 被引量:11
3
作者 郭均鹏 陈颖 李汶华 《管理科学学报》 CSSCI 北大核心 2013年第3期21-28,共8页
对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计... 对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计.基于Hausdorff距离,考虑区间数所包含个体的分布信息,提出了一种新的区间型符号数据距离度量.给出了一般分布的区间型符号数据K均值聚类算法.通过随机模拟试验对该方法进行了有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的K均值聚类算法有效性均优于均匀分布假设下的K均值聚类算法.最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势. 展开更多
关键词 区间数 一般分布 符号数据分析 聚类分析
下载PDF
基于区间型符号数据的群组推荐算法研究 被引量:7
4
作者 郭均鹏 宁静 史志奇 《计算机应用研究》 CSCD 北大核心 2013年第1期67-71,共5页
传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorf... 传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorff距离基础上,采用区间内部点数据的描述统计量,提出了一种全新的区间数距离度量方法,并利用这种距离对区间型符号数据描述的群组实施K-均值聚类,由此确定相似群组,最后通过最近邻的评分预测目标群组的评分。将这种全新的群组推荐算法与传统方法进行推荐精度与效率的对比实验,结果表明,在各种实验条件下,基于区间型符号数据的群组推荐算法均优于传统点数据的群组推荐算法。 展开更多
关键词 群组推荐 符号数据分析 聚类分析
下载PDF
基于符号数据与非负矩阵分解法的混合推荐算法 被引量:6
5
作者 郭均鹏 王启鹏 +1 位作者 宁静 李嫒嫒 《系统管理学报》 CSSCI 北大核心 2015年第3期372-378,共7页
针对现有推荐算法在处理海量数据时效率和精确度低下的问题,提出一种将基于内容的推荐算法与基于项目的协同过滤算法相结合的新的混合推荐算法。首先引入符号数据分析方法,使用模态符号数据对项目建模,同时针对评分矩阵的超高维及稀疏... 针对现有推荐算法在处理海量数据时效率和精确度低下的问题,提出一种将基于内容的推荐算法与基于项目的协同过滤算法相结合的新的混合推荐算法。首先引入符号数据分析方法,使用模态符号数据对项目建模,同时针对评分矩阵的超高维及稀疏性问题加入非负矩阵分解算法,对项目的特征矩阵进行有效"平滑",以此为基础计算项目之间的相似性,进而完成混合推荐。基于MOVEILENS数据的实验结果表明,本文提出的混合推荐算法与传统的基于项目的协同过滤算法相比,在相似性计算上具有更高的效率,同时在应对数据稀疏性及新用户问题时,具有更高的推荐精度。 展开更多
关键词 符号数据 混合推荐算法 评分相似度 非负矩阵分解
下载PDF
区间型符号数据回归分析及其应用 被引量:13
6
作者 李汶华 郭均鹏 《管理科学学报》 CSSCI 北大核心 2010年第4期38-43,共6页
介绍了符号数据分析方法的基本理论.针对一种最常用的符号数据——区间型符号数据,基于误差传递的理论,提出了区间回归分析的方法.方法包括了线性回归分析和可线性化的非线性回归分析两种情形.讨论了基于Hausdorff距离的区间数距离,基... 介绍了符号数据分析方法的基本理论.针对一种最常用的符号数据——区间型符号数据,基于误差传递的理论,提出了区间回归分析的方法.方法包括了线性回归分析和可线性化的非线性回归分析两种情形.讨论了基于Hausdorff距离的区间数距离,基于此定义了回归模型的评价指标.进行了方法的应用研究,选取沪深300指数与中信规模风格指数,从时间维上对其日内数据进行"数据打包",形成区间型符号数据;建立了区间线性回归分析模型,从全局上揭示了两类指数间的相关性.结论表明,与针对点数据的传统回归分析相比,区间型符号数据的回归分析方法不仅实现了样本空间的降维,而且有利于从整体上把握变量之间的内在关系. 展开更多
关键词 符号数据 回归分析 区间数 误差传递 指数
下载PDF
一种符号型增量数据标签算法 被引量:3
7
作者 李艳红 李德玉 王素格 《计算机科学》 CSCD 北大核心 2015年第6期223-227,共5页
数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性。为此,将簇代表定义为簇中所有属... 数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性。为此,将簇代表定义为簇中所有属性的属性值及其在簇中的频率构成的列表,用信息熵的变化来定义"点-簇"不相似性。基于此不相似性度量,设计了一个符号型增量数据标签算法来分配无标记数据到恰当的簇。在公开数据集和文本语料上的对比实验表明,该数据标签算法不但数据标记精度高、时间开销小,而且有较好的可伸缩性。 展开更多
关键词 聚类 数据标签 增量数据 符号数据 信息熵
下载PDF
一种海量数据的分析技术——符号数据分析及应用 被引量:19
8
作者 胡艳 王惠文 《北京航空航天大学学报(社会科学版)》 2004年第2期40-44,共5页
传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的... 传统的统计分析方法在处理海量数据方面存在很大的局限性。为了解决这一问题,符号数据分析(symbolicdataanalysis,SDA)方法被提出并得到了迅速的发展。SDA方法对传统的数据概念做了本质性的扩张,运用'数据打包'的理念,对海量的原始数据在不破坏其原有内在逻辑关系的前提下,可以进行变量和样本点空间的双重降维,并将传统的统计分析技术扩展到符号数据分析体系中。符号数据的方法体系是知识发现和数据管理领域的最新研究方向之一,目前在国内鲜有相关的研究资料。文章详细阐述了符号数据因素分析技术的原理和概念,并以中国股票市场为案例研究背景,结果表明,SDA因素分析技术对综合简化大规模多维数据系统是十分有效的。 展开更多
关键词 符号数据分析(SDA) 海量数据 数据打包 双重降维 股票市场
下载PDF
考虑内部散点的区间型符号数据的回归分析 被引量:2
9
作者 郭均鹏 赵茹 李汶华 《管理科学学报》 CSSCI CSCD 北大核心 2018年第4期114-126,共13页
研究通过对样本"点"数据打包形成的区间型符号数据的回归分析.针对现有区间数回归分析只利用区间数的端点信息这一问题,分析如何充分利用原始的样本"点"数据信息,即区间数的内部散点信息.首先从理论上推导了当假设... 研究通过对样本"点"数据打包形成的区间型符号数据的回归分析.针对现有区间数回归分析只利用区间数的端点信息这一问题,分析如何充分利用原始的样本"点"数据信息,即区间数的内部散点信息.首先从理论上推导了当假设原始样本点数据误差项满足回归分析所假定的三条性质时,区间数据回归分析的误差项也满足这三条性质.然后,在考虑散点的区间型符号数据描述性统计量的基础上,提出了一种新的区间型符号数据回归分析的参数估计方法.随之给出了区间预测方法.最后选取常用的CCRM作为对比算法,分别通过随机模拟和实例分析,验证了文中方法的有效性. 展开更多
关键词 回归分析 区间型符号数据 描述统计量
下载PDF
改进的基于符号数据的协同过滤推荐算法 被引量:3
10
作者 郭均鹏 陈莹莹 《计算机应用》 CSCD 北大核心 2011年第11期3060-3062,3067,共4页
随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数... 随着用户和资源种类的不断增加,评价矩阵的稀疏性问题越来越突出,严重影响了推荐系统的推荐质量。奇异值分解(SVD)是一种对数据进行降维处理的方法,符号数据分析(SDA)是一种处理海量数据的全新数据分析思路。提出一种改进的基于符号数据的协同过滤推荐算法,即将奇异值分解和符号数据分析方法结合起来运用到推荐系统中。在EachMovie数据库集上的实验结果表明该算法在数据稀疏时的推荐质量明显优于传统的推荐算法。 展开更多
关键词 协同过滤 符号数据分析 奇异值分解 稀疏性 推荐系统
下载PDF
基于PostScript成像模型的线状地图符号数据结构 被引量:10
11
作者 吴明光 陈泰生 +3 位作者 檀姗姗 骆骐 闾国年 盛业华 《测绘学报》 EI CSCD 北大核心 2011年第5期662-667,共6页
针对线状地图符号构图模式和绘制效率,分析比较单元循环配置、线型叠加以及纯函数绘制三类典型线状地图符号数据结构优缺点。引入PostScript成像模型中"路径"数据结构,实现对任意复杂线状符号控制轴线的统一描述,设计基于标... 针对线状地图符号构图模式和绘制效率,分析比较单元循环配置、线型叠加以及纯函数绘制三类典型线状地图符号数据结构优缺点。引入PostScript成像模型中"路径"数据结构,实现对任意复杂线状符号控制轴线的统一描述,设计基于标记顶点序列的"路径"结构化存储方法;设计颜色笔划、图元笔划和栅格笔划三种绘制方法,可以同时支持单元循环配置和线型叠加两种线状符号构图模式,支持卡通类、艺术类线状地图符号的设计;构建线状地图符号设计器原型系统并进行效率对比和多介质输出试验。试验表明,该数据结构能够针对线状符号的构图特点而进行灵活分解绘制,保证最优的符号绘制效率,能够支持复杂线状符号的设计,同时支持地图符号的屏幕显示、网络发布和纸质印刷。 展开更多
关键词 线状地图符号 PostScript成像模型 符号数据结构 符号绘制效率 多介质输出
下载PDF
区间型符号数据的因子分析及其应用 被引量:1
12
作者 李汶华 郭均鹏 高峰 《管理工程学报》 CSSCI 北大核心 2009年第4期100-103,共4页
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到... 符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。基于误差分析理论,研究针对区间数据的因子分析方法。将区间数看作一个由中点和半径构成的有序偶,并将半径视为区间数的极限误差。对中点样本阵进行因子分析,得到因子得分的中点值。然后将半径样本阵按照误差传递公式,得到因子得分的极限误差。由因子得分的中点值和极限误差最终得到因子得分的区间值。最后以股票的市场综合表现评价问题为案例,进行了应用研究。 展开更多
关键词 符号数据分析 因子分析 区间数 误差分析 股票
下载PDF
符号数据的无监督学习:一种空间变换方法 被引量:2
13
作者 王建新 钱宇华 《计算机科学》 CSCD 北大核心 2016年第1期89-93,121,共6页
近年来符号数据的无监督学习在模式识别、机器学习、数据挖掘和知识发现等诸多领域扮演着越来越重要的角色。然而现有的针对符号数据的聚类算法(经典的K-modes系列算法等),相比数值型数据的聚类算法,在性能方面仍然有很大的提升空间。... 近年来符号数据的无监督学习在模式识别、机器学习、数据挖掘和知识发现等诸多领域扮演着越来越重要的角色。然而现有的针对符号数据的聚类算法(经典的K-modes系列算法等),相比数值型数据的聚类算法,在性能方面仍然有很大的提升空间。其根本原因在于符号数据缺乏类似数值数据那样清晰的空间结构。为了能够有效地发掘符号数据内在的空间结构,采用了一种全新的数据表示方案:空间变换方法。该方法将符号数据映射到相应的由原来的属性组成的新的维度的欧氏空间中。在这一框架的基础上,为了找到符号数据更有代表性的模式,结合CarreiraPerpin提出的K-modes算法进行无监督学习。在9个常用的UCI符号数据集上进行了测试,与传统的符号数据聚类算法进行了实验比较,结果表明几乎在所有的数据集上提出的方法都是更加有效的。 展开更多
关键词 符号数据 数据表示方案 空间变换
下载PDF
区间型符号数据的特征选择方法 被引量:2
14
作者 郭崇慧 刘永超 《运筹与管理》 CSSCI CSCD 北大核心 2015年第1期67-74,共8页
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样... 对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。 展开更多
关键词 符号数据分析 特征选择 最近邻分类器 区间型数据
下载PDF
基于空间结构的符号数据仿射传播算法 被引量:3
15
作者 王齐 钱宇华 李飞江 《模式识别与人工智能》 EI CSCD 北大核心 2016年第12期1132-1139,共8页
由于符号型数据缺乏清晰的空间结构,很难构造一种合理的相似性度量,从而使诸多数值型聚类算法难以推广至符号型数据聚类.基于此种情况,文中引入一种空间结构表示方法,把符号型数据转化为数值型数据,能够在保持原符号型数据的结构特征的... 由于符号型数据缺乏清晰的空间结构,很难构造一种合理的相似性度量,从而使诸多数值型聚类算法难以推广至符号型数据聚类.基于此种情况,文中引入一种空间结构表示方法,把符号型数据转化为数值型数据,能够在保持原符号型数据的结构特征的基础上重新构造样本之间的相似度.基于此方法,将仿射传播(AP)聚类算法迁移至符号数据聚类中,提出基于空间结构的符号数据AP算法(SBAP).在UCI数据集中若干符号型数据集上的实验表明,SBAP可以使AP算法有效处理符号型数据聚类问题,并且可以提升算法性能. 展开更多
关键词 聚类 符号数据 仿射传播(AP) 空间结构 相似度
下载PDF
符号数据典型相关分析技术及其在股市分析中的应用
16
作者 王立元 《系统工程》 CSCD 北大核心 2004年第8期91-95,共5页
采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis,SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析。研究结果表明,中国股市财务状况与市场表现相关... 采用一种针对大规模复杂数据的分析技术——符号数据分析方法(SymbolicDataAnalysis,SDA),以中信证券风格指数作为研究对象,对2002年中国股票市场的财务指标与市场表现进行典型相关分析。研究结果表明,中国股市财务状况与市场表现相关性明显,上市公司的收益状况、偿债能力、资金管理能力及价值/成长因素决定股票的运行状况,不同风格股票在财务-市场关系方面差异性显著,行业特征明显。通过分析可以看到,运用符号数据对中国股市运行特征进行的分析结论与客观现实非常吻合,从而证明使用符号数据的典型相关分析技术对大规模多维动态数据系统进行统计分析是十分有效的。 展开更多
关键词 符号数据分析(SDA) 典型相关分析 股票市场 风格指数
下载PDF
大数据背景下的规划产业选择研究——基于区间型符号数据因子分析
17
作者 高峰 《未来与发展》 2016年第3期44-48,共5页
产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足... 产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足。本研究阐述了区间分析在科技规划编制中的优势,介绍了区间型符号数据因子分析方法,并从海量企业基础数据出发,对天津科技规划中产业选择做了实证研究。 展开更多
关键词 数据 区间型符号数据因子分析 规划 产业选择
下载PDF
一种基于符号关系图的快速符号数据聚类算法 被引量:1
18
作者 张岩金 白亮 《计算机科学》 CSCD 北大核心 2021年第4期111-116,共6页
由于在实际应用中有大量的符号数据生成,符号数据聚类成为了聚类分析的一个重要研究领域。目前,已有许多符号数据聚类算法被提出,但将它们应用于大数据环境时,仍然存在计算成本高、运行速度慢等问题。文中提出了一种基于符号关系图的快... 由于在实际应用中有大量的符号数据生成,符号数据聚类成为了聚类分析的一个重要研究领域。目前,已有许多符号数据聚类算法被提出,但将它们应用于大数据环境时,仍然存在计算成本高、运行速度慢等问题。文中提出了一种基于符号关系图的快速符号数据聚类算法。该算法使用符号关系图替代原始数据,缩小数据集的规模,有效地解决了这一问题。大量的实验分析显示新算法相比其他算法是有效的。 展开更多
关键词 符号数据 相似性度量 关系图 数据挖掘 聚类
下载PDF
基于关联关系分析的符号数据分类方法 被引量:1
19
作者 付康安 郭虎升 王文剑 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第4期815-822,共8页
由于符号属性数据缺乏固有的几何特性,不能简单地将现有的数值属性数据分类算法应用于符号属性数据.为了提高符号属性数据的性能,提出一种基于关联关系分析的支持向量机分类方法(Support Vector Machine Classification Approach Based ... 由于符号属性数据缺乏固有的几何特性,不能简单地将现有的数值属性数据分类算法应用于符号属性数据.为了提高符号属性数据的性能,提出一种基于关联关系分析的支持向量机分类方法(Support Vector Machine Classification Approach Based on Correlation Analysis,CA_SVM).通过分析属性值与标签之间的相关性,得到属性值对标签的影响因子;然后结合属性值在类内出现的频率,使得所有原始符号数据下的属性值在不失信息的情况下转换成数值型数据;转换后的数据既可以体现属性值与标签之间的关联关系,也可以有效地表示相同属性下属性值之间的距离;最后用支持向量机(Support Vector Machine,SVM)进行分类.在标准UCI数据集上的实验结果表明,CA_SVM模型能够提高分类精度. 展开更多
关键词 符号属性数据 关联关系分析 支持向量机 分类方法
下载PDF
区间符号数据在股市特征中的实证分析
20
作者 安宁 孟洁 《统计与决策》 CSSCI 北大核心 2014年第20期165-168,共4页
文章采用区间符号数据的主成分分析法对2013年中国股票市场整个大盘走势进行了详尽分析研究,同时也打破了中信标普风格指数的编制方法,使得根据该方法得出的股票分类结果更加科学、合理。在指标选择上也与以往方法有所区别,在详细分析... 文章采用区间符号数据的主成分分析法对2013年中国股票市场整个大盘走势进行了详尽分析研究,同时也打破了中信标普风格指数的编制方法,使得根据该方法得出的股票分类结果更加科学、合理。在指标选择上也与以往方法有所区别,在详细分析财务报表后,选择了更能涵盖上市公司特征的指标。从模型中使用的符号数据分析方法来分析股票市场的中国特色,得到的结论与客观实际相一致,说明符号数据分析方法对现时代大数据分析处理行之有效,而且十分方便。 展开更多
关键词 区间型符号数据 主成分 中信标普中国风格指数分类
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部