期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
统计的出世及入世观
1
作者 谢邦昌 《数据》 2008年第5期52-53,共2页
统计掌握的是趋势,它能告诉你在不同时间的不同变量有什么不同的看法,模式如何随之修正,进而掌握这个趋势,作出比较正确的判断,这不仅仅是统计人的工作与职责,更是统计人的人生观。
关键词 统计人 入世 出世 人生观
下载PDF
数据挖掘中的关联规则 被引量:21
2
作者 戴稳胜 匡宏波 谢邦昌 《统计研究》 CSSCI 北大核心 2002年第8期40-42,共3页
The paper describes the classification of relationship rule and its effects judging standards and the realization procedure through computers.The paper fully introduces to the relevant knowledge about relationship rule.
关键词 数据挖掘 关联规则 支持度 置信度 增益 统计
下载PDF
主成分聚类分析有效性的思考 被引量:46
3
作者 王德青 朱建平 谢邦昌 《统计研究》 CSSCI 北大核心 2012年第11期84-87,共4页
本文针对经典聚类分析和普通主成分聚类分析极端情形下的失效问题展开讨论,通过定义客观赋权的主成分距离为分类统计量,并以实证检验取得良好效果为依据,有效地解决了主成分聚类分析在极端情形下所不能揭示的问题。
关键词 分类 主成分聚类分析 极端情形
下载PDF
Logistic回归的双层变量选择研究 被引量:13
4
作者 王小燕 方匡南 谢邦昌 《统计研究》 CSSCI 北大核心 2014年第9期107-112,共6页
变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构进行筛选,实现... 变量选择是统计建模的重要环节,选择合适的变量可以建立结构简单、预测精准的稳健模型。本文在logistic回归下提出了新的双层变量选择惩罚方法——adaptive Sparse Group Lasso(adSGL),其独特之处在于基于变量的分组结构进行筛选,实现了组内和组间双层选择。该方法的优点是对各单个系数和组系数采取不同程度的惩罚,避免了过度惩罚大系数,从而提高了模型的估计和预测精度。求解的难点是惩罚似然函数不是严格凸出的,因此本文基于组坐标下降法求解模型,并建立了调整参数的选取准则。模拟分析表明,对比现有代表性方法 Sparse Group Lasso、Group Lasso及Lasso,adSGL法不仅提高了双层选择精度,而且降低了模型误差。最后,本文将adSGL法应用于信用卡信用评分研究,与logistic回归相比,其具有更高的分类精度和稳健性。 展开更多
关键词 变量选择 群组变量 惩罚似然 信用评分
下载PDF
如何选择度量金融风险的指标 被引量:5
5
作者 崔嵬 张尧庭 +1 位作者 朱世武 谢邦昌 《统计研究》 CSSCI 北大核心 2003年第6期52-55,56,共5页
张尧庭教授是我国著名的统计学家 ,多年来一直对本刊给予大力支持。现在张尧庭教授正在病榻上与病魔进行搏斗。为了表达我们对张教授的敬意 ,本刊特在第 6、7、8期连续刊出张教授与其他学者合作的三篇文章。
关键词 金融风险 VAR 连接函数 度量指标 风险管理 Delta常态法 蒙地卡罗模拟法
下载PDF
一种随机森林的混合算法 被引量:12
6
作者 曹正凤 谢邦昌 纪宏 《统计与决策》 CSSCI 北大核心 2014年第4期7-9,共3页
随机森林(RF)是众多分类算法中精确度较高的算法,但其精确度还有提升的需求。文章通过分析C4.5算法和CART算法的计算过程,比较了两者的异同点,提出了一种新的混合随机森林算法,并使用公共的UCI数据集进行实证分析,实验数据表明该算法可... 随机森林(RF)是众多分类算法中精确度较高的算法,但其精确度还有提升的需求。文章通过分析C4.5算法和CART算法的计算过程,比较了两者的异同点,提出了一种新的混合随机森林算法,并使用公共的UCI数据集进行实证分析,实验数据表明该算法可以提高随机森林的精确度。从而,使随机森林算法的应用领域得到了扩大。 展开更多
关键词 随机森林 混合算法 精确度
下载PDF
使用随机森林算法实现优质股票的选择 被引量:10
7
作者 曹正凤 纪宏 谢邦昌 《首都经济贸易大学学报》 北大核心 2014年第2期21-27,共7页
文章通过比较分析价值策略和成长策略,提出了以价值成长投资策略(GARP)理念为基础的选股模型指标体系,选用了2012年1月至2013年2月间360多支股票的4406个样本数据,通过等频算法对数据进行离散化预处理后,使用随机森林算法实现了较高正... 文章通过比较分析价值策略和成长策略,提出了以价值成长投资策略(GARP)理念为基础的选股模型指标体系,选用了2012年1月至2013年2月间360多支股票的4406个样本数据,通过等频算法对数据进行离散化预处理后,使用随机森林算法实现了较高正确率的股票分类,投资者可以据此判断是否继续持有股票。通过分析优选后的股票在行业平均收益、最值方面的实际表现,验证了该量化选股模型性能优异。 展开更多
关键词 随机森林 股票选择 股票投资 价值成长投资策略
下载PDF
数据挖掘技术在保险客户理赔分析中的应用 被引量:4
8
作者 陈希 李迪安 +2 位作者 高星 陈帅 谢邦昌 《统计与决策》 CSSCI 北大核心 2010年第4期154-158,共5页
利用数据挖掘技术对海量保险业务数据进行风险分析,通过交叉频数分析确定保单中风险较大的因素,为管理决策提供依据;将决策树、支持向量机、逻辑斯蒂回归和贝叶斯网络四种数据挖掘算法用于保户分类,提取高风险保户的潜在特征,挖掘理赔... 利用数据挖掘技术对海量保险业务数据进行风险分析,通过交叉频数分析确定保单中风险较大的因素,为管理决策提供依据;将决策树、支持向量机、逻辑斯蒂回归和贝叶斯网络四种数据挖掘算法用于保户分类,提取高风险保户的潜在特征,挖掘理赔概率较高的保户群,以指导保险公司的营销工作。 展开更多
关键词 数据挖掘 高风险保户 理赔分析
下载PDF
区域金融生态环境评价与实证 被引量:29
9
作者 金欣雪 谢邦昌 《统计与决策》 CSSCI 北大核心 2014年第15期160-162,共3页
首先依据金融生态环境理论的研究成果,建立了两岸金融生态环境的评价指标体系,从金融发展指标和综合环境指标两方面,分别进行动态分析和对比分析,最后运用灰色关联度法进行了总体分析,综合评价了两岸十个省市的总体金融生态环境。
关键词 金融生态 主成分分析 灰色关联度
下载PDF
中国城镇家庭消费不平等分布测度研究 被引量:16
10
作者 谢邦昌 么海亮 《商业经济与管理》 CSSCI 北大核心 2013年第1期79-86,共8页
文章基于中国跨省区城镇家庭调查数据,本文对我国城镇家庭消费与收入进行了不平等指数测度;采用适应性核密度估计与相对分布法模拟了两阶段城镇家庭消费的分布情况与变动趋势。研究结果表明,我国城镇家庭消费不平等与收入不平等的变化... 文章基于中国跨省区城镇家庭调查数据,本文对我国城镇家庭消费与收入进行了不平等指数测度;采用适应性核密度估计与相对分布法模拟了两阶段城镇家庭消费的分布情况与变动趋势。研究结果表明,我国城镇家庭消费不平等与收入不平等的变化趋势具有一致性,消费不平等程度高于收入不平等;随着我国经济的发展,我国城镇家庭消费的整体水平得到提高,中高消费水平家庭比重不断增加,其中高消费家庭的比例增加更为显著,消费不平等呈现逐渐增加的趋势。 展开更多
关键词 城镇家庭 消费不平等 适应性核密度估计 相对分布法
下载PDF
数据挖掘与商业智能的现况及未来发展 被引量:15
11
作者 谢邦昌 李扬 《统计与信息论坛》 CSSCI 2008年第5期94-96,共3页
随着商业数据量的快速增加,能够帮助企业从数据中寻找决策支持的工具越来越受到重视。在统计学等多学科支撑下,数据挖掘与商业智能将发挥越来越重要的作用。
关键词 数据挖掘 商业智能 决策
下载PDF
用于分类的随机森林和Bagging分类树比较 被引量:17
12
作者 马景义 谢邦昌 《统计与信息论坛》 CSSCI 2010年第10期18-22,共5页
借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分... 借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。 展开更多
关键词 组合方法 随机森林 Bagging分类树
下载PDF
数据挖掘中关联规则的提升及其应用 被引量:8
13
作者 朱建平 谢邦昌 《统计研究》 CSSCI 北大核心 2004年第12期34-39,共6页
The paper explores the problems of application of association rule of data mining.
关键词 关联规则 数据挖掘 提升
下载PDF
数据挖掘在老龄人口健康调查中的应用 被引量:3
14
作者 朱建平 戴颖 谢邦昌 《统计与信息论坛》 CSSCI 2009年第10期74-78,共5页
研究高龄老人的问题,对实现健康老龄化具有重要的意义,也会填补关于高龄老人信息的空白。在入户调查数据的基础上,用聚类分析、神经网络、决策树、逻辑斯蒂回归等数据挖掘技术,对老人的思维状况、日常活动能力和户外活动等基本方面进行... 研究高龄老人的问题,对实现健康老龄化具有重要的意义,也会填补关于高龄老人信息的空白。在入户调查数据的基础上,用聚类分析、神经网络、决策树、逻辑斯蒂回归等数据挖掘技术,对老人的思维状况、日常活动能力和户外活动等基本方面进行数据建模分析。针对影响老龄人思维能力和身体健康的主要因素,应加快老年人服务机制和福利设施建设,创造老年人就业机会,开展老年人再教育。 展开更多
关键词 老龄化 数据挖掘 建模分析
下载PDF
基于Bayes概率边界域的粗集分类方法及其在高频数据中的应用 被引量:2
15
作者 来升强 谢邦昌 朱建平 《统计研究》 CSSCI 北大核心 2010年第3期76-82,共7页
作为一种近似处理的工具,粗集主要用于不确定情况下的决策分析,并且不需要任何事先的数据假定。但当前的主流粗集分类方法仍然需要先经过离散化的步骤,这就损失了数值型变量提供的高质量信息。本文对隶属函数重新加以概率定义,并提出了... 作为一种近似处理的工具,粗集主要用于不确定情况下的决策分析,并且不需要任何事先的数据假定。但当前的主流粗集分类方法仍然需要先经过离散化的步骤,这就损失了数值型变量提供的高质量信息。本文对隶属函数重新加以概率定义,并提出了一种基于Bayes概率边界域的粗集分类技术,比较好地解决了当前粗集方法所面临的数值型属性分类的不适应、分类规则不完备等一系列问题。 展开更多
关键词 可变精度粗糙集 Bayes边界域 高频数据
下载PDF
数据挖掘在投资理财意识调查分析中的应用 被引量:2
16
作者 何海鹰 朱建平 +1 位作者 谢邦昌 陈铮 《统计与信息论坛》 CSSCI 2008年第9期85-89,共5页
金融机构对于客户的挖掘和分类有利于挖掘潜在客户和做出适当的营销决策。将决策树、逻辑斯蒂回归和贝氏机率分类算法用于挖掘购买股票、美金和期货的客户,同时用其分析被访者对不同金融产品的交叉购买行为,为金融机构的交叉营销提供依据。
关键词 数据挖掘 决策树 聚类分析
下载PDF
金融危机前后中信行业指数联动效应及其社团结构比较 被引量:3
17
作者 谢邦昌 游涛 《商业经济与管理》 CSSCI 北大核心 2015年第1期80-87,共8页
文章采用平面最大过滤图和Info Map算法研究中信行业指数网络在金融危机前、中、后三个阶段的联动效应及其社团结构。研究结果表明,三个阶段的指数网络都存在小世界性质,且危机期间的网络联动效应最强;社团结构在危机期间有相互融合的... 文章采用平面最大过滤图和Info Map算法研究中信行业指数网络在金融危机前、中、后三个阶段的联动效应及其社团结构。研究结果表明,三个阶段的指数网络都存在小世界性质,且危机期间的网络联动效应最强;社团结构在危机期间有相互融合的整体趋势即网络变得更加紧密;社团中核心节点存在局部影响优势,某些边缘节点间存在局部强联动效应。 展开更多
关键词 中信行业指数 平面最大过滤图 社团结构 联动效应
下载PDF
数据挖掘在保险业中的应用 被引量:2
18
作者 谢邦昌 王黎明 《统计与信息论坛》 CSSCI 2009年第11期79-82,91,共5页
在现代保险业中,通过数据挖掘技术的应用,从大量纷繁复杂的保户资料中,分析保户特性,进行市场细分,甄别高风险理赔人群,为保险公司选择目标客户提供决策依据。以保险资料为基础,应用数据挖掘技术进行聚类、决策树分类、类神经网络建模以... 在现代保险业中,通过数据挖掘技术的应用,从大量纷繁复杂的保户资料中,分析保户特性,进行市场细分,甄别高风险理赔人群,为保险公司选择目标客户提供决策依据。以保险资料为基础,应用数据挖掘技术进行聚类、决策树分类、类神经网络建模以及Logistic回归,划分客户群体,分析高风险理赔保户群体特征,为保险公司规避理赔风险提供决策依据。 展开更多
关键词 聚类分析 决策树 类神经网络 LOGISTIC回归
下载PDF
L_1和L_2规则化趋势滤波的稳健估计 被引量:1
19
作者 谢邦昌 秦磊 《商业经济与管理》 CSSCI 北大核心 2013年第8期84-90,97,共8页
当时间序列中包含异常值时,L1和L2规则化趋势滤波不能有效地从中提取趋势成分,因此,文章从稳健性角度出发,用Huber损失函数替代最小二乘损失函数,使用凸优化方法进行求解,得到L1和L2规则化趋势滤波的稳健估计。模拟分析显示,稳健估计量... 当时间序列中包含异常值时,L1和L2规则化趋势滤波不能有效地从中提取趋势成分,因此,文章从稳健性角度出发,用Huber损失函数替代最小二乘损失函数,使用凸优化方法进行求解,得到L1和L2规则化趋势滤波的稳健估计。模拟分析显示,稳健估计量可以很好地抵制异常值的干扰。这种方法可以运用在异常值较多的金融数据中,得到市场趋势的稳健估计。 展开更多
关键词 L1和L2规则化趋势滤波 Huber损失函数 稳健估计 金融数据
下载PDF
拟适应再加权分类随机森林 被引量:1
20
作者 马景义 谢邦昌 《统计与信息论坛》 CSSCI 2010年第3期13-16,共4页
综合Adaboost算法的自适应再加权和随机森林算法的未修剪随机变量划分树基模型,文章提出了用于自适应随机森林算法。通过实验数据发现,在训练集较大、贝叶斯误差较小时,模拟自适应再加权会起作用,从而,拟自适应随机森林算法会优于随机... 综合Adaboost算法的自适应再加权和随机森林算法的未修剪随机变量划分树基模型,文章提出了用于自适应随机森林算法。通过实验数据发现,在训练集较大、贝叶斯误差较小时,模拟自适应再加权会起作用,从而,拟自适应随机森林算法会优于随机森林算法。 展开更多
关键词 模拟自适应再加权 随机森林 务实研究
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部