期刊文献+
共找到192篇文章
< 1 2 10 >
每页显示 20 50 100
基于网络关系的分类变量预测研究
1
作者 丁月 方匡南 +1 位作者 兰伟 徐顺 《统计研究》 CSSCI 北大核心 2024年第1期148-156,共9页
传统的预测方法通常基于个体的协变量信息进行建模和预测,少有考虑个体间的网络结构信息。事实上,网络节点间的关联信息能够为节点的响应变量预测提供信息,为此本文提出网络标签传播算法。基于半监督学习框架,以邻接矩阵为节点相似性推... 传统的预测方法通常基于个体的协变量信息进行建模和预测,少有考虑个体间的网络结构信息。事实上,网络节点间的关联信息能够为节点的响应变量预测提供信息,为此本文提出网络标签传播算法。基于半监督学习框架,以邻接矩阵为节点相似性推断依据,通过节点间的连接信息和已知节点的响应变量信息,来推断未知节点的响应变量信息。该算法适用于响应变量为分类变量的不完整网络数据。在网络服从随机分块模型的设定下,本文证明了该算法能够一致地预测未知节点的响应变量。数值模拟和实证数据分析结果显示,该算法预测效果较好。 展开更多
关键词 不完整网络 网络插补 网络标签传播 分类变量 信用风险评估
下载PDF
基于Hellinger距离的混合数据集中分类变量相似度分析 被引量:9
2
作者 赵亮 刘建辉 王星 《计算机科学》 CSCD 北大核心 2016年第6期280-282,307,共4页
分类变量的相似度分析是数据挖掘任务中的一个重要环节,现有的分类变量相似度算法中存在忽视变量差异、受不均衡分布影响严重、无法应用于混合数据集等缺点。为克服以上缺点,提出了一种基于Hellinger距离的分类变量相似度算法。该算法... 分类变量的相似度分析是数据挖掘任务中的一个重要环节,现有的分类变量相似度算法中存在忽视变量差异、受不均衡分布影响严重、无法应用于混合数据集等缺点。为克服以上缺点,提出了一种基于Hellinger距离的分类变量相似度算法。该算法累加分类变量对应子集中不同属性变量的分布差异作为相似度,且支持混合数据集。将所提算法代入聚类算法并应用于UCI公共数据集,结果表明,该算法在准确度、有效性和稳定性上都有较大提高。 展开更多
关键词 分类变量 相似度 f散度 Hellinger距离
下载PDF
利用“小样本”对住院病人病例组合方法及分类变量的探讨 被引量:2
3
作者 阎玉霞 徐勇勇 《中国卫生统计》 CSCD 北大核心 2007年第3期316-317,共2页
关键词 病例组合方法 住院病人 分类变量 小样本 DIAGNOSIS 诊断相关分类 医疗费用 住院费用
下载PDF
多重对应分析在中医大样本分类变量相关性分析中的应用 被引量:7
4
作者 段艳霞 王忆勤 +1 位作者 付晶晶 许朝霞 《数理医药学杂志》 2010年第1期65-66,共2页
目的:介绍应用多重对应分析方法实现对大样本分类变量之间的相关性分析,旨在对大样本疾病信息采集资料的临床和基础科研工作者提供可借鉴的统计学分析方法。方法:应用SPSS11.5统计分析软件中Data Reduction菜单的Optimal Scaling过程对... 目的:介绍应用多重对应分析方法实现对大样本分类变量之间的相关性分析,旨在对大样本疾病信息采集资料的临床和基础科研工作者提供可借鉴的统计学分析方法。方法:应用SPSS11.5统计分析软件中Data Reduction菜单的Optimal Scaling过程对大样本分类变量进行多重对应分析,以研究它们之间的联系。结果:慢性胃炎的4种病理组织诊断与8种中医证型有一定的相关性,这对慢性胃炎的临床诊断及治疗具有指导意义,为慢性胃炎中医证候规范化研究提供一定的思路。结论:对于中医研究中常见的无序多分类或二分类变量,要同时研究它们之间的联系,用多重对应分析在结果的直观性和可解释性方面优于对数线性模型。SPSS11.5统计分析软件易于实现多个变量间的多重对应分析。 展开更多
关键词 多重对应分析 相关性分析 大样本 分类变量
下载PDF
英语教学中中国文化渗透强度研究——基于多元分类变量的分析 被引量:7
5
作者 陈晓勤 《长沙理工大学学报(社会科学版)》 2019年第4期107-113,共7页
当今高校英语教学中,文化失语现象较为严重,重英语国家文化输入而轻中国文化渗透成为普遍现象。文章分析了影响英语教学中中国文化渗透强度的各主要因素,同时根据A大学教学试点的统计结果,比较并分析了各因素对中国文化渗透影响的相关程... 当今高校英语教学中,文化失语现象较为严重,重英语国家文化输入而轻中国文化渗透成为普遍现象。文章分析了影响英语教学中中国文化渗透强度的各主要因素,同时根据A大学教学试点的统计结果,比较并分析了各因素对中国文化渗透影响的相关程度,最后根据统计数据,建立了基于多元分类变量的回归模型,实现各影响因子对中国文化渗透强度的有效预测,对预测与评估大学英语教学中中国文化渗透教学模式的成效具有启发性的指导意义。 展开更多
关键词 中国文化 分类变量 回归模型
下载PDF
如何使用SPSS对Logistic回归中分类变量进行处理 被引量:8
6
作者 邹宗峰 林汉生 《数理医药学杂志》 2003年第2期110-112,共3页
介绍了 Logistic回归分析中常见的分类变量的编码方法和在 SPSS统计软件中的实现方法 。
关键词 LOGISTIC回归 分类变量 SPSS统计软件 医学研究
下载PDF
对比标度权重法在量化有序多分类变量中的应用 被引量:3
7
作者 丁元林 孔丹莉 《数理医药学杂志》 2005年第1期80-80,共1页
采用对比标度权重法对有序多分类变量“家庭月人均收入”进行了量化。结果显示 ,对比标度权重法的量化结果似比传统量化方法的结果更为合理。
关键词 分类变量 对比 量化方法 合理 家庭 显示 人均收入 标度 权重法 有序
下载PDF
分类变量关联性的一个应用
8
作者 辛荣环 《辽宁大学学报(自然科学版)》 CAS 1999年第3期203-206,共4页
本文把衡量分类变量关联性的方法应用于台风暴雨过程的因子分析,进而对暴雨过程进行预报.
关键词 分类变量 关联性 台风 暴雨过程 因子分析
下载PDF
处理分类变量资料中几种常见统计方法的分析
9
作者 余清 《温州医学院学报》 CAS 2002年第2期127-129,共3页
目的 :研究如何正确判识分类变量数据 ,并选择适宜的处理方法。方法 :阐述几种常见分类变量数据的统计方法。结果 :根据分类变量的分类项数及序列的关联性 ,判定分类变量的类型 ,以便对同一观察数据进行多项统计处理 ,充分利用数据资料... 目的 :研究如何正确判识分类变量数据 ,并选择适宜的处理方法。方法 :阐述几种常见分类变量数据的统计方法。结果 :根据分类变量的分类项数及序列的关联性 ,判定分类变量的类型 ,以便对同一观察数据进行多项统计处理 ,充分利用数据资料的内在信息。结论 :χ2 检验并非适用于所有的分类变量 。 展开更多
关键词 分类变量 X^2检验 关联性检验 单向有序列联表 统计方法
下载PDF
多分类变量逻辑回归及数据拟合在眩晕患者中的运用
10
作者 左丽静 阎岩 +1 位作者 刘博 华琳 《数理医药学杂志》 2011年第2期133-135,共3页
眩晕是临床中常见症状之一,可发生于各个年龄。采用多分类变量逻辑回归探讨年龄、性别、慢性病等因素对前庭功能的影响,并利用数据拟合分析眩晕患者年龄分布趋势。结果发现听力下降侧更容易出现前庭功能下降,同时还发现7.6岁和45.4岁为... 眩晕是临床中常见症状之一,可发生于各个年龄。采用多分类变量逻辑回归探讨年龄、性别、慢性病等因素对前庭功能的影响,并利用数据拟合分析眩晕患者年龄分布趋势。结果发现听力下降侧更容易出现前庭功能下降,同时还发现7.6岁和45.4岁为眩晕发病的高峰期。 展开更多
关键词 分类变量逻辑回归 数据拟合 眩晕
下载PDF
分类变量缺失数据处理方法有效性的比较研究 被引量:7
11
作者 肖亚明 陈永杰 +1 位作者 王玉鹏 刘美娜 《中国卫生统计》 CSCD 北大核心 2016年第2期186-189,共4页
目的比较删除法(deletion methods,DM)、基于对数线性模型的多重填补法(multiple imputation of category variables using log-linear model,M ILL)及基于潜在类别模型的多重填补法(multiple imputation based on latent class model,M... 目的比较删除法(deletion methods,DM)、基于对数线性模型的多重填补法(multiple imputation of category variables using log-linear model,M ILL)及基于潜在类别模型的多重填补法(multiple imputation based on latent class model,M ILC)处理分类变量缺失数据的效果,并将M ILC应用于实例数据的分析。方法利用R语言产生不同缺失机制、缺失率和样本含量的多变量缺失模拟数据,运用DM、MILL和MILC处理形成完整数据集并进行logistic回归分析,通过回归系数的偏倚、均方根误差、稳定度和标准误偏倚评价各方法的处理效果。结果模拟实验表明当缺失率为5%时,三种方法处理效果均较好;随着缺失率的增大,MILL和MILC的各项评价指标均优于DM,且MILC的准确度高于MILL。三种方法处理效果均表现为完全随机缺失优于随机缺失、样本含量1000优于样本含量500。应用MILC对实例数据填补后标准误减小,回归系数估计更准确。结论本文应用MILL和MILC两种多重填补方法处理分类变量缺失数据均可减少缺失导致的参数估计偏倚。当缺失率>5%、样本含量1000时,建议应用MILC处理分类变量缺失数据。 展开更多
关键词 分类变量 缺失数据 多重填补 潜在类别模型 对数线性模型
下载PDF
Lachin氏定性分类变量筛选法及其医学应用
12
作者 梁正东 陈幸华 《数理医药学杂志》 1992年第1期13-15,54,共4页
医学领域中时常遇到对涉及多个定性分类变量的数据资料做离散判别分析时,须对解释变量进行筛选。本文对有理论及实用价值的Lachin氏定性分类变量筛选法,变形演化成便于医学工作者理解和计算机编程的计算程式予以介绍。给出一个医学问题... 医学领域中时常遇到对涉及多个定性分类变量的数据资料做离散判别分析时,须对解释变量进行筛选。本文对有理论及实用价值的Lachin氏定性分类变量筛选法,变形演化成便于医学工作者理解和计算机编程的计算程式予以介绍。给出一个医学问题的筛选实例,并做了判别分析比较,以说明该法对选择重要变量是有效力的。 展开更多
关键词 分类变量 Lachin 筛选法 医学应用 判别分析 列联表 变量 理论频数 统计量 数据资料
下载PDF
两个有序分类变量构建一个分类复合终点指标方法的模拟评价 被引量:2
13
作者 郭正梅 阎小妍 姚晨 《中国卫生统计》 CSCD 北大核心 2014年第2期245-250,共6页
目的对于临床试验有效性评价中两个或可以转变为两个均为有序分类变量的主要终点指标,提出一种最乐观或最悲观的构建分类复合终点的方法,分析这种方法的合理性及应用性。方法采用MonteCarlo模拟的方法,考虑调整样本量和相关系数,分析分... 目的对于临床试验有效性评价中两个或可以转变为两个均为有序分类变量的主要终点指标,提出一种最乐观或最悲观的构建分类复合终点的方法,分析这种方法的合理性及应用性。方法采用MonteCarlo模拟的方法,考虑调整样本量和相关系数,分析分类复合终点指标进行疗效评价的Ⅰ型错误和检验效能,并与多重检验和连续复合终点指标的结果进行比较。结果Ⅰ型错误方面,随着样本量和相关系数的增大,两个主要终点指标均有统计学意义的多重检验的Ⅰ型错误远低于检验水准0.05,至少一个主要终点指标有统计学意义的多重检验的Ⅰ型错误在0.04至0.05之间,分类复合终点指标和连续复合终点指标的Ⅰ型错误均保持在0.05左右。检验效能方面,整体上,分类复合终点指标的检验效能、连续复合终点的检验效能和至少一个主要终点指标有统计学意义的多重检验的检验效能接近,三者均大于两个主要终点指标均要有统计学意义的多重检验的检验效能,后者最保守。各方法的检验效能与两个主要终点指标间相关系数的关系因赋值不同而有不一样的变化趋势。结论对于临床试验两个或可以转变为两个均为有序分类变量的主要终点指标的资料,可根据临床实际意义构建最乐观或最悲观分类复合终点指标,其能得出可解释的综合水平,能控制Ⅰ型错误且具有较高的检验效能。而且无论相关系数大小,都可以构建分类的复合终点指标,因为乐观与悲观之间没有固定的优劣关系,使得研究者在实际研究过程中根据实际情况来构建评价指标,而不是倾向于选择乐观的方法来构建,避免这一倾向带来的偏倚。 展开更多
关键词 多个主要终点指标有序分类变量Ⅰ型错误检验效能
下载PDF
带有多重分类变量的潜变量模型的可识别性 被引量:1
14
作者 勾建伟 夏业茂 《应用数学》 CSCD 北大核心 2022年第2期302-316,共15页
潜变量模型是一种广泛应用于表征多个观察变量之间相关性的统计方法.在刻画多重分类数据关联性方面,这类模型通常假定每个分类变量都与一个潜在连续变量或向量相联系,通过潜变量或向量在窗口部分的观察值来确定分类变量的值,从而达到对... 潜变量模型是一种广泛应用于表征多个观察变量之间相关性的统计方法.在刻画多重分类数据关联性方面,这类模型通常假定每个分类变量都与一个潜在连续变量或向量相联系,通过潜变量或向量在窗口部分的观察值来确定分类变量的值,从而达到对类别界定.然而该方法存在一个弱点:观察似然或模型存在确定性问题.模型缺乏识别性必然会对估计构成影响.本文对带有多重二分、有序和/或无序分数据的潜变量模型的模型识别问题,提出一种基于模型的识别方法,给出了一些有用的结果,特别是在建立因子分析模型和/或结构方程模型解释多重响应变量之间的相关性时.这些条件利用模型结构并保持了不同类型参数的相互分离性,这从理论和应用角度来看都较为方便. 展开更多
关键词 多重分类变量 模型确定 变量模型 实证因子分析模型 结构方程模型
下载PDF
基于分类变量定量化的玉树市土壤全碳制图 被引量:1
15
作者 李润祥 何林华 高小红 《生态科学》 CSCD 2023年第6期51-62,共12页
基于数学模型的土壤属性制图,具有高效、快速及成本低等特点,弥补了空间插值法忽视与土壤属性密切相关的土壤类型、植被类型、环境因素等分类变量或定性变量的缺陷。为了提高土壤属性制图的准确率,降低不确定性因素的影响,研究分类变量... 基于数学模型的土壤属性制图,具有高效、快速及成本低等特点,弥补了空间插值法忽视与土壤属性密切相关的土壤类型、植被类型、环境因素等分类变量或定性变量的缺陷。为了提高土壤属性制图的准确率,降低不确定性因素的影响,研究分类变量在土壤属性制图中的应用。以青海省玉树市土壤全碳制图为例,引入由土壤类型、地貌类型等分类变量分别同DEM和NDVI共同构建加权变量,探索加权变量在土壤属性制图中的可行性和实用性。研究结果表明:(1)玉树市土壤全碳含量范围在19.60—120.55 g·kg^(–1),平均值为55.80 g·kg^(–1),标准差为19.22 g·kg^(–1),变异系数为34.44%,属于中等程度的空间变异;(2)加权变量建立的模型优于由数字高程模型、坡度、坡向等常规变量建立的同种模型,加权变量的整体重要性高于常规变量,由地质类型、土壤类型、植被类型与DEM构建的加权变量的重要性远高于DEM本身的重要性;(3)基于全变量多元回归模型是预测土壤全碳含量最佳模型,其中加权变量的累计重要性程度为0.55,预测结果符合研究区地学规律和实际情况。总之,加权变量是有效利用分类变量的一种新的方式,为获取土壤属性制图变量提供了新方法,其可行性与实用性得到了一定的验证。 展开更多
关键词 土壤属性 制图 加权变量 全碳 分类变量
下载PDF
基于能量距离法的多维分类变量的分布差异检验
16
作者 彭东海 张留伟 《湖北师范大学学报(自然科学版)》 2022年第3期10-17,共8页
通过引入虚拟向量,将两个分类变量的分布差异检验问题等价地转换成两个虚拟向量的分布差异检验。基于这两个虚拟向量的能量距离,给出了一种新的简便的检验方法,采用置换样本的程序计算检验法的p值。数值模拟显示,相比传统的卡方检验法,... 通过引入虚拟向量,将两个分类变量的分布差异检验问题等价地转换成两个虚拟向量的分布差异检验。基于这两个虚拟向量的能量距离,给出了一种新的简便的检验方法,采用置换样本的程序计算检验法的p值。数值模拟显示,相比传统的卡方检验法,新的检验方法不受样本频数列联表中各单元格的频数的影响,因而大部分时候具有更高的功效。最后,给出该方法在两个多维分类向量的分布差异检验中的应用。 展开更多
关键词 分类变量 分布差异 能量距离 卡方检验 置换程序
下载PDF
基于分类变量数据包络分析法计算的我国省际旅行社经营效率变化研究
17
作者 罗师慧 《江苏商论》 2017年第12期50-54,共5页
本文应用分类变量数据包络分析法计算(categorical variables-DEA)模型对2000—2014年我国省际旅行社经营效率进行了测算,结果表明我国东、中、西部三类地区旅行社经营效率值变化各异:我国共有9个省区市连续15年旅行社经营效率值处于前... 本文应用分类变量数据包络分析法计算(categorical variables-DEA)模型对2000—2014年我国省际旅行社经营效率进行了测算,结果表明我国东、中、西部三类地区旅行社经营效率值变化各异:我国共有9个省区市连续15年旅行社经营效率值处于前沿面上,东、西部22省市区经营效率较高,中部9省区旅行社经营效率较低。 展开更多
关键词 区域经营效率 DEA 分类变量
下载PDF
基于双向稀疏Transformer的多变量时序分类模型
18
作者 王慧强 陈楚皓 +1 位作者 吕宏武 米海林 《小型微型计算机系统》 CSCD 北大核心 2024年第3期555-561,共7页
针对多变量时序(Multivariate Time Series,MTS)分类中长序列数据难以捕捉时序特征的问题,提出一种基于双向稀疏Transformer的时序分类模型BST(Bidirectional Sparse Transformer),提高了MTS分类任务的准确度.BST模型使用Transformer框... 针对多变量时序(Multivariate Time Series,MTS)分类中长序列数据难以捕捉时序特征的问题,提出一种基于双向稀疏Transformer的时序分类模型BST(Bidirectional Sparse Transformer),提高了MTS分类任务的准确度.BST模型使用Transformer框架,构建了一种基于活跃度得分的双向稀疏注意力机制.基于KL散度构建活跃度评价函数,并将评价函数的非对称问题转变为对称权重问题.据此,对原有查询矩阵、键值矩阵进行双向稀疏化,从而降低原Transformer模型中自注意力机制运算的时间复杂度.实验结果显示,BST模型在9个长序列数据集上取得最高平均排名,在临界差异图中领先第2名35.7%,对于具有强时序性的乙醇浓度数据集(Ethanol Concentration,EC),分类准确率提高30.9%. 展开更多
关键词 变量时序分类 TRANSFORMER 双向稀疏机制 活跃度评价函数
下载PDF
单变量时间序列的MHAGRU-MCCE分类方法
19
作者 林泓 刘桂雄 +1 位作者 戈燕红 崔怀丰 《电子测量技术》 北大核心 2024年第16期83-91,共9页
在单变量时间序列分类任务中,有效利用时间序列的多尺度特征、时间依赖特征对提高分类准确率至关重要。针对现有模型在综合利用多尺度特征、时间依赖特征方面局限,本文提出一种结合多尺度条件卷积增强模块(MCCE)与基于多头注意力机制的... 在单变量时间序列分类任务中,有效利用时间序列的多尺度特征、时间依赖特征对提高分类准确率至关重要。针对现有模型在综合利用多尺度特征、时间依赖特征方面局限,本文提出一种结合多尺度条件卷积增强模块(MCCE)与基于多头注意力机制的门控循环单元(MHAGRU)新型混合模型MHAGRU-MCCE,MCCE从不同尺度捕捉丰富时序特征,MHAGRU侧重于提取时间序列数据中依赖关系。在UCR的85个公共数据集上,与MACNN、AFFNet、OS-CNN、LITETime、MLP和LSTM-FCN等6种主流基于深度学习时间序列分类模型相比,验证表明MHAGRU-MCCE在平均准确率(MA)上分别提升0.66%、2.04%、3.45%、2.70%、12%和2.89%,并取得最高算术平均排名(AMR)=2.45、几何平均排名(GMR)=1.98,充分证明MHAGRU-MCCE在处理单变量时间序列分类问题上的有效性、优越性。 展开更多
关键词 变量时间序列分类 多尺度卷积 门控循环单元 注意力机制
下载PDF
完全随机缺失条件下分类随机变量数据缺失插补方法的比较研究 被引量:7
20
作者 张彪 韩伟 +5 位作者 庞海玉 薛芳 厚磊 王子兴 王钰嫣 姜晶梅 《中国卫生统计》 CSCD 北大核心 2015年第5期903-905,907,共4页
目的探讨完全随机缺失条件下分类随机变量数据缺失对研究结果的影响,对各方法插补效果进行评价。方法基于上海地区35岁及以上吸烟人群吸烟与肺癌死亡关系的完整数据集,在5%、10%、20%及30%缺失率下,模拟有序分类变量(吸烟年数分组syfz)... 目的探讨完全随机缺失条件下分类随机变量数据缺失对研究结果的影响,对各方法插补效果进行评价。方法基于上海地区35岁及以上吸烟人群吸烟与肺癌死亡关系的完整数据集,在5%、10%、20%及30%缺失率下,模拟有序分类变量(吸烟年数分组syfz)缺失和二分类变量(性别sex)缺失,重复模拟100次。采用删除法、众数插补法、多重插补-logistic回归法(MI/logistic)及多重插补-判别分析法(ML/discrim)对分类变量数据缺失进行处理。对插补效果从插补正确率及插补后模型参数的变化两个方面进行评价。结果有序分类变量缺失:各缺失率下,MI/logistic插补的正确率最高,MI/logistic和MI/discrim插补后模型参数的偏差均较小,对于吸烟年数sy以分组形式syfz纳入模型数据缺失导致模型参数的相对偏差更小,对syfz插补后模型参数相对偏差也小于连续变量sy插补后模型参数相对偏差。二分类变量缺失:各缺失率下,众数插补的正确率最高,删除法处理缺失数据后模型参数的偏差最小。结论连续变量缺失对模型结果的影响大于分类变量缺失,对于有数据缺失的连续变量可将其离散化,以分类变量的形式进行分析。缺失数据插补模型的拟合效果会直接影响插补效果,当模型拟合效果较差时可能会带来更大的偏差。 展开更多
关键词 分类变量 数据缺失 多重插补
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部