期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
缺失数据插补方法探讨——基于最近邻插补法和关联规则法
被引量:
21
1
作者
于力超
金勇进
王俊
《统计与信息论坛》
CSSCI
北大核心
2015年第1期35-40,共6页
提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离...
提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离进行加权处理,得到加权距离,再用加权距离最小的样本单元对应的属性值对缺失值进行插补。这种方法可以解决由不同最近距离样本单元得到不同插补值的问题,最后给出了该方法的实施步骤和应用范例。
展开更多
关键词
关联规则
缺失数据
最近邻插补
加权距离
下载PDF
职称材料
同源DNA序列中间隔位点的核苷酸最近邻插补
被引量:
1
2
作者
秦雪瑞
刘雄恩
《福建农林大学学报(自然科学版)》
CSCD
北大核心
2018年第5期633-640,共8页
针对分子系统发育重建时忽略同源DNA序列中的间隔位点导致进化信息丢失和序列间进化距离偏低估计的问题,基于最小进化原理并借鉴统计学中缺失数据处理的方法,提出核苷酸最近邻插补间隔位点,对插补后序列再运用4-状态DNA进化马尔可夫模...
针对分子系统发育重建时忽略同源DNA序列中的间隔位点导致进化信息丢失和序列间进化距离偏低估计的问题,基于最小进化原理并借鉴统计学中缺失数据处理的方法,提出核苷酸最近邻插补间隔位点,对插补后序列再运用4-状态DNA进化马尔可夫模型估算序列间进化距离的方法.对3组同源DNA序列在不同方法下进行距离估算的对照测试,结果表明:5-状态的F81+gap和F84+gap模型不能有效融合间隔所携带的indel信息,反而更加低估序列间距离;改进的同类模型F81+gap'则在一定程度上降低了距离的偏低估计,而核苷酸最近邻插补处理方法可以融合DNA突变中更多的indel信息.
展开更多
关键词
同源DNA序列
间隔
插
入/缺失
缺失数据
进化距离
最近邻插补
下载PDF
职称材料
不同缺失数据处理方法对D-vine Copula分类器的影响
3
作者
杨光
王蕾
付志慧
《沈阳师范大学学报(自然科学版)》
CAS
2021年第1期35-38,共4页
数据缺失是较为常见的影响数据质量的因素,会降低分析结果的可靠性。采用不同方法填补缺失数据,再用D-vine copula分类器对填补后的数据做分类,通过预测准确率来分析不同缺失数据处理方法对D-vine copula分类器的影响。首先,介绍了5种...
数据缺失是较为常见的影响数据质量的因素,会降低分析结果的可靠性。采用不同方法填补缺失数据,再用D-vine copula分类器对填补后的数据做分类,通过预测准确率来分析不同缺失数据处理方法对D-vine copula分类器的影响。首先,介绍了5种常用的缺失数据处理方法和D-vine copula分类器的相关知识;其次,结合实际数据,模拟不同的缺失比例,用这5种方法对数据进行填补;最后,用D-vine copula分类器对填补后的数据做分类,对分类准确率进行比较分析。研究发现,填补后的数据在D-vine copula分类器上表现得较为稳定,当数据缺失比例在5%~10%时,用随机插补法处理缺失数据效果较好,当数据缺失比例较大时,可以优先考虑用K最近邻插补法处理缺失数据。
展开更多
关键词
缺失数据
D-vine
Copula
分类器
K
最近邻插补
法
下载PDF
职称材料
题名
缺失数据插补方法探讨——基于最近邻插补法和关联规则法
被引量:
21
1
作者
于力超
金勇进
王俊
机构
中国人民大学统计学院
中国人民大学应用统计科学研究中心
出处
《统计与信息论坛》
CSSCI
北大核心
2015年第1期35-40,共6页
基金
全国统计科学研究重点项目<小微工业企业抽样调查问题研究>(2013LZ34)
北京市社科基金重点项目<基于北京市地理分布的空间抽样设计研究>(14JGA022)
北京市优博论文指导教师人文社科项目(20121000202)
文摘
提出基于最近邻插补和关联规则的缺失数据插补方法,将不含缺失数据的变量作为辅助变量,通过定义距离函数寻找与含缺失数据的样本单元距离较近的样本,然后利用挖掘得到的关联规则支持度和提升度乘积的倒数作为权重,对样本单元之间的距离进行加权处理,得到加权距离,再用加权距离最小的样本单元对应的属性值对缺失值进行插补。这种方法可以解决由不同最近距离样本单元得到不同插补值的问题,最后给出了该方法的实施步骤和应用范例。
关键词
关联规则
缺失数据
最近邻插补
加权距离
Keywords
association rules
missing data
nearest neighbor imputation
weighted distance
分类号
C811 [社会学—统计学]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
同源DNA序列中间隔位点的核苷酸最近邻插补
被引量:
1
2
作者
秦雪瑞
刘雄恩
机构
福建农林大学计算机与信息学院
出处
《福建农林大学学报(自然科学版)》
CSCD
北大核心
2018年第5期633-640,共8页
基金
福建农林大学2016年度科技创新专项基金项目(CXZX2016027)
文摘
针对分子系统发育重建时忽略同源DNA序列中的间隔位点导致进化信息丢失和序列间进化距离偏低估计的问题,基于最小进化原理并借鉴统计学中缺失数据处理的方法,提出核苷酸最近邻插补间隔位点,对插补后序列再运用4-状态DNA进化马尔可夫模型估算序列间进化距离的方法.对3组同源DNA序列在不同方法下进行距离估算的对照测试,结果表明:5-状态的F81+gap和F84+gap模型不能有效融合间隔所携带的indel信息,反而更加低估序列间距离;改进的同类模型F81+gap'则在一定程度上降低了距离的偏低估计,而核苷酸最近邻插补处理方法可以融合DNA突变中更多的indel信息.
关键词
同源DNA序列
间隔
插
入/缺失
缺失数据
进化距离
最近邻插补
Keywords
homologous DNA sequences
gap
insertion or deletion(i.e.indel)
missing data
evolutionary distance
nearest neighbor interpolation
分类号
O211.62 [理学—概率论与数理统计]
O241.6 [理学—计算数学]
下载PDF
职称材料
题名
不同缺失数据处理方法对D-vine Copula分类器的影响
3
作者
杨光
王蕾
付志慧
机构
沈阳师范大学数学与系统科学学院
闽南师范大学数学与统计学院
出处
《沈阳师范大学学报(自然科学版)》
CAS
2021年第1期35-38,共4页
基金
辽宁省教育厅科学研究经费项目(LJC201914)
辽宁省科技厅自然科学基金资助项目(2019MS285)。
文摘
数据缺失是较为常见的影响数据质量的因素,会降低分析结果的可靠性。采用不同方法填补缺失数据,再用D-vine copula分类器对填补后的数据做分类,通过预测准确率来分析不同缺失数据处理方法对D-vine copula分类器的影响。首先,介绍了5种常用的缺失数据处理方法和D-vine copula分类器的相关知识;其次,结合实际数据,模拟不同的缺失比例,用这5种方法对数据进行填补;最后,用D-vine copula分类器对填补后的数据做分类,对分类准确率进行比较分析。研究发现,填补后的数据在D-vine copula分类器上表现得较为稳定,当数据缺失比例在5%~10%时,用随机插补法处理缺失数据效果较好,当数据缺失比例较大时,可以优先考虑用K最近邻插补法处理缺失数据。
关键词
缺失数据
D-vine
Copula
分类器
K
最近邻插补
法
Keywords
missing data
D-vine copula
classifier
K nearest neighbor imputation
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
缺失数据插补方法探讨——基于最近邻插补法和关联规则法
于力超
金勇进
王俊
《统计与信息论坛》
CSSCI
北大核心
2015
21
下载PDF
职称材料
2
同源DNA序列中间隔位点的核苷酸最近邻插补
秦雪瑞
刘雄恩
《福建农林大学学报(自然科学版)》
CSCD
北大核心
2018
1
下载PDF
职称材料
3
不同缺失数据处理方法对D-vine Copula分类器的影响
杨光
王蕾
付志慧
《沈阳师范大学学报(自然科学版)》
CAS
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部