期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
成组删除法和多重填补法对随机缺失的二分类变量资料处理效果的比较 被引量:5
1
作者 王曼 施念 +1 位作者 花琳琳 杨永利 《郑州大学学报(医学版)》 CAS 北大核心 2012年第5期642-645,共4页
目的:评价两种随机缺失的二分类变量资料处理方法。方法:以艾滋病中医症候的调查资料为数据来源,利用SAS9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的lo-gistic回归法(MI/logistic)进行填充处... 目的:评价两种随机缺失的二分类变量资料处理方法。方法:以艾滋病中医症候的调查资料为数据来源,利用SAS9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的lo-gistic回归法(MI/logistic)进行填充处理;同时对缺失数据集采用成组删除法进行处理;根据各个数据集建立logis-tic回归模型,与完整数据集进行比较。结果:缺失10%时,成组删除法处理结果与完整数据集更接近;缺失20%~40%时,MI/logistic填补后常数项和x的回归系数明显偏离完整数据集;缺失50%时,MI/logistic填充2次时x的回归系数和标准误更接近于完整数据集;缺失60%时,MI/logistic填充后x的回归系数严重偏离完整数据集,成组删除后x回归系数的标准误明显偏离完整数据集。结论:缺失较少(缺失率<40%)时,成组删除法处理效果较好;缺失50%时,采用MI/logistic回归法填充效果更好;缺失60%以上时,两处理方法均不理想。 展开更多
关键词 二分类变量 缺失值 成组删除 多重填补法
下载PDF
多重填补法Markov Chain Monte Carlo模型在有缺失值的妇幼卫生纵向数据中的应用 被引量:7
2
作者 茅群霞 李晓松 《四川大学学报(医学版)》 CAS CSCD 北大核心 2005年第3期422-425,共4页
目的 针对妇幼卫生纵向数据的任意缺失模式,采用多重填补方法进行填补,探求最佳填补结果,以便对数据作进一步分析与研究。方法 运用SAS9.0 ,采用多重填补方法Markov China Monte Carlo(MCMC)模型对缺失数据进行多次填补并综合分析。... 目的 针对妇幼卫生纵向数据的任意缺失模式,采用多重填补方法进行填补,探求最佳填补结果,以便对数据作进一步分析与研究。方法 运用SAS9.0 ,采用多重填补方法Markov China Monte Carlo(MCMC)模型对缺失数据进行多次填补并综合分析。结果 填补5次所得结果最优。结论 多重填补方法可以处理有缺失数据资料中的许多普遍问题,可提高统计效率,尤其是MCMC模型在处理复杂的缺失数据上,优势明显。 展开更多
关键词 多重填补法 MARKOV CHAIN MONTE Carlo 缺失值 妇幼卫生
下载PDF
多重填补法与Ad Hoc法对模拟纵向数据集缺失值处理的比较 被引量:5
3
作者 茅群霞 李晓松 《现代预防医学》 CAS 北大核心 2005年第4期310-312,共3页
目的:采用多重填补法(multipleimputation ,MI)和Adhoc法分别对模拟的纵向数据集中的缺失值进行处理,比较两种方法的优劣并探讨其适用性。方法:运用SAS9 0 ,采用数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,... 目的:采用多重填补法(multipleimputation ,MI)和Adhoc法分别对模拟的纵向数据集中的缺失值进行处理,比较两种方法的优劣并探讨其适用性。方法:运用SAS9 0 ,采用数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,分别用MI和Adhoc法对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10 %时,Adhoc方法有一定优势;数据缺失率在2 0 %~4 0 %时,经MI处理后的分析结果更接近“真实”;数据缺失率≥5 0 %时,两种方法均无效。结论:对不同缺失率的数据集。 展开更多
关键词 多重填补法 数据集 缺失值 Ad 缺失率 纵向数据 SAS9 模拟技术 分析结果 适用性 MI
下载PDF
运用多重填补方法分析世界健康调查数据(英文)
4
作者 曹阳 RITU Sadana AJAY Tandon 《第二军医大学学报》 CAS CSCD 北大核心 2004年第2期195-199,共5页
目的 :解决世界健康调查 (World Health Survey,WHS)数据中的数据缺失问题 ,进行更加有效的统计推断。 方法 :根据多重填补 (multiple imputation,MI)的原理 ,运用 Am elia软件和 Stata○R中的综合统计推断程序对 WHS数据集进行处理。结... 目的 :解决世界健康调查 (World Health Survey,WHS)数据中的数据缺失问题 ,进行更加有效的统计推断。 方法 :根据多重填补 (multiple imputation,MI)的原理 ,运用 Am elia软件和 Stata○R中的综合统计推断程序对 WHS数据集进行处理。结果 :由缺失数据造成的信息缺失得到了弥补 ,综合评价结果的质量得到了提高。 结论 :MI具有良好的特性 ,和针对特定问题但操作复杂的方法相比 ,MI是一种解决数据缺失问题的简单和近似的方法。 展开更多
关键词 多重填补法 世界健康调查 数据缺失 卫生统计
下载PDF
多重填补法在公共卫生调查研究中的应用 被引量:4
5
作者 刘小莉 王晓晓 +7 位作者 李楠 曾琳 陶立元 张华 石岩岩 褚红玲 倪凯文 赵一鸣 《中华医学杂志》 CAS CSCD 北大核心 2019年第46期3675-3677,共3页
缺失数据在公共卫生调査领域普遍存在,如果处理不当可导致统计功效减低并使结果产生偏倚。多重填补法是处理缺失数据的一种方法,在实践中得到广泛应用。本文介绍多重填补法以及在公共卫生调査研究中的应用,为公共卫生调查研究数据处理... 缺失数据在公共卫生调査领域普遍存在,如果处理不当可导致统计功效减低并使结果产生偏倚。多重填补法是处理缺失数据的一种方法,在实践中得到广泛应用。本文介绍多重填补法以及在公共卫生调査研究中的应用,为公共卫生调查研究数据处理和分析提供更为科学可行的方法学帮助,提高调查研究的质量。 展开更多
关键词 缺失数据 多重填补法
原文传递
基于多重填补法合并广义估计方程的高血糖危险因素评估研究 被引量:2
6
作者 马庆华 毛建良 +2 位作者 徐文新 孙宏鹏 劳雅琴 《中华全科医学》 2018年第12期2106-2110,共5页
目的应用多重填补法合并广义估计方程评估高血糖危险因素。方法利用多重填补法合并广义估计方程分别处理苏州市相城区第三人民医院老年人2011—2015年(2013年除外)健康管理档案中相关信息的数据缺失和重复测量问题,综合评估高血糖的危... 目的应用多重填补法合并广义估计方程评估高血糖危险因素。方法利用多重填补法合并广义估计方程分别处理苏州市相城区第三人民医院老年人2011—2015年(2013年除外)健康管理档案中相关信息的数据缺失和重复测量问题,综合评估高血糖的危险因素。结果8325位老年人累计23195条观测记录中,纳入的指标除性别、年龄为完整变量,其余变量缺失率范围为0.06%~18.44%,样本实际有效率为76.99%,数据资料呈任意缺失模式。多重填补后,产生10个完整的不同数据集,所有变量填补效率都在0.97以上。高血糖危险因素OR值(95%CI)评估结果:高血压1.272(1.201~1.361)、超重1.251(1.162~1.341)、肥胖1.649(1.481~1.852)、心率过快1.679(1.581~1.792)、高胆固醇血症1.178(1.060~1.311)、混合型高脂血症1.170(1.021~1.332)、低密度脂蛋白胆固醇1.112(1.040~1.171)、高尿酸血症1.172(1.089~1.271)、丙氨酸氨基转移酶偏高1.180(1.032~1.351)、天冬氨酸氨基转移酶偏高1.191(1.032~1.391)。缺失填补前后,混合型高脂血症和天冬氨酸氨基转移酶偏高的统计学意义发生改变。γ和r值表明缺失对体质指数的参数估计影响最大。结论多重填补法合并广义估计方程能有效解决高血糖危险因素评估时遇到的数据缺失和重复测量问题,公共卫生部门应加强监测可能引起高血糖患病的相关因素,针对高危老年人做好健康指导工作。 展开更多
关键词 纵向数据 多重填补法 广义估计方程 高血糖 危险因素评估
下载PDF
三种块缺失数据处理方法的比较 被引量:6
7
作者 林丽娟 董学思 +3 位作者 赵杨 魏永越 戴俊程 陈峰 《中国卫生统计》 CSCD 北大核心 2017年第3期523-525,527,共4页
跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,... 跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,则块缺失(block missing)是不可避免的。由于块缺失的缺失比例比较高,如果将含有缺失的观测全部剔除,仅对完整数据进行分析,则会损失大量信息,甚至无信息可用。 展开更多
关键词 缺失数据 缺失率 蛋白组学 代谢组学 基因组学 处理方 平台组 MISSING 回归系数 多重填补法
下载PDF
工业过程数据中缺失值处理方法的研究 被引量:14
8
作者 郭超 陆新建 《计算机工程与设计》 CSCD 北大核心 2010年第6期1351-1354,共4页
针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据。阐述了常用的缺失数据处理方法,指出各方法的优缺点。在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用... 针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据。阐述了常用的缺失数据处理方法,指出各方法的优缺点。在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用删除含缺失值的个案、简单填补和多重填补(MI)3种方法对数据进行处理,利用处理后的新数据集进行数据挖掘,预测目标变量的值,并对预测结果进行分析比较。实验结果表明,多重填补方法的处理效果最好,为工业数据的缺失值处理提供了有用的策略。 展开更多
关键词 缺失值 多重填补法 工业过程数据 数据挖掘 回归预测
下载PDF
对模拟纵向数据集缺失值处理的几种方法比较 被引量:4
9
作者 易昆南 袁中萸 《湖南工业大学学报》 2008年第2期48-51,共4页
运用SAS9.0、数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,采用多重填补法(MI)、期望值最大化法(EM)和回归插补法(Regression)对各缺失数据集进行处理,对结果进行比较和分析。结果表明,对不同缺失率的数据集... 运用SAS9.0、数据模拟技术,分别模拟纵向完整数据集和具有各种缺失率的随机缺失数据集,采用多重填补法(MI)、期望值最大化法(EM)和回归插补法(Regression)对各缺失数据集进行处理,对结果进行比较和分析。结果表明,对不同缺失率的数据集,MI、EM和Regression法对缺失值的处理各有优劣。 展开更多
关键词 多重填补法 期望值最大化 回归插补 缺失值
下载PDF
SAS中处理数据集缺失值方法的对比研究 被引量:9
10
作者 殷杰 石锐 《计算机应用》 CSCD 北大核心 2007年第B06期438-439,共2页
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随... 采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和Ad Hoc对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10%时,Ad Hoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥35%时,三种方法均无效。结论:对不同缺失率的费用科目缺失数据集,MI和Ad Hoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势。 展开更多
关键词 缺失值填补 多重填补法 期望最大化算 AD Hoc
下载PDF
基于Monte Carlo模拟的完全随机缺失数据处理方法效果比较 被引量:3
11
作者 王可 杨弘 +3 位作者 田晶 李晨昊 韩清华 张岩波 《中国卫生统计》 CSCD 北大核心 2020年第2期298-301,共4页
目的探讨不同缺失比率下几种缺失处理方法的优劣,为缺失数据的处理提供参考。方法以慢性心力衰竭的部分患者电子病历资料为数据基础,运用R软件,采用Monte Carlo模拟完全随机、任意缺失的数据集,并采用成组删除法、均值填补法、期望最大... 目的探讨不同缺失比率下几种缺失处理方法的优劣,为缺失数据的处理提供参考。方法以慢性心力衰竭的部分患者电子病历资料为数据基础,运用R软件,采用Monte Carlo模拟完全随机、任意缺失的数据集,并采用成组删除法、均值填补法、期望最大化填补法、缺失森林填补法和多重填补法分别对模拟的不同缺失比率数据集进行缺失处理,并对所得"完整数据集"拟合多元线性回归模型,得到的参数估计结果与完整数据集参数估计进行比较。结果在不同的缺失比率下不同缺失处理的效果存在差别,在5%和10%缺失比率下,链式方程填补法(multivariate imputation by chained equations,MICE)和期望最大化法(expectation maximization,EM)最优,缺失森林填补法(miss forest,MF)、均值填补法(mean completer,MC)和成组删除法(complete case method,CCM)效果接近;在20%缺失比率下,MICE最优,EM次之,CCM和MF近似,MC最差;在30%缺失比率下,MICE和MF最优,EM和CCM次之,MC最差;在50%缺失比率下,MICE最优,EM和CCM次之,CCM和MF最差。结论对于不同缺失比率的数据,研究人员应综合考虑缺失处理方法的准确度和精确度以及操作难易程度,必须根据实际数据加以调整,采用不同的方法进行处理。 展开更多
关键词 缺失处理 期望最大化 缺失森林填补 多重填补法
下载PDF
基于Monte Carlo模拟的四种完全随机双变量缺失数据处理方法的比较 被引量:7
12
作者 朱高培 朱乐乐 +1 位作者 孟马承 吴学森 《中国卫生统计》 CSCD 北大核心 2018年第5期707-709,共3页
目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。... 目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。结果当缺失比例为10%时,4种方法处理效果一致。随着缺失比例增加,4种方法处理后均值变化不大;均值填补法处理后相关系数小于其他方法,多重填补法和标准一致,回归填补法填补后相关系数比其他方法偏高而且呈增加趋势。随着回归系数的增加,回归填补法的相关系数准确性增加。结论 4种方法处理完全随机缺失机制下两个相关变量的效果不同,当缺失比例较低时,建议采用成组删除法或回归填补法。当缺失比例较大时,建议使用多重填补法。 展开更多
关键词 缺失值 相关变量 多重填补法 MONTE CARLO模拟
下载PDF
基本风速预测中缺失历史数据的修订方法
13
作者 项程 陈艾荣 +1 位作者 李其恒 马如进 《南京工业大学学报(自然科学版)》 CAS 北大核心 2019年第6期800-806,共7页
基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统... 基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统计了各气象台站的最大风速数据缺失率,介绍了目前采用的数据修订方法。根据数据缺失的特点及关注的对象,选用多重填补法对缺失的数据进行修订,并详细介绍了该方法的填补步骤。选用两个具体填补算例对日最大风速值数据修订进行说明,并用极值Ⅰ型概率模型对比了填补前后数据预测百年一遇风速的效果。结果表明,利用经缺失数据填补后的风速数据文件得到的历年最大风速序列,可以有效改善由于数据记录缺失造成的年最大风速值的遗漏,更好地预测基本风速。 展开更多
关键词 基本风速 缺失数据修订 多重填补法
下载PDF
代际收入流动、阶层地位与初婚居住安排 被引量:2
14
作者 金卉 范晓光 《浙江学刊》 CSSCI 北大核心 2014年第2期214-218,共5页
初婚居住安排是理解家庭形态与结构发展的重要事件,既有的资源决定论视角主要探究的是个体绝对资源对居住安排的影响,但对资源效力的代际差异缺乏系统研究。本文通过对上海家庭调查(SHFS2010)数据的分析,发现中国城市家庭的初婚居住安... 初婚居住安排是理解家庭形态与结构发展的重要事件,既有的资源决定论视角主要探究的是个体绝对资源对居住安排的影响,但对资源效力的代际差异缺乏系统研究。本文通过对上海家庭调查(SHFS2010)数据的分析,发现中国城市家庭的初婚居住安排并不完全由夫妻阶层地位左右,而更多的受制于原生家庭的社会经济地位。经过贝叶斯多重填补法对资料进行处理后,结果进一步支持代际收入流动对初婚居住安排具有决定作用。 展开更多
关键词 代际 阶层地位 居住安排 多重填补法
原文传递
基于SAS对缺失数据的处理——以新药试验为例 被引量:1
15
作者 谢桃枫 李宗学 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2017年第1期47-54,共8页
通过对新药试验的数据集中缺失数据进行分析,总结缺失数据对新药研究分析结果的影响,进而比较不同补缺方法的优缺点.利用SAS9.4软件对新药试验的数据集进行统计分析,分别采用LOCF补缺法、均值补缺法、分组均值补缺法、MCMC补缺法、FCS... 通过对新药试验的数据集中缺失数据进行分析,总结缺失数据对新药研究分析结果的影响,进而比较不同补缺方法的优缺点.利用SAS9.4软件对新药试验的数据集进行统计分析,分别采用LOCF补缺法、均值补缺法、分组均值补缺法、MCMC补缺法、FCS补缺法、monotone补缺法六种方法对缺失数据集进行统计分析,并比较数据填补前后的差异及分析结果的稳定性.由于新药试验数据集的病例脱落比例不是很高,故几种处理方法的分析结论都比较接近,但MCMC填补法的效果相对其他几种的填补方法更为稳定. 展开更多
关键词 SAS 新药试验 缺失数据 MCMC算 多重填补法
原文传递
中医药项目拉普拉斯特征映射综合评估
16
作者 黄瑶 胡芳 陈健超 《社区医学杂志》 2020年第5期375-380,共6页
目的如何及时、准确地把握和反映一个阶段全国中医药项目绩效情况,并有针对性地提出建议,是全国中医药项目绩效工作的一个重要支点。本研究探索中医药项目综合评估的有效方法。方法采用多重填补法对中医药项目缺失数据进行填充,形成数... 目的如何及时、准确地把握和反映一个阶段全国中医药项目绩效情况,并有针对性地提出建议,是全国中医药项目绩效工作的一个重要支点。本研究探索中医药项目综合评估的有效方法。方法采用多重填补法对中医药项目缺失数据进行填充,形成数据项完整的多个分析数据集,然后,利用拉普拉斯特征映射算法对每个数据集进行处理得到一组结果集,并对结果集求和平均等一系列数据处理之后,得出最后的评估结果。结果各省中医药项目平均值0.8469,有17个省份超过了平均值,编号为6、22和23的省份综合评估值较高(均>0.9000),专家评分平均>93.5分,且有单个项目达到了105分(项目3有附加分),这些省份所产生的效益较好;而编号为5和27的省份综合评估值较低(均<0.7000),专家评分平均<70.0分,甚至有单个项目得29.5分,其所产生的效益较差;项目1、2和6的评估情况较差,与专家评估结果相吻合。编号为3、4、5、6、7、10、11、12、13、14、16、17、18、19、20、23、24、25、26、27和30的省份,编号为21、29和31的省份与编号为1、2和9的省份以及编号为15、28的省份,这四组省份的数据结构相同,故而这四组数据组内的评估关系应在数据处理过程中都保持不变,而表3的处理结果并没有改变它们组内的评估关系,证明了该评估方法的有效性和合理性。结论基于拉普拉斯特征映射的综合评估能直观、全面反映不同省份中医药项目综合情况,且单个项目的优劣会影响整个省的综合评估结果。 展开更多
关键词 中医药项目 拉普拉斯特征映射 多重填补法 综合评估
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部