您所在位置: 首页 > 期刊 > 过刊浏览 > 妇产科学与儿科学> 《中国生育健康杂志》> 2010年8月21卷4期>讲座> 文章详情

倾向评分加权分析法

首席医学网      2010年09月08日 20:24:33 Wednesday  
 
  加入收藏夹   官方投稿信息

作者:李智文 任爱国    作者单位:100191 北京,北京大学生育健康研究所

【关键词】  倾向评分 加权分析法

标准化法(standardization method)是流行病学中在数据分析阶段消除混杂偏倚的传统方法之一。倾向评分的加权分析法(propensity score weighting)是将倾向评分与传统标准化法结合发展成的一种新型的分析方法,可以称之为“基于个体的标准化法”[1~4]。倾向评分加权也是边缘结构模型(marginal structural models)的一种简单应用[1]。

  一、原理和方法

  为了使读者更好地了解倾向评分加权分析的原理,先简单回顾一下传统标准化法的原理。标准化法常用于消除两组或多组人群内部某些混杂因素构成不同而对其观察效应平均水平(率、比或均数等)比较的影响。标准化法的基本思想就是指定一个统一的“标准人口”,按“标准人口”中混杂因素构成的权重来调整两组观察效应的平均水平,以消除比较组之间由于内部混杂因素构成不同对平均水平比较的影响。如在比较两组人群的死亡率时,年龄往往是重要的混杂因素,老年人口的死亡率高于低年龄组的死亡率。如果两组人群的年龄构成存在差别,即年龄在两组中的分布不同,就不宜直接比较各组人群总死亡率的差别,而应统一使用标准的人口构成(如两组人群之和,或者国家的标准人口),使两组在年龄分布相同的情况下计算标准化死亡率,然后比较两组标准化死亡率的高低水平。

  倾向评分加权法首先将多个主要混杂变量的信息综合为一个变量倾向评分,然后将倾向评分作为需要平衡的混杂因素,通过标准化法的原理加权,使各对比组中倾向评分分布一致,则达到使各混杂因素在各比较组分布一致的目的[1~5]。该方法将每一观察单位看作一层,不同倾向评分值预示这一观察单位在两组中的概率不同。在假定不存在未识别混杂因素的条件下,加权调整是基于在一定条件下的两种相反事件的对比来对数据进行调整的,即假设使每个观察对象均接受处理因素和使每个观察对象均不接受处理因素两种相反情况[4,5]。利用倾向评分估计的权重对各观察单位加权产生一个虚拟的标准人群,在虚拟人群中,两组的混杂因素趋于一致,均近似于某一预先选定的标准人口分布。选择的标准人群不同,调整的方法也不同。根据调整后标准人群的不同,又可分为两种加权方法:逆处理概率加权法(inverse probability of treatment weighting,IPTW)和标准化死亡比加权法(standardized mortality ratio weighting,SMRW)。IPTW法是以所有观察对象(处理组与对照组合并的人群)为“标准人群”进行调整。Robins等[1]给出的加权系数(W)计算方法是:处理组观察单位的权数Wt=1/PS,对照组观察单位的权数Wc=1/(1PS)。PS为观察单位的倾向评分值。这一方法得到的人群往往与原来人群的数量不同,因此虚拟人群各变量的方差大小发生了变化。为了得到与原人群的样本量相同的标准人群,Hernan等[2]对计算方法进行了调整,将整个研究人群的处理率和非处理率加入公式进行调整得到稳定权数(stabilized weights)。具体方法是:处理组观察单位的权数Wt=Pt/PS,对照组观察单位的权数Wc=(1Pt)/(1PS)。Pt为整个人群中接受处理因素的比例。SMRW法是将处理组观察对象作为“标准人群”进行调整。Sato和 Matsuyama[3]给出的加权系数计算方法是:处理组观察单位的权数Wt=1,对照组观察单位的权数Wc=PS/(1PS)。同样,由于对照组得到的人群数与处理组样本量一致,而与原对照组样本量不同,因此需要进一步作如下调整,计算其稳定权数:Wc=/[(1PS) Pt]。当每一个观察单位的权数计算出来后,就可以对每个观察单位加权后用传统的方法(如直接效应比较或Logistic回归)进行效应估计。

  二、应用实例

  某课题组想了解孕期增补某种营养素是否对妊娠高血压疾病有预防作用。研究者采用非随机干预的研究方法,在中国5个县募集孕早期妇女,按照知情选择的原则选择服用或不服用这种营养素,募集时登记妇女的各种人群特征。研究期间共募集并随访到57 333名妇女的妊娠结局。根据专业知识,考虑母亲年龄、孕早期身体质量指数(body mass index,BMI)、文化程度、职业、是否初产、多胎妊娠、民族可能对处理因素产生混杂作用,拟对这些因素进行平衡。表1列出了原人群中服用和未服用营养素的妇女各种混杂因素的分布,可以看出大部分变量在两组中的分布极不平衡[5]。

  下面分别用IPTW和SMRW两种倾向评分加权法对这些因素进行调整,然后分析增补该营养素与妊娠高血压发生危险性之间的关系。具体步骤如下。

  首先以是否服用营养素为因变量,以上述需要调整的协变量为自变量进行Logistic回归分析,求出每个研究对象的PS值。根据对照组和处理组的人数求出人群中暴露者的比例Pt。本例中Pt=36271/(36271+21062)=0.633。计算IPTW调整稳定权数,例如,本研究中第一个观察对象属于对照组,其PS值为0.77108,则W=(1Pt)/(1PS)=(10.633)/(10.77108)=1.6032。本例中第九个观察对象属于处理组,其PS值为0.70808,则W=Pt/PS=0.633/0.70808=0.8940。依此类推。

  SMRW调整过程基本相同,只是计算权数时不同。表1和表2分别为用IPTW和用SMRW法加权调整后处理组和对照组妇女各混杂变量的分布。可以看到调整后两组人群各变量分布趋于一致。不同的是IPTW法调整后,混杂变量分布与合并后的总人口一致,而SMRW法调整后,对照组协变量分布与处理组一致。最后以加权变量对每一个观察单位加权后,分析数据的均衡性。

  数据分析时,可以用单因素分析方法直接比较,也可以用多因素分析方法同时调整重点变量。本文采用Logistic回归方法,结果表明,采用倾向评分加权调整后,尚不能认为孕早期增补这种营养素可以降低妊娠高血压综合征的风险。在本实例,未调整OR=1.04(95 %CI:0.98~1.10),直接Logistic回归OR=1.05(95 %CI:1.00~1.12),IPTW调整OR=1.05( 95 %CI:1.00~1.11),SMRW调整OR= 1.05(95 %CI:1.00~1.11),IPTW和SMRW调整结果基本相同。表1 IPTW加权调整前、后服用和未服用营养素的妇女各种协变量的分布注:服用组与未服用组比较,*P<0.001;**由于小数取整,小组合计可能不等于总数 表2 SMRW加权调整后服用和未服用注:*由于小数取整,小组合计可能不等于总数

  三、倾向评分加权应用中需要注意的问题

  传统的标准化法或分层标准化法要求调整的混杂因素不能太多(一般3个以下),而且混杂因素不能为连续变量,否则由于分层太多而无法实现。而倾向评分由于将许多变量综合为一个变量,因此即使是同时分析较多的混杂变量或是连续性变量,并不增加分析的难度,克服了标准化法的局限性。

  通常情况下,选择IPTW和SMRW两种方法调整混杂因素的结果基本一致。但如果有影响处理因素分配的重要混杂变量或交互项没有纳入模型,或者混杂因素对处理效应具有较强的效应修饰作用时,IPTW和SMRW两种方法的调整结果之间将存在较大的差异[5,6]。如Kurth等在研究组织纤维蛋白溶解酶原活化剂使用与缺血性脑卒中病人死亡危险性的关系时发现:如果不调整混杂因素,其OR值为3.35 (95 % CI: 2.28~4.91),用IPTW调整的OR值为10.77 (95 %CI: 2.47~47.04),而用SMRW调整的OR值为1.11(95 %CI: 0.67~1.84),二者相差约10倍。究其原因,是由于部分混杂因素存在较强的效应修饰作用,通过倾向评分分层可以发现各层OR值存在较大差别[6]。在这种情况下,SMRW调整的OR值结果与倾向评分配比结果及随机对照研究的结果相似。因为,倾向评分配比和SMRW均以处理组作为参照,而随机对照研究由于规定了部分入选条件,其研究对象也趋于与处理组一致。而IPTW是以整个人群为参照,更全面地考虑了一般人群的特征,因此在效应估计上可能不及前面几种方法稳定,但在识别效应修饰因子或没有纳入的重要变量或交互项方面则具有较大优势[6]。虽然SMRW与倾向评分配比的平衡结果基本一致,但SMRW在数据分析阶段更具优势,这是因为倾向评分配比只是选择了部分对照个体,而SMRW利用了全部对照个体的信息,其方差与原人群相近;SMRW过程要比倾向评分配比过程容易实现[5]。

  如果倾向评分估计和多变量效应估计所用的协变量和模型相同,则直接用各协变量进行调整后的效应点值应该与用倾向评分调整后的效应点值相同。但倾向评分的优势是研究者可以首先构建复杂的模型(如纳入较多的变量或增加复杂多级交互项)来计算倾向评分,然后在最后的效应模型中使用少量的重点变量与倾向评分共同调整。由于倾向评分综合了全部混杂因素的共同作用,将众多的因素综合为一个变量,使最终估计因果联系的模型简单化,对模型的诊断比同时纳入较多变量要容易和可靠;同时避免了效应估计时参数过多及共线性的问题所导致的偏倚[7]。

【参考文献】
   1Robins JM, Hernan MA, Brumback B. Marginal structural models and causal inference in epidemiology[J]. Epidemiology, 2000, 11: 550560.

  2Hernan MA, Brumback B, Robins JM. Marginal structural models to estimate the causal effect of zidovudine on the survival of HIVpositive men[J]. Epidemiology, 2000, 11: 561570.

  3Sato T, Matsuyama Y. Marginal structural models as a tool for standardization[J]. Epidemiology, 2003, 14: 680686.

  4李智文, 刘建蒙, 任爱国. 基于个体的标准化法倾向评分加权[J]. 中华流行病学杂志,2010,31(2):104107.

  5Sturmer T, Rothman KJ, Glynn RJ. Insights into different results from different causal contrasts in the presence of effectmeasure modification[J]. Pharmacoepidemiol Drug Saf, 2006, 15: 698709.

  6Kurth T, Walker AM, Glynn RJ, et al. Results of multivariable logistic regression, propensity matching, propensity adjustment, and propensitybased weighting under conditions of nonuniform effect[J]. Am J Epidemiol, 2006, 163: 262 270.

  7D’Agostino RB Jr. Propensity score methods for bias reduction in the comparison of a treatment to a nonrandomized control group[J]. Stat Med, 1998, 17:22652281.

  订阅登记:

请您在下面输入常用的Email地址、职业以便我们定期通过邮箱发送给您最新的相关医学信息,感谢您浏览首席医学网!

邮箱:    专业:    职称:      

医学期刊医学会议医学专区医学护理