注册 | 登录 | 充值

首页-> 学术资讯 -> 临床研究

从一项研究说起,看看那些年火到现在的倾向性评分(PSM)

临床研究

1970-01-01      

4153 0

众所周知,随机对照试验(RCT)能提供高等级的证据。然而,并不是所有的问题都能通过RCT来解决。例如要探讨大学教育会不会影响收入,你不能找一群考上大学的高三毕业生随机分成两组,一组上大学,一组不上大学,待四年之后前瞻性观察两组的收入吧?(要是我考上清华北大,却被分到不上大学那组,多不人道啊!)因此有些研究问题不得不使用观察性研究方法。

 

但是,观察性研究不可避免的会存在选择偏倚,例如上大学的人在某些方面(例如学习能力)和没上大学的人存在差异,这些差异对研究终点(收入)又可能产生影响。为解决这一窘境,倾向值分析(匹配是其中的一种)应运而生,并最早应用于社会学研究,后来又进一步应用于医学领域。

 

倾向值指的是被研究个体在控制可观察到的混杂变量的情况下,接受某种干预(治疗)的条件概率。PSM的精髓在于将众多可观察到的混杂变量整合成一个变量——倾向值,由于具有相同或相近倾向值的个体的其他变量在分布上具有相同的特征,故将处理组和对照组的个体根据倾向值进行匹配,从而平衡两组样本的基线数据(想一想,这不就达到类似随机分组的效果了吗?)。由于混杂变量在倾向值匹配的过程中被控制起来,两组结局上的差异就只能归因于干预措施的有无了。

 

下面我们以2006年发表在European Heart Journal上的一篇文章来简要介绍下1:1 PSM的原理和步骤。


研究背景及目的:长期使用利尿剂对慢性心衰患者预后的影响
 

非保钾利尿剂由于有激活神经内分泌系统的作用,对慢性心衰患者的预后可能有害,该研究旨在探究长期使用利尿剂对慢性心衰患者预后的影响。
 

研究方法


研究人群:Digoxin Investigation Group (DIG)研究队列,共6067名患者入选(排除使用螺内酯和其他保钾利尿药者),应用PSM进行1:1配对,最后共纳入2782名患者进行分析,包括1391名利尿剂使用患者和1391名未使用利尿剂患者。

 

主要终点事件:全因死亡

 

次要终点事件:心衰相关死亡、全因再住院、心衰再住院

 

第1步:计算倾向值

 

运用多因素Logistic回归,以处理因素(是否接受利尿剂治疗)为因变量,以其他可观察到的基线变量为自变量来计算倾向值,作者同时考虑了自变量间的交互作用。

 

倾向值计算的过程中,选择自变量应注意以下几点:

(1)排除与处理因素有关,但与结局无关的变量

(2)排除可能由处理因素的施加而发生改变的变量

(3)排除可以完美预测处理因素的变量

(4)客观变量较主观变量在减小混杂方面更具优势

 

第2步:根据倾向值对处理组和对照组研究对象进行1:1的匹配,共2782名患者配对成功。

 

第3步:检查匹配后的基线是否平衡(在此之前可以列出匹配前的基线表,以便与匹配后的进行对比),作者用绝对标准化差值(Absolute Standardized Difference, ASD)来检查配对效果,ASD<10%提示变量在两组间平衡。可以看出,两组配对的效果较好,图中匹配后小方块都落在0-10%的区域内(图1)。

 

 也可用t检验、秩和检验和卡方检验来评估配对后基线是否平衡。若匹配后两组间基线无统计学差异,则进行下一步分析;若匹配后仍发现两组间有关键变量不平衡,则返回第一步检查并调整Logistic方程中的变量。

 

第四步:保存匹配后的样本数据,运用Cox比例风险模型评估长期使用利尿剂对结局的影响。结果提示长期使用利尿剂可以增加心衰患者的全因死亡率、心衰相关死亡率、全因再住院率和心衰再住院率。

 

第五步:敏感性分析

 

观察性研究的短板之一是干预组和对照组在实施干预之前某些方面可能存在差异,这些差异会导致研究结果产生偏性。在这些差异中,能从现有的数据中观察到的偏差,称为显性偏差;未能观察到或记录下来的偏差,称为隐性偏差。与之相对应的,RCT对干预组和对照组研究对象的随机分配,能够平衡两组已知的、未知的基线特征,使得两组存在显性偏差或隐性偏差的概率很小。

 

PS的计算是基于可观察到的变量,即PS仅能修正显性偏差,而无法修正隐性偏差。因此,评价倾向值分析的结果对隐性偏差的敏感性显得非常重要。统计学家为此引入一个统计量 Γ(伽马)——隐性偏差将暴露比提高到原来的 Γ倍时分析结果发生质变。当 Γ很小,接近1时,提示较小的隐性偏差即可改变分析结果,那么该研究结论就是敏感的。如果需要 Γ的极值才能改变统计推论,那么该项研究就是不敏感的。该研究敏感性分析发现,隐性偏差仅需使暴露比增加12%即可改变结论,即结论对隐性偏差敏感。


研究结论
 

长期使用利尿剂可增加慢性心衰患者的远期死亡率,但该结论对隐性偏差敏感。(表1)

延伸阅读
 

倾向值分析的一个重要假设是强可忽略的干预分配。所谓强可忽略的干预分配,就是假设计算倾向评分的协变量包括了所有影响分组的混杂因素,即不存在未识别的混杂因素。或者说在现有观察变量条件下,处理因素的分配可以认为是随机的。在实际工作中,一般很难做到将所有混杂因素均包括在模型中。但如果研究者能够根据专业知识收集到尽可能全面的主要混杂因素,则倾向评分法的研究结果将非常近似随机对照研究的结果。

 

参考文献

1. Behav Res Ther. 2017. pii: S0005-7967(17)30014-1.[Epub ahead of print]

2. Eur Heart J. 2006,27:1431-9.

3. 胡安宁.《倾向值匹配与因果推论:方法论述评》.

4. 郭申阳.《倾向值分析:统计方法与应用》.



科研资讯(站内): 临床研究,医学统计,研究设计,统计咨询,研究方法,研究进展,医咖会,研医论道,yikahui,yika

百度浏览   来源 : 医咖会   


版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。

科研搜索(百度):医学科研 临床研究,医学统计,研究设计,统计咨询,研究方法,研究进展,医咖会,研医论道,yikahui,yika





发表评论

注册或登后即可发表评论

登录注册

全部评论(0)

没有更多评论了哦~

科研资讯 更多>>
  • 肿瘤电场治疗Optune Lua获批治疗..
  • 成本更低的实体瘤抗癌新星:CAR-..
  • 文献速递-子宫内膜癌中的卵黄囊..
  • Nature|MSCs首次用于人体跟腱病..
  • 推荐阅读 更多>>
  • 美国大选预测为啥不靠谱?说说“..
  • 了解ROC曲线下面积,有这篇文章..
  • 临床试验2/3期无缝设计是个啥?..
  • 多图实例:教你绘制ROC曲线..
    • 相关阅读
    • 热门专题
    • 推荐期刊
    • 学院课程
    • 医药卫生
      期刊级别:国家级期刊
      发行周期:暂无数据
      出版地区:其他
      影响因子:暂无数据
    • 中华肿瘤
      期刊级别:北大核心期刊
      发行周期:月刊
      出版地区:北京
      影响因子:1.90
    • 中华医学
      期刊级别:CSCD核心期刊
      发行周期:周刊
      出版地区:北京
      影响因子:0.94