注册 | 登录 | 充值

首页-> 学术资讯 -> 临床研究

岭回归

临床研究

1970-01-01      

7177 0
一、问题与数据

在前期推送的有关多重线性回归的内容中,我们讨论了当自变量之间存在多重共线性时,可以采用变量剔除和逐步回归的方法,对自变量进行一定的筛选,从而避免在模型拟合时出现多重共线性的问题。

 

但不管是变量剔除还是逐步回归,往往有时候会出现我们所研究的重点因素被剔除了模型,或者该因素估计的偏回归系数与实际明显相反的情况,此时所得出的结论可靠度也较差。当我们希望能够建立因变量与某个给定自变量的回归模型,但在模型中又出现自变量多重共线性时,应该如何进行处理呢?

 

今天我们讨论处理多重共线性的一种常用方法--岭回归
 

岭回归
 

岭回归(Ridge Regression)在1962年首次提出,是采用改进的普通最小二乘法,用于处理自变量多重共线性问题的一种有偏估计回归方法。岭回归放弃了普通最小二乘法的无偏估计,损失了部分信息,因此岭回归方程的R2通常会稍低于普通最小二乘法回归,但其估计的偏回归系数往往更接近真实的情况,从而提高了回归模型的稳定性和可靠性,对于病态数据的修复和拟合,具有较好的效果。


岭参数K值


岭回归的原理较为复杂,简单来说就是通过在正规方程中引入一个有偏常数,通常称为岭参数(K值),从而求得回归估计量。当K=0时即为最小二乘法估计,由于岭回归为有偏估计,K的取值应尽可能小,才能确保更接近于最小二乘法的无偏估计,因此岭回归分析的一个重要问题就是确定岭参数K的最适宜取值。


岭迹分析确定K值


当岭参数K值发生变化时,我们可以将各个自变量的岭迹曲线描绘出来,即对每个自变量绘制出随K值变化而引起岭回归估计值变化的曲线,称作为岭迹图,如图1所示。通过岭迹图分析,根据曲线的变化形状来确定适宜的K值。

 

一般要求当各个自变量的回归系数的岭轨迹基本趋于稳定,用最小二乘法估计时符号不合理的回归系数,其岭估计的符号变得合理,残差平方和增长不太多时,此时对应的K值就是要寻找的最适宜的K值。此外也可以应用方差膨胀因子法,选择的K值使得岭回归估计的所有自变量VIF<10。

图1. 岭迹图


岭回归变量选择


在岭回归中,对自变量的选择可以遵循以下几个参考原则:

 

1. 在岭回归的计算中,由于其回归系数是已经经过标准化了,可以直接比较不同自变量标准化回归系数的大小,因此可以剔除标准化回归系数比较稳定,且绝对值很小的自变量,因为这些自变量对因变量的影响较小。

 

2. 通过岭迹图分析,当K值较小时标准化回归系数并不小,随着K值的增加,标准化回归系数很不稳定,迅速趋近于0,对于此类自变量可以考虑予以剔除。

 

3. 根据上述两个原则,在剔除部分变量后,需要再次进行岭回归分析,根据剔除变量后的拟合效果再做相应的调整。

 

以上是对岭回归基本知识的一个简单介绍,大家最关心的还是如何通过SPSS软件来实现岭回归分析。很遗憾,SPSS并没有直接提供进行岭回归分析的对话框界面,不过没关系,其实SPSS已经为我们提供了一套名为Ridge Regression.sps的程序,隐藏在安装目录中,可以直接进行简单的调用就能实现岭回归的分析。

 

研究问题

 

某研究人员测量了97名受试者的某项生理指标(Y),并收集了他们的性别(Gender)、总胆固醇(CHO)、低密度脂蛋白胆固醇(LDL)、甘油三酯(TG)、C反应蛋白(CRP)等资料,拟探讨这些因素对指标Y的影响。

二、对问题分析

共线性诊断

 

针对该研究问题,判断是一个较为典型的回归分析,因此我们首先构建标准的多重线性回归模型,并进行自变量的共线性诊断(具体操作过程请参照前期推送的多重线性回归的内容)。

 

结果显示,CHO与LDL的相关系数为0.862(P<0.001),呈现高度相关性,同时CHO和LDL的Tolerance均<0.2,VIF值均>5,提示这两个变量之间存在多重共线性。同时,结合专业知识,CHO和LDL对指标Y的影响应为负向影响,但是回归模型估计的偏回归系数却显示,LDL为负向影响,CHO为正向影响,与实际情况矛盾,也提示两者存在多重共线性的问题,因此考虑使用岭回归的方法来进行处理。

 

普通最小二乘法得到的回归方程如下:

Y=1.705*Gender + 1.393*CHO - 1.433*LDL + 0.938*TG + 0.613* CRP + 22.633


三、SPSS操作
请先登录
这么重要的内容,赶快登录查看吧!
登录
四、结果解释
请先登录
这么重要的内容,赶快登录查看吧!
登录
请先登录
这么重要的内容,赶快登录查看吧!
登录


科研资讯(站内): 临床研究,医学统计,研究设计,统计咨询,研究方法,研究进展,医咖会,研医论道,yikahui,yika

百度浏览   来源 : 医咖会   


版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。

科研搜索(百度):医学科研 临床研究,医学统计,研究设计,统计咨询,研究方法,研究进展,医咖会,研医论道,yikahui,yika





发表评论

注册或登后即可发表评论

登录注册

全部评论(0)

没有更多评论了哦~

科研资讯 更多>>
  • 肿瘤电场治疗Optune Lua获批治疗..
  • 成本更低的实体瘤抗癌新星:CAR-..
  • 文献速递-子宫内膜癌中的卵黄囊..
  • Nature|MSCs首次用于人体跟腱病..
  • 推荐阅读 更多>>
  • 加权最小二乘法
  • 卡方拟合优度检验
  • 估计灵敏度和特异度的诊断试验..
  • 主成分分析
    • 相关阅读
    • 热门专题
    • 推荐期刊
    • 学院课程
    • 医药卫生
      期刊级别:国家级期刊
      发行周期:暂无数据
      出版地区:其他
      影响因子:暂无数据
    • 中华肿瘤
      期刊级别:北大核心期刊
      发行周期:月刊
      出版地区:北京
      影响因子:1.90
    • 中华医学
      期刊级别:CSCD核心期刊
      发行周期:周刊
      出版地区:北京
      影响因子:0.94