var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

怎样实现多重共线性和回归分析

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-04

在数据分析回归中,多重共线性是指自变量相关的程度。在以下情况下存在多重共线性:

1、我们要知道一个自变量与另一个自变量相关。

2、一个自变量与两个或多个自变量的线性组合相关。

3、在CPDA数据分析师课程中,我们带领学员研究多重共线性对回归分析的影响。

 

在多重共线性中存在着哪些问题

多重共线性是回归分析的一部分,CPDA数据分析师在检查回归系数以评估自变量的相对影响。他们查看系数的大小,并测试系数的统计显着性。

如果特定变量的系数显着大于零,则CPDA数据分析师认为该变量有助于回归方程的预测能力。以此方式,数据分析师可以将对预测更有用的变量与较不有用的变量区分开。

 

在我们作统计时当多重共线性小时,这种分析才有意义。但是当多重共线性很好时是有问题的。原因如下:

CPDA数据分析师在做数据分析之前的统计时当一个自变量与另一个自变量(或与两个或多个其他自变量的组合)完全相关时,则不存在用于回归系数的小二乘解。

而当一个自变量与另一个自变量(或与两个或多个其他自变量的组合)高度相关时,该自变量的边际贡献会受到其他自变量的影响。

终可能形成的结果是:回归系数的估计值可能不可靠。

回归系数的显着性检验可能会产生误导。

再我们做数据分析师要考虑到这一点,回归系数的分析应取决于多重共线性的程度。这意味着在分析回归系数之前,应先进行多重共线性分析。

 

如果一组自变量的特征是多共线性,则回归系数的分析应该很简单。如果存在多个多重共线性,那么该分析将难以解释并且可以跳过。

 

CPDA特别提醒:数据分析师在做数据分析时要注意多重共线性使得很难评估自变量的相对重要性,但不会影响回归方程对预测的有效性。即使多重共线性很好,在数据分析时小二乘回归方程也可以具有很高的预测性。因此,如果CPDA数据分析师仅对预测感兴趣,则多重共线性不是问题。

 


Prev article

在数据分析时怎样对多重共线性测量的测量方法

Next article

什么叫线性回归

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务