CPDA在对项目的数据分析中处理多重共线性的方法
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-04
CPDA数据分析师在做一项数据分析时如果只想预测因变量的值,我们就不必担心多重共线性。在做多元回归时可以产生一个回归方程,即使我们得自变量高度相关,回归方程也将为数据分析师做很好的服务。
当学员要评估具有高R 2 k(或等效地,高VIF k)的自变量的相对重要性时,这时我们在做分析得过程中就会出现问题。
如果遇到这样的情况,CPDA数据分析师建议学员尝试以下操作:
我们要重新设计研究以避免多重共线性。如果CPDA数据分析师学员在进行真正的实验,则由实验者控制治疗水平。选择治疗水平以小化或消除独立变量之间的相关性。
在数据分析时利用增加样本量。在其他条件相同的情况下,更大的样本意味着减少的采样误差。提高的精度可以克服多重共线性带来的潜在问题。
我们可以通过删除一个几个高度相关的自变量,然后根据其余变量定义一个新的回归方程。由于删除的变量是多余的,因此新方程式的预测性应与旧方程式几乎相同。系数应该更容易解释,因为多重共线性降低了。
我们要定义一个新变量,该变量等于高度相关变量的线性组合,然后使用新变量代替旧的高度相关变量,定义一个新的回归方程。
CPDA数据分析师提示:在做数据分析时多重共线性仅影响高度相关的变量。如果您感兴趣的变量的R 2 j较小,则对其回归系数进行统计分析将是可靠且有益的。即使其他变量表现出较高的多重共线性,该分析也是有效的。
在数据分析时怎样对多重共线性测量的测量方法:
http://www.chinacpda.com/data/detail/?id=669
怎样实现多重共线性和回归分析:
http://www.chinacpda.com/data/detail/?id=668
更多数据分析方法知识点:
http://www.chinacpda.com/data/
查找您周边省份授权培训中心:
http://www.chinacpda.com/train/
2020年CPDA数据分析师线上报名:
http://www.chinacpda.com/baoming.php
免费客服热线:400-050-6600
商业联合会数据分析专业委员会