自变量存在异常值

如题所述

自变量存在异常值有以下方法处理:
(1)手动移除出共线性的自变量
先做下相关分析,如果发现某两个自变量X(解释变量)的相关系数值大于0.7,则移除掉一个自变量(解释变量),然后再做回归分析。但此种办法有一个小问题,即有的时候根本就不希望把某个自变量从模型中剔除,如果有此类情况,可考虑使用逐步回归让软件自动剔除,同时更优的办法可能是使用岭回归进行分析。
(2)逐步回归法
让软件自动进行自变量的选择剔除,逐步回归会将共线性的自变量自动剔除出去。此种解决办法有个问题是,可能算法会剔除掉本不想剔除的自变量,如果有此类情况产生,此时最好是使用岭回归进行分析。
(3)增加样本容量
增加样本容量是解释共线性问题的一种办法,但在实际操作中可能并不太适合,原因是样本量的收集需要成本时间等。
(4)岭回归
上述第1和第2种解决办法在实际研究中使用较多,但问题在于,如果实际研究中并不想剔除掉某些自变量,某些自变量很重要,不能剔除。此时可能只有岭回归最为适合了。岭回归是当前解决共线性问题最有效的解释办法,但是岭回归的分析相对较为复杂,后面会提供具体例子,当然也可以参考SPSSAU官网岭回归说明。

链接:https://www.zhihu.com/question/34587423/answer/660652731
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
温馨提示:答案为网友推荐,仅供参考

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网