异方差和自相关

一、异方差

在处理实际问题中,问题是错综复杂的,因此在建立实际问题的回归模型的时候,通常会出现一些因素随着解释变量观测值的变化而对解释变量产生不同的影响,导致随机误差项产生不同的方差

异方差对最小二乘估计的影响:

  1. 参数估计值虽然是无偏的,但不是最小方差线性无偏
  2. 参数的显著性检验失败
  3. 回归方程应用及其不理想

异方差检验方式

  1. 残差图分析法——>这是一种主观的分析方法
  2. 等级相关系数法——->使用斯皮尔曼等级相关系数

异方差性的处理方法:

  1. 加权最小二乘法
  2. BOX-COX变换法
  3. 方差稳定性变换法

示例

我们将数据导入后对其进行回归分析并且保存其为标准化的残差,具体做法参照

我们通过绘制其参残差的散点图来观察其残差的分布情况,如下图

通过观察这张散点图我们可以发现其残差分析图中具体呈现出的趋势为前面密集后面稀疏的趋势,像是一个喇叭状的数据分布,即随着自变量x的增加其误差也随之增加,为进一步验证我们的其具有异方差性的猜想,对其进行斯皮尔曼等级相关系数的相关性分析

首先我门需要对残差进行求绝对值,点击转还->计算变量->目标变量输入abse->数学表达是输入绝对值函数->确定

之后点击分析->相关->双变量->勾选上斯皮尔曼->确定

查看上述得到的结果我们可以看出,r=0.576,其p值=0.01,小于0.05,拒绝原假设,认为残差的绝对值与自变量之间显著相关存在异方差性,在此次示例中我们采用加权最小二乘法,这个一个较为常用的做法,其主要的思想是在平方和中加入一个适当的权函数 omega_{i} ,以调整各项平方和中的作用

首先我们需要寻找最优的权函数,点击分析->回归->权重估算,将应变量和自变量放入其中,并将存在异方差性的自变量放入权重变量中

可以得到其对数的似然值如下图所示

从中我们可以看出其权函数m=2.0的时候取到最优,我们也可以通过扩大权函数的估算范围来寻找最优的权函数,本例中当m=2.5时其对数似然值略大于m=2其差别不大,这里不做示例,我们选择m=2来计算

第一步,其幂指数m=2,对应的权函数 omega=1/x^{m} ,即omega=1/x^{2},通过变量转换计算

第二步,进入线性回归交互框,把第一步计算出来的 omega_{i} 选入WLS权重变量框

第三步,点击线性回归对话框,保存选项卡,保存残差变量,可以根据需要选择未标准化和标准化的残差,运行回归模型得到加权残差e,再计算权变换残差 sqrt{omega_{i}}e

第四不,以自变量x为横轴,以权变换残差sqrt{omega_{i}}e为纵轴画出残差图

从残差图中可以看出异方差问题已经解决,但是有两个数据点似乎成为了异常值点,也可以将这两个异常值点进行剔除再重新拟合方程这里不做过多的赘述。

注意:

加权最小二乘是以牺牲大方差项的拟合效果为代价改善了小方差项的拟合效果,但这也并不总是研究者所需要的,在一些特定的场合即便数据存在异方差性,也可以选择使用普通最小二乘估计

多元回归分析中,对待异方差的处理我们选取等级相关系数最大的自变量来构造权函数

二、自相关

1、自相关产生的原因

  1. 遗漏关键变量时会产生序列的自相关性
  2. 经济变量的滞后性会给序列带来自相关性
  3. 采取错误的回归函数形式可能引起自相关性
  4. 蛛网现象可以带来序列的自相关性
  5. 因对数据加工整理而导致误差项之间产生自相关性

2、自相关性所带来的问题

  1. 参数的估计值不再具有最小方差线性无偏性
  2. 均方误差可能严重低估误差项的方差
  3. 容易导致T值评价过高,常用的F检验和T检验失效
  4. 其系数的估计量可能不符合真实情况
  5. 会对模型的预测和结构分析带来较大的方差甚至错误的解释

3、诊断方法

1、图示法

通过绘制其函数残差 e_{t}e_{t-1} 的散点图大致呈下图所示的分布则认为其存在自相关性,按照时间顺序绘制回归残差项e_{t}的图形,其随t的变化逐次有规律的呈现锯齿或循环形状的变化,就可以说明其残差存在自相关性

图一图二

2、自相关系数

3、DW检验

4、处理方法

1、跌代法

y^{,} = y_{t}-rho y_{t-1}

x^{,} = x_{t}-rho x_{t-1}

beta_{0}^{,} = beta_{0}(1-rho)

由于上述的式子中自相关系数 rho 是未知的,需要对其进行估计 tilde{rho}approx1-frac{1}{2}DW

示例:

在线性回归交互框中点击统计->残差->德宾-沃森->继续->确定

之后我们得到的结果中我们可以看到模型摘要的表格中

从上面的表格我们可以看出其DW值为0.663,经过查表可以得到其具有自相关性,同时我们也可以通过主管的判读其值接近2的时候才没有自相关性

首先我们需要分布计算x,y的延迟一阶,点击转换->计算变量,在计算变量的交互框中运用lag()函数计算其延迟一阶

之后我们运用公式计算其 x^{,}y^{,} ,如图

之后将得到的x^{,}y^{,},放入到线性回归的交互框中

查看其模型摘要的数据表可以看出其DW=1.360,经查表得其落在了不能确定其是否具有自相关性的区域,对其进行延迟二阶的计算后得到的DW值变小,则我们可以不继续进行延迟二阶的操作,其自相关性研究基本解决

通过观察其系数我们可以得到他的方程为

y^{,}=0.173x^{,}-0.3

将其还原则其方程为

y_{t}-y_{t-1}=0.173(x_{t}-x_{t-1})-0.3

2、差分法

一阶差分法适用于原模型具有较高程度的一阶自相关的情况,当 rho=1时,其式为

y_{t}-y_{t-1}=beta(x_{t}-x_{t-1})-(varepsilon_t-varepsilon_{t-1})

Delta y_{t} = beta Delta x_{t} +mu

差分法存在的原因:

  1. 迭代法需要用样本估计自相关系数 rho ,对其估计误差会影响迭代法使用的效率
  2. 差分法比迭代法简单

示例:

我们通过相同的方法计算出自变量和因变量的延迟一阶之后,在转换变量中计算出其 Delta x,Delta y

之后我们将这两变量放入到线性回归模型的交互框中,值得注意的是在这里我们需要点击选项->取消勾选方程中的常量->继续

通过模型摘要我们可以看出其DW=14.62,经查表得其已经落入无自相关区域,且其模型的拟合优度也较好

通过观察其系数表可以看出其系数P值为0.0001,非常显著,得到其模型方程为

Delta y = 0.169Delta x

还原其方程得

y_{t}-y_{t-1} =0.169 ( x_{t}-x_{t-1})

发表回复

相关推荐

銘萬眾籌丨烤魚應該選什麼魚?去到餐館不再蒙圈,順便學習一款傢常烤魚做法

烤魚是我們經常吃的一道美味佳肴,在各大城市的美食街裡面,烤魚店隨處可見,特別是一線城市的商場餐飲檔,總是人滿為患。說...

· 2分钟前

静压、动压、全压、余压,在装中央新风系统之前一定要搞清的概念

在安装新风机的时候,有朋友经常在参数指标栏中看到“机外静压**Pa”,但你知道这机外静压指的是什么吗?机外静压、动压和新风 ...

· 4分钟前

書籍的本質到底是什麼?我們為什麼要讀書?

書籍是用文字、圖畫和其他符號,在一定材料上記錄各種知識,清楚地表達思想,並且制裝成卷冊的著作物,為傳播各種知識和思想...

· 17分钟前

防雾眼镜布是智商税吗?哪种防雾眼镜布是真的有用?

冬天到了!又到了起雾的季节! 口罩+眼镜=一秒起雾! 于是眼镜党们的疑惑又来了:如何戴口罩眼镜不起雾? 往年我也有这样烦 ...

· 19分钟前

如何與命運抗爭?

文|袁運錄這是千千萬萬抑鬱癥患者面臨的同樣問題。你為什麼抑鬱?因為你在命運面前被打趴瞭下來,因為你鬥不過命運,所以你才...

· 19分钟前