在处理实际问题中,问题是错综复杂的,因此在建立实际问题的回归模型的时候,通常会出现一些因素随着解释变量观测值的变化而对解释变量产生不同的影响,导致随机误差项产生不同的方差
我们将数据导入后对其进行回归分析并且保存其为标准化的残差,具体做法参照
我们通过绘制其参残差的散点图来观察其残差的分布情况,如下图
通过观察这张散点图我们可以发现其残差分析图中具体呈现出的趋势为前面密集后面稀疏的趋势,像是一个喇叭状的数据分布,即随着自变量x的增加其误差也随之增加,为进一步验证我们的其具有异方差性的猜想,对其进行斯皮尔曼等级相关系数的相关性分析
首先我门需要对残差进行求绝对值,点击转还->计算变量->目标变量输入abse->数学表达是输入绝对值函数->确定
之后点击分析->相关->双变量->勾选上斯皮尔曼->确定
查看上述得到的结果我们可以看出,r=0.576,其p值=0.01,小于0.05,拒绝原假设,认为残差的绝对值与自变量之间显著相关存在异方差性,在此次示例中我们采用加权最小二乘法,这个一个较为常用的做法,其主要的思想是在平方和中加入一个适当的权函数 omega_{i} ,以调整各项平方和中的作用
首先我们需要寻找最优的权函数,点击分析->回归->权重估算,将应变量和自变量放入其中,并将存在异方差性的自变量放入权重变量中
可以得到其对数的似然值如下图所示
从中我们可以看出其权函数m=2.0的时候取到最优,我们也可以通过扩大权函数的估算范围来寻找最优的权函数,本例中当m=2.5时其对数似然值略大于m=2其差别不大,这里不做示例,我们选择m=2来计算
第一步,其幂指数m=2,对应的权函数 omega=1/x^{m} ,即omega=1/x^{2},通过变量转换计算
第二步,进入线性回归交互框,把第一步计算出来的 omega_{i} 选入WLS权重变量框
第三步,点击线性回归对话框,保存选项卡,保存残差变量,可以根据需要选择未标准化和标准化的残差,运行回归模型得到加权残差e,再计算权变换残差 sqrt{omega_{i}}e
第四不,以自变量x为横轴,以权变换残差sqrt{omega_{i}}e为纵轴画出残差图
从残差图中可以看出异方差问题已经解决,但是有两个数据点似乎成为了异常值点,也可以将这两个异常值点进行剔除再重新拟合方程这里不做过多的赘述。
加权最小二乘是以牺牲大方差项的拟合效果为代价改善了小方差项的拟合效果,但这也并不总是研究者所需要的,在一些特定的场合即便数据存在异方差性,也可以选择使用普通最小二乘估计
多元回归分析中,对待异方差的处理我们选取等级相关系数最大的自变量来构造权函数
1、图示法
通过绘制其函数残差 e_{t} 于 e_{t-1} 的散点图大致呈下图所示的分布则认为其存在自相关性,按照时间顺序绘制回归残差项e_{t}的图形,其随t的变化逐次有规律的呈现锯齿或循环形状的变化,就可以说明其残差存在自相关性
图一图二
2、自相关系数
3、DW检验
1、跌代法
y^{,} = y_{t}-rho y_{t-1}
x^{,} = x_{t}-rho x_{t-1}
beta_{0}^{,} = beta_{0}(1-rho)
由于上述的式子中自相关系数 rho 是未知的,需要对其进行估计 tilde{rho}approx1-frac{1}{2}DW
示例:
在线性回归交互框中点击统计->残差->德宾-沃森->继续->确定
之后我们得到的结果中我们可以看到模型摘要的表格中
从上面的表格我们可以看出其DW值为0.663,经过查表可以得到其具有自相关性,同时我们也可以通过主管的判读其值接近2的时候才没有自相关性
首先我们需要分布计算x,y的延迟一阶,点击转换->计算变量,在计算变量的交互框中运用lag()函数计算其延迟一阶
之后我们运用公式计算其 x^{,} 和 y^{,} ,如图
之后将得到的x^{,} 和 y^{,},放入到线性回归的交互框中
查看其模型摘要的数据表可以看出其DW=1.360,经查表得其落在了不能确定其是否具有自相关性的区域,对其进行延迟二阶的计算后得到的DW值变小,则我们可以不继续进行延迟二阶的操作,其自相关性研究基本解决
通过观察其系数我们可以得到他的方程为
y^{,}=0.173x^{,}-0.3
将其还原则其方程为
y_{t}-y_{t-1}=0.173(x_{t}-x_{t-1})-0.3
2、差分法
一阶差分法适用于原模型具有较高程度的一阶自相关的情况,当 rho=1时,其式为
y_{t}-y_{t-1}=beta(x_{t}-x_{t-1})-(varepsilon_t-varepsilon_{t-1})
Delta y_{t} = beta Delta x_{t} +mu
差分法存在的原因:
示例:
我们通过相同的方法计算出自变量和因变量的延迟一阶之后,在转换变量中计算出其 Delta x,Delta y
之后我们将这两变量放入到线性回归模型的交互框中,值得注意的是在这里我们需要点击选项->取消勾选方程中的常量->继续
通过模型摘要我们可以看出其DW=14.62,经查表得其已经落入无自相关区域,且其模型的拟合优度也较好
通过观察其系数表可以看出其系数P值为0.0001,非常显著,得到其模型方程为
Delta y = 0.169Delta x
还原其方程得
y_{t}-y_{t-1} =0.169 ( x_{t}-x_{t-1})
烤魚是我們經常吃的一道美味佳肴,在各大城市的美食街裡面,烤魚店隨處可見,特別是一線城市的商場餐飲檔,總是人滿為患。說...
在安装新风机的时候,有朋友经常在参数指标栏中看到“机外静压**Pa”,但你知道这机外静压指的是什么吗?机外静压、动压和新风 ...