灰色关联法是一种通过研究数据关联性大小,从而反映各因素对目标值的重要程度的研究方法。常与其他方法结合使用确定权重。
本例中收集了最近6年的电影票房信息,以及可能有关的影响因素信息。希望通过灰色关联分析,分析各因素对电影票房的影响。
数据录入
灰色关联通常包括以下五个步骤:
第一步:确定母序列和特征序列,且准备好数据格式。
母序列又可以称为参考值列,即研究的目标列。票房就是本次分析的‘母序列’。
特征序列用于与母序列进行比较,也称为比较序列。除年份、票房以外的其他指标列均为特征序列。
第二步:针对数据进行无量纲化处理(通常情况下需要)。
看上表可以发现,不同量纲造成不同指标的数据有大有小,为了消除不同变量不同量纲的影响因此在分析前需要先对数据进行处理,常见的处理方法可分为:标准化和初值化。两者并没有什么固定的使用标准,初值化对数据格式要求更严格,建议使用均值法。
第三步:求解母序列和特征序列之间的灰色关联系数值。第四步:求解关联度值。第五步:对关联度值进行排序,得出结论。
后面三步可由SPSSAU自动得出结果,就先不展开说明,在后面的结果分析中会再提到。
将整理好的数据上传分析,选择【权重计算】-【灰色关联法】,放入分析项。无量纲化处理选择【初值化】,点击开始分析。
SPSSAU-灰色关联分析
①关联系数结果
上表输出即为关联系数结果,结合关联系数可计算出关联度结果,即表2输出的结果,用于评价判断。
②关联度结果
从表中可以看出按照关联度值大小排名,值越大代表其与“参考值”(母序列)之间的相关性越强。因此排序结果为:观影人次>影院数量>人均消费性支出>银幕数量>电影产量>上座率>平均票价。
总结:影响电影票房的最主要影响因素是观影人次,其次是影院数量。上座率和平均票价对电影票房的实际影响较小。
1、灰色关联分析对于数据格式要求严格,请按照事例进行,母序列或特征序列均分别为一列;
2、如果没有放置母序列,SPSSAU默认会以特征序列的最大值作为母序列值。
3、灰色关联分析时,数据一定需要大于0,原因在于如果小于0进行计算时会出现‘抵消’现象,并不符合灰色关联分析的计算原理。如果出现小于0数据,建议作为空值处理或者填补(SPSSAU异常值功能)。
4、关于数据无量纲化方法分别是均值化和初值化,二者并无固定使用标准,初值化对数据格式要求更严格,SPSSAU建议使用均值法。
更多干货内容可登录SPSSAU官网查看
SPSSAU:回归分析的常见误用,有没有你犯过的错
SPSSAU:多重共线性问题,如何解决?
SPSSAU:回归分析超实用总结
上一篇