異質性(heterogeneity)其實也就是我們經常所謂的差異、差別。它可以是個體層面上,也可以是群體層面上。前者屬於個體異質性,後者屬於總體異質性。異質性無處不在,這也是社會科學研究的真正本質。定量的社會科學研究所做的也就是在於理解或認識異質性的主要來源,為此很重要的方式之一就是做社會分組(謝宇,2012)。所以我們總是在研究中運用從最簡單的t檢驗、方差分析到更為復雜點的多元回歸分析等統計分析方法來幫助我們做得更合理、更科學。不過,很多的統計方法都假定總體是同質的。比如,t檢驗和方差分析中的零假設都是群體之間無差異,而僅含主效應的回歸分析也主要是對所有個體擬合一個回歸方程。所以,實際研究中,經常看到數據被當作仿佛是從一個單一總體中得到而加以分析,盡管往往樣本中所有的個體可能並不具有相同的一套參數值。實際上,研究者們也經常意識到一個總體可能異質的,是由多個不同的子總體混合而成的,比如男性和女性、城鎮居民與農村居民。為此,嘗試在模型設定和選擇上盡可能地考慮能放寬同質性總體假定,以便得到更合理的認識或對更復雜的理論假說做出實證檢驗。
最簡單的處理就是納入虛擬變量。比如,在工資收入的Mincer方程中納入性別虛擬變量female(0=男性,1=女性):
Yi= β0+ β1expi + β2edui+ β3femalei + εi
其中i表示個體,exp為工齡,edu為受教育年限。
很明顯,上述方程對應著兩個方程:
對於男性,Yi =β0 + β1expi +β2edui + εi,
對於女性,Yi =(β0 + β3) + β1expi + β2edui+ εi
表明工齡和受教育年限的收入對男性和女性是一樣的,但兩者在收入平均水平上具有異質性。
更徹底考慮男性和女性兩個子總體異質性的做法是進一步納入exp和edu同female之間的交互項,即:
Yi =β0 + β1expi +β2edui + β3femalei + β4 (femalei×expi) +β5 (femalei×expi) + εi
同樣的,
對於男性,Yi =β0 + β1expi +β2edui + εi,
對於女性,Yi =(β0 + β3) + (β1+ β4)expi + (β2+ β5)edui + εi
顯然,此模型意味著男性和女性兩個子總體不僅收入平均水平不同,同時工齡和受教育程度的收入回報也有差別。註意,這裡涉及虛擬變量與其他變量的完全交互,在總體性別參數估計值上與分男性和女性樣本分別進行回歸是等價的。
另外,上一主效應的模型被稱作加法模型,後一納入交互項的模型被稱作乘法模型。
往期文章
ASC替代常數項的作用:異質性分析
混合Logit模型估計中Halton抽樣使用的原因及方法
選擇實驗數據整理
【選擇實驗法應用】訂單農業契約屬性安排: 農戶風險態度與契約選擇決策
【選擇實驗法應用】農村居民流域生態治理參與意願的距離效應潛分類logit模型的STATA應用及結果解讀
混合logit模型(隨機參數模型)的STATA應用及結果解讀
歡迎關註公眾號:【阡陌興致】投資、社會感想歡迎關註公眾號:【選擇實驗法沙龍】學習和探討選擇實驗法歡迎關註知乎專欄【選擇實驗法】學習和探討選擇實驗法