![]() 計量社群微信群有一個問題很有意思,如下: 工具變量IV回歸第一階段系數符號到底要不要符合預期?還是說第一階段系數符號無所謂,只要顯著就行? 有人說,如果第一階段回歸系數與預期相反,那可以用工具變量的倒數或負數作為工具變量,這樣就會與預期相符合呢? 這種說法正確么? 根據計量社群的微信群討論以及翻看Angrist的《基本無害的計量經濟學》得到一些答案。 工具變量回歸的第一階段系數不僅要顯著,還需要符合理論預期的方向。 忽視符號問題可能導致對工具變量有效性的錯誤判斷,進而使第二階段估計結果失去解釋力。 *下面是Angrist MHE里的內容:
首先,為什么第一階段系數符號如此重要? 工具變量方法依賴兩個核心條件,相關性,即工具變量Z與內生解釋變量X顯著相關;排他性約束,即工具變量Z只能通過X影響因變量Y,不能有其他直接途徑。 第一階段系數的大小反映相關性的強弱,而其符號方向則檢驗理論邏輯是否成立。 即便系數顯著,但方向與預期相反,可能意味著,工具變量通過其他渠道直接影響因變量,違反排他性約束;模型設定錯誤,例如遺漏關鍵控制變量或使用了不恰當的函數形式;理論邏輯有誤,對工具變量和內生變量關系的假設不成立;數據存在測量誤差、異常值或樣本選擇偏差。 在這種情況下,繼續使用該工具變量可能比OLS估計造成更嚴重的偏誤。 其二,第一階段結果IV的系數四種情境。 ![]() 其三,為什么不能簡單改變工具變量的形式進行操作? 有群友提出,可以把工具變量取負值或做變換,使系數方向與預期一致。 但這種做法只是形式上的改變, 數學上,把Z替換為-Z,確實會使第一階段系數符號翻轉,但對第二階段IV估計結果沒有任何實質性影響; 實質上,這并沒有解決工具變量可能存在的外生性問題或理論邏輯問題。 翻轉符號只是掩蓋問題,而不是解決問題。如果方向和預期不符,研究者應該回頭重新審視理論、數據與模型,而不是通過機械操作粉飾結果。 其四,那么在實證研究中正確的做法是什么? 首先,咱們還是得理論先行,在提出工具變量時,明確論證其與內生變量的關系,并給出合理的方向預期。 其次,建議在第一階段回歸后,不僅要檢查統計顯著性,還要檢查符號是否符合理論邏輯。 若符號不符,應考慮是否遺漏了重要控制變量;數據是否存在質量問題;工具變量是否可能違反排他性約束;理論設定是否需要修正。 在符號問題沒有解釋清楚之前,不建議直接進入第二階段回歸。 經濟學實證研究的普遍共識是,一個合格的工具變量必須既顯著相關,又符號合理。
7年,計量經濟圈近2000篇不重類計量文章, 可直接在公眾號菜單欄搜索任何計量相關問題, Econometrics Circle |
|