久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    給中介效應加上因果關系內核, 讓中介分析光明正大走入經濟學研究!

     計量經濟圈 2022-08-25 發布于浙江


    所有計量經濟圈方法論叢的code程序, 宏微觀數據庫和各種軟件都放在社群里.歡迎到計量經濟圈社群交流訪問.

    鑒于,前面針對中介效應的爭議,例如,1.《當代財經》期刊打響了經濟學領域反對溫忠麟中介效應模型的第一槍!2.針對經濟學領域中介效應模型問題的回應和理性討論,3.TOP5刊上五種常用機制分析方法及對應文獻,今天,引薦一篇關于中介效應分析新方法的綜述性文章《經濟學中的因果中介分析:目標、假設和模型》。

    正文

    關于下方文字內容,作者:謝立成, 中南財經政法大學財政稅務學院,通信郵箱:xielicheng666@126.com

    1.將一般DID估計推廣到多期干預前和干預后時期的政策效應, 附code和數據2.AER未監測的污染, DID和事件研究法運用的典范(附代碼)

    Celli, V. (2022). Causal mediation analysis in economics: Objectives, assumptions, modelsJournal of Economic Surveys36214– 234
    Abstract:Mediation analysis aims at identifying and evaluating the mechanisms through which treatment affects an outcome. The goal is to disentangle the total treatment effect into two components:the indirect effect that occurs due to one or more intermediate variables,known as mediators, and the direct effect that captures all other possible explanations for why a treatment works. This paper reviews the methodological advancements in the literature on causal mediation in ecoomics, specifically quasi-experimental designs. I define the parameters of interest, the main assumptions and the identification strategies under the counterfactual approach, and present the Instrumental Variables (IV), Difference-in-Differences (DID), and Synthetic Control (SC) methods.
    經濟學中的因果中介分析:目標、假設和模型

    關于因果中介效應,參看:1.因果中介效應分析出現在頂刊, 是時候使用新方法了,2.政策評估中"中介效應"因果分析, 增添了文獻和Notes,3.自變量和中介變量是內生的情況咋辦?放在因果中介的框架

    摘要:中介效應分析旨在通過處理變量影響結果變量來識別和評估機制。本文的目標是將總的處理效應分解為兩個部分:由一個或多個中間變量(稱為中介變量)產生的間接效應,以及包含所有其他可能解釋處理效應的直接效應。本文回顧了經濟學中因果中介分析的方法論進展,特別是準實驗設計。在反事實方法下,本文定義了重要參數、主要假設和識別策略,并提出了工具變量(IV)、雙重差分(DID)和合成控制方法(SCM)。
    一、引言
    經濟學的大部分文獻集中在因果分析上,這是評估政策處理因果效應的基本方法。因果分析回答了這樣的問題:公共補貼有效嗎? 研發激勵能促進企業創新嗎?然而,這種分析不能回答這些政策干預是否有效的問題。正如Gelman和Imbens(2013)所指出的,在許多問題中,”一因之果”和”一果之因”都是處理變量的效應,即實現總效應的機制都是相關的。在統計學中,標準的因果分析只能揭示一個政策對受到受到干預組別產生的影響。這意味著可以量化這種影響的大小,可以知道政策處理對結果的影響有多大,但這些估計沒有說明影響渠道。雖然知道一些因果效應,但對其因果機制一無所知。
    因果中介分析是一種研究因果機制并試圖回答這些問題的標準統計框架。Imai et al.(2013)將機制定義為一個過程,其中重要的因果關系變量(即處理變量),通過一個中介變量影響結果變量,然后是內生變量,中介變量,它位于處理變量和結果變量之間的因果路徑上。因此,研究因果機制比單獨研究總體效應更有助于理解社會和經濟效應。這使得決策者能夠優化決策,提高效率。
    中介研究的主要領域是心理學和社會學。例如,Brader等人(2008)在估計基于種族的媒介線索對移民偏好的總體效應時,超越了標準的因果分析。他們不是簡單地證明媒介線索是否會影響結果,而是探索這種效應運行的機制。與早期表明基于群體的政治的情感力量的研究(Kinder&Sanders,1996)一致,作者發現基于群體的媒介線索導致的影響是通過改變個體的焦慮水平而產生的。
    另一個例子可以從政治選舉的文獻中借鑒。Gelman和King(1990)發現在選舉中存在顯著的在任優勢。幾年后的1996年,Cox和Kats將在位優勢文獻引向了一個新的方向,他們考慮了在位者為何具有選舉優勢的可能因果機制。他們將在位優勢分解為”威懾/質量效應”和其他因果機制的效應,如知名度和資源優勢。中介機制在教育研究中發揮著越來越重要的作用。根據伽莫蘭(2013,p.23)的描述:“政策研究人員面臨的另一個關鍵挑戰是了解項目和政策運行的機制。迄今為止,許多嚴謹的研究把這個過程當作黑匣子,尋求積極或消極的判斷,而不了解最終的結果是如何達成的。如果政策研究能夠提供更多機制方面的證據,那么下一代教育政策研究將會取得進展,從而政策的關鍵可以獲得支持,并解決未能達到目標的項目中的關鍵問題。”
    在《教育效能研究期刊》(Journal of Research on Educational Effectiveness)最近的一期特刊中,有人認為“這種中介分析的努力是知識構建的基礎,因此應該成為政策評估研究的核心部分,而不是可選的'附加部分’”(Hong, 2012)。教育領域的相關實證研究有Bijwaard和Jones(2019),他們研究了教育通過認知能力對死亡率的影響,以及Heckman等人(2013),他們研究了Perry Preschool計劃通過認知和非認知機制的影響。
    中介機制也是一種有趣而有前途的經濟學方法。然而,經濟學中因果機制的研究有更深入的起源,可以追溯到Sewall Wright(1921,1934)關于路徑分析的工作。一個開創性的例子是弗里希(1938)。根據他的研究,因果模型是基于一個結構方程系統,該系統定義了一組變量之間的因果關系。這些結構方程是由將輸入映射到輸出的確定性函數表示的自主運行機制,引入了因果機制的概念,如Heckman和Pinto(2015a)所述。另一個基本貢獻來自Haavelmo(1943),他在定義”因果關系”時考慮到了一個精確的因果機制,他指出需要指定一個理論模型作為先驗對象,必須用統計測量理論補充,以便擁有經驗相關性和邏輯連貫性。
    最近的例子有Simonsen和Skipper(2006),他們評估了母親身份對工資的直接影響,以及Flores和Flores Lagunes(2009),他們評估了就業團隊項目通過工作經驗對收入的直接影響。其他貢獻包括Huber(2015)的工作,他利用因果機制框架,利用1979年美國全國青年縱向調查的數據或Huber等人(2017)的數據分解工資差距,世衛組織調查了瑞士求職者咨詢過程中更嚴格的個案工作者的就業效應是否通過就業市場項目的安置來調節。另一篇文獻通過分析生產函數來研究產生處理效應的機制。最突出的例子是Heckman和Pinto(2015b),他們研究了在存在未輸入測量或輸入測量誤差的情況下,改變輸入或在輸入和輸出之間移動映射,對結果的總體影響變化。
    然而,盡管中介機制框架對經濟學家很有吸引力,并且因果機制的爭論在經濟學中有著悠久的歷史,但對于哪種方法是最好的來面對這個話題,還沒有達成共識,并且在文獻中可以找到不同的貢獻,如第2節所示。
    本文介紹了在經濟學中使用的主要方法,并開始深入了解以準實驗設計為代表的前沿方法。從目前來看,在因果中介分析中,這些方法還沒有得到認可,這使得準實驗設計成為中介分析中的一個最新視角。
    本文其余部分的組織如下:第2節介紹了經濟文獻中使用的主要方法的概述,第3節顯示了中介分析中的反事實方法,并定義了感興趣的參數;第四節分析中介分析所需的假設;第5節側重于準實驗設計,特別是顯示工具變量(IV),雙重差分(DID)和合成控制方法;第六節給出本文的結論。
    二、因果中介分析的不同方法
    雖然中介分析的魅力對經濟學家和政策制定者很有吸引力,但關于使用哪種方法的辯論仍未結束。
    在經濟學中,研究因果機制的傳統方法是結構方程模型(SEM)——例如,詳參Baron和Kenny(1986)的開創性研究。這種方法將政策處理效應定義為其回歸系數,假設結果變量和中介變量也有兩個參數模型。在這個定義框架中,效應是沒有模型就不存在的數學對象,效應的定義及其估計方法沒有分離(Nguyen等人,2020年)。中介分析研究的是因果效應,但傳統回歸分析的目標可能是因果效應或條件關聯。Imai et al.(2011)強調了這種方法的局限性。作者表明,結構模型是基于誤差項的不可檢驗的假設來給出參數的因果解釋。特別是,他們證明了傳統的外生性假設本身不足以識別因果機制。相反,這些假設是確定傳統平均處理效應(ATE)的充分條件。除此之外,中介可以被解釋為一種中間結果:在這樣的模型中,本文應該控制大量的協變量(處理前和處理后),根據選擇的協變量,有可能產生不同的結果,然后增加估計的敏感性。另一方面,Heckman和Pinto (2015b)論證了計量經濟學方法如何解決潛在的混雜效應,克服了統計學上的機制文獻固有的隱性強假設。特別是,他們展示了如何利用一些處理變量的實驗變化來增加作出因果描述所需的外生性假設的可信度。他們展示了如何在有實驗數據的情況下放寬外生性假設,使線性模型成為分析因果機制的有用工具。
    結構方程的另一個特點是,它們不考慮處理和中介之間的相互作用,這意味著中介對結果的疊加效應不取決于處理變量的值。此外,無論是處理變量對中介變量的疊加效應還是中介變量對結果變量的疊加效應,在所有可觀測個體中都是相同的,這意味著這兩種效應是獨立的。如果使用非線性模型,系數乘積不會產生傳統結構方程模型設定中的間接影響。在這些方面,結構方程模型存在一些局限性,隨著時間的推移,這些局限性已得到廣泛研究和解決。。
    另一種方法是因果推理框架,其效應以非模型的方式定義。一個有用的框架是潛在結果或反事實設定,通常用于政策評估。在這種方法下,結構約束(SEM的典型特征)得到放松,因為它考慮了更一般的識別策略。例如Robins和Greenland (1992), Pearl (2001), Petersen等人(2006),VanderWeele (2009), Imai等人(2010),Hong (2010), Albert和Nelson (2011), Tchetgen和Shpitser (2012), VanderWeele(2012)等等。與經典處理分析一樣,使用反事實方法而不是結構模型可以幫助將因果關系的概念形式化,而無需對參數的函數形式進行假設,并確保更靈活的識別步驟。此外,在這類模型中,不需要知道可能影響設計的整個協變量集。特別是,該方法的一個重要點是區分三個步驟:定義、識別和效應估計。這種區別是根本的,因為采用反事實方法通常不會消除在估計步驟中對一些模型假設的需要。但是,本文不必默認使用一組非模型定義的模型,可以根據數據以及對因果結構擁有或不擁有的先驗知識來考慮使用什么模型(Nguyen et al.,2020)。
    大多數文獻通過假設處理和中介因子在給定觀察特征的情況下是條件外生的來識別,這一假設稱為序列可忽略性,由Imai等人(2010)和Imai等人(2011)提出。作者證明,在此假設下,平均因果中介效應是非參數識別的。這一結果在本文獻中是一個重要的步驟,因為它建立了將中介效應解釋為因果效應所需的最小假設集,而與研究人員使用的統計模型無關(Imai et al.,2010)。然而,這一假設并沒有明確說明處理后的混雜因素,這可能混淆變量之間的關系。為了解決這些局限性,近年來,一些研究人員在中介框架內使用了準實驗設計。幸虧有這些方法,可以使用不同的技術來控制中介的內生性,將在下面的部分中進行解釋。在這類設計中,當對處理組的分配非隨機時,必須評估政策的影響。沒有隨機化,評估設計方面的主要挑戰是找到一個可以與處理組進行比較的對照組。在中介者在場的情況下,出現了額外的復雜性。準實驗設計允許處理變量和中介變量存在內生性,這不能被觀察到的協變量單獨處理。如前所述,本文獻基于反事實設定,其優點是缺乏明確的結果模型,這些方法在獨立性、函數形式、排除和分布假設方面比計量經濟學中的標準結構估計文獻(Heckman,2008)做出的統計性假設更少。另一方面,仍有少數論文在機制中使用這些方法,但在過去幾年中,中介機制文獻對這些技術越來越感興趣。
    三、構建反事實的方法
    3.1反事實中介框架的定義
    最近關于中介分析的研究使用了反事實方法,這是因果推理中常用的框架。它是基于Neyman(1923)提出的隨機實驗的潛在結果設定,然后由Rubin(1974)推廣到觀察性研究.
    根據主要的文獻,形式上本文用D表示二元處理變量,用M表示中介變量,假設它有邊界支持,可以是離散的或連續的,用Y表示結果變量。在這個框架中,潛在的結果被定義為Y(d’,m),潛在中介為M(d), 其中d’∈{0,1}。因此,最終實際的結果值和中介值可以寫成:

    其中下標i是單位觀測值。
    很容易看出,對于每個單元i,只觀察到兩種潛在結果或中介狀態中的一種。因此,不得不面對中介分析中的缺失值問題(Holland,1986)。由于存在兩個驅動變量,本文還必須考慮它們之間潛在的相互作用,從而使分析更具復雜性。
    中介分析的目的是將D對Y的總處理效應分解為間接效應和直接效應。第一個問題反映了政策處理為何有效的一種可能解釋,明確定義了因果效應背后的一種特殊機制,并回答了以下反事實問題:如果中介從在處理條件下(即Mi(1))實現的,改變為到在控制條件下(即Mi(0)),同時保持d的處理狀態,結果會發生什么變化?第二個是直接效應,它代表了處理影響一個結果的所有其他可能的解釋,它對應于當外生性改變處理變量但保持中介變量固定在其潛在值Mi(d)時潛在結果的變化。這些方法評估處理效應的哪一部分是通過某個中間變量產生的,哪一部分是通過其他機制產生的,以便制定更好的政策備選方案。最后,中介分析是一套技術,通過研究人員可以評估這些直接和間接影響的相對規模。
    3.2參數定義
    使用潛在結果表示法,可以定義兩個感興趣的量。值得注意的是,在本節中,假設處理變量是二元變量,d ={0,1},但是很容易將這些反事實的定義擴展到連續處理變量的設定。這兩個數量如下:
    NDE(d):[Yi(1,Mi(d))-Yi(0,Mi(d))]是自然的直接效應,表示如果將處理外生性設定為1到0,結果將發生多大的變化,但對于每個個體,中介因子保持在處理狀態d的水平。它捕捉了如果從處理變量到中介變量的途徑被禁用,則處理變量對結果的影響將保持在什么水平,如圖1所示
    NIE(d):[Yi(d,Mi(1))-Yi(d,Mi(0))]是自然的間接效應,表示如果處理變量設定為等量d,結果會發生多大變化,但中介變量從d =1時的水平改變到d =0時的水平。它捕捉了處理組通過中介作用對結果的影響,如圖2所示。
    這些影響是在個體層面上定義的,這意味著無法在每個觀測i中觀察到它們,因此如果沒有更有力的假設,就無法直接識別它們。原因是,它們是根據相同個體的多個潛在結果定義的,并且在現實中只觀察到其中一個潛在結果。其想法是使用第三種潛在結果Yi(d,Mi(1-d))將個體總效應分為兩個部分。它代表了一個假設狀態,其中處理組設定為一個條件d,但在另一個處理條件1下,中介變量設定為其潛在值1- d、這第三個量從未被觀察到,但它的概念化有助于將總體效果分解為一個有意義的部分。為了識別自然效應,只有兩個中介值相關,即M(0)M(1),即中介在處理組和非處理組條件下自然產生的值,并且它們因個體而異。為了識別這些處理變量的自然效應,本文使用了人口平均數。基于潛在結果框架,本文將平均間接效應(ACME)定義為:

    ACME對應于在處理狀態和非處理狀態下,當外生性地將中介變量轉移到其潛在值,同時保持處理狀態固定在D = d時平均潛在結果的變化。注意,右邊方程只有一個變量是可觀察到的,而另一個變量根據定義是不可觀察的(在處理狀態D下,從未觀察到M在相反的處理狀態下自然會有的值,即M(1-d)
    同樣地,本文將平均直接效應(ADE)定義為:

    它表示當中介變量設定為處理狀態d下可能的潛在值時,處理變量對結果變量的平均因果效應。
    有趣的是,ATE可以很容易地被改寫為對相反的處理狀態的自然直接和間接效應的總和:

    本文通過簡單地在第二個等式后加減反事實量E[Y(0,M(1))],在第三個等式后加減E[Y(0,M(1))]來得到這些結果。這個結果可以用更一般的方式來寫:

    顯然,在沒有進一步假設的情況下,這兩種效應都沒有被確定:對于任何觀測個體,只能觀察到Y(1,M(1))Y(0,M(0))中的一個,因為這兩種結果不能同時觀察到,如因果推理的基本問題(Holland, 1986)中所述。如前所述,對于任何個體來說,從未觀察到反事實量Y(1,M(0))和Y(0,M(1)),因為從未觀察到在相反的處理狀態下定義的M的潛在值,而只知道遵循特定處理狀態的事實M。為了解決這個識別問題,需要進行一系列適當的假設,這將在第4節中介紹。
    這一框架同時反映了中介分析的弱點和優勢。特別是,這個框架的難點在于,雖然中介分析是關于因果效應的,但這種效應在中介變量設定中并不直觀明顯。中介變量設定的挑戰在于,本文沒有與因果效應感知相對應的可觀察效應作對比。盡管如此,采用明確的因果思維可以更清楚地知道到底想要學習哪種因果效應,以及是否能夠學習以及如何學習它們。
    如Δ的定義所示,根據d的選擇,最終得到四個量,即NDE(0), NDE(1), NIE(0),和NIE(1),這意味著ATE的兩種不同的分解。兩次分解不存在單一的NDE和NIE,但一般來說,NDE(0)和NDE(1)不相同,NIE(0)和NIE(1)也不相同。這四個參數測量不同的量:NDE(1)解釋了如果政策制定者將中介變量固定為它在處理中所接受的價值,那么處理效應將會是什么,而NDE(0)衡量的是如果能夠完全去掉政策對中介變量的影響,本應會達到的處理效應。這兩個量不一定相同。同樣的邏輯也適用于間接效應:NIE(0)被解釋為結果變量的變化,如果取消所有人群的處理,相反,卻讓每個個體采取她/他在處理中會采取的相同水平的M。NIE(1)再次測量由于M而不是處理本身導致的結果變化,將被處理的個體作為目標人群。這個問題揭示了傳統方法的弱點,其中有一個任意的假設,這意味著總效應可以分為兩個獨立的、不相互作用的效應。有了這個符號,可以很容易地證明情況并非總是如此。因為ATE存在四個量和兩種分解,可以選擇其中的哪一個來使用,這取決于研究問題本身。如果目標是用直接和間接影響因素來描述政策干預(處理)對結果變量的影響,而不事先對直接或間接影響作出任何假設,那么就可以使用這兩種分解方法。如果目的只是簡單地描述學到的一切,那么就沒有理由選擇其中某一種分解方法。一般來說,當研究問題是:”一種政策處理的效果是否包括間接影響時,它與分解總效應有關,如TE = NDE(0) + NIE(1)”。當研究問題是:”一種處理的效應是否包含一個直接影響?”建議參考Nguyen等人(2020)以獲得更多細節。
    3.3加入控制變量的直接效應和間接效應
    反事實表示法允許考慮異質性的潛在存在。這種異質性在實踐和理論中都很重要,因為它往往是經濟學家關注的內生性問題的動機(Imbens & Wooldridge, 2009)。在結構模型中,效應被假定為常數,這意味著各種政策的影響可以被單個參數捕獲。在中介中,這種異質性甚至更為重要,因為它意味著處理組對結果的直接影響可能因個體而異,而且這種影響也可能因中介變量的不同值而不同。有了反事實的表示法,那么,非線性和交互項的存在就不是問題,因為本文的定義和分解都沒有假定任何特定的模型或函數形式。然而,如果處理對整個人群的效果是相同的,也就是說,如果它不會因中介變量的不同而改變,那么處理變量和中介變量之間就不存在交互作用。
    當引入另一個參數(文獻中稱為受控直接效應(CDE))時,這一事實就更清楚了。正式:
    CDE(m):[Yi(1, m)?Yi(0, m)]是受控制的直接效應,它表示在保持固定的M = m時,處理組和對照組之間的結果會發生多大的變化。這不是一種由m傳導的效應,而是為m的每一層定義的效應,即為每個人設定一個特定的中介水平。如果效應在m的各個層次上變化,那么本文就存在D和M對Y的相互作用效應。
    根據m值的不同,受控直接效應可能在個體之間和個體內部有所不同。如果所有人都希望中介變量的水平為m,并且存在可行和合乎道德的方式來為所有人設定中介的水平,那么采用CDE是有用的。值得注意的是,當m≠m'時,如果CDE(m) = CDE(m'),那么CDE就是簡潔的,即CDE = NDE (Baron & Kenny, 1986)。

    在這種情況下,總效應和CDE之間的差異就是間接效應,或者更正式一些
    通常,在實證分析中,受控直接效應和自然直接效應并不重合,總效應和受控直接效應之間的差異通常不會產生間接效應(Kaufman et al.,2004;VanderWeele, 2009),因為變量受處理和中介對結果的影響可能只是相互作用,而不保證影響的額外線性函數形式。反事實表示法有助于捕捉這些相互作用的本質。
    四、假設
    4.1 古典假設
    在經濟學領域,通常無法進行對照實驗。在這種情況下,就需要排除混雜因素的存在。然而,在中介分析中,由于變量關系的特殊結構,指出本文不得不面對什么樣的混雜因素是很重要的。
    考慮一個經典的中介框架,其中X是一組處理前的可觀察協變量,W是一組處理后的可觀察混雜變量,如圖3所示。

     例如,假設想評估一項補貼計劃(D)是否提高了企業的生產率(Y),以及研發投入的份額(M)是否可以部分調節這種影響。在這個例子中,研發方面的投資可能是一個潛在的中介,因為它們受到補貼的影響,進而可能至少部分影響生產率的結果。然而,為了將這種關聯解釋為一種因果效應,需要仔細考慮并控制那些可能混雜處理-結果關系(X)和/或中介-結果關系(W)的變量。例如,可能存在公司規模或公司績效變量(X)會影響項目的參與(D)和公司生產力(Y)或其他因素,如管理質量或網絡的存在(W)。影響研發投資水平和生產率。需要注意的是,W可能會受到處理本身的影響。
    在此背景下,需要區分兩種情況:已受控效應的識別和自然效應的識別。根據VanderWeele(2015),要估計CDE,本文需要兩個假設:
    H1:處理組和結果變量之間不能存在混雜因素。
    為了滿足第一個假設,將處理變量隨機化就足夠了。通常,在經濟學中,不存在實驗,在這種情況下,處理變量的外生性必須由條件獨立假設(CIA)保證:這要求影響處理分配和處理特定結果的常見變量是可觀察的。這些變量必須消除處理和結果之間的潛在依賴關系。在統計學中,這種假設也被稱為對可觀察對象的選擇,因為它的核心原則是產生依賴的公共變量的可觀察性。如果參考前面的例子,為了滿足H1,需要調整政策干預和結果變量的共同原因-例如關于公司規模或公司業績的信息或任何其他因素(X),可以在分析中混淆這種關系。或者可以隨機給予補貼,這意味著接受處理和未接受處理的公司的X分布相同。
    識別CDE需要的第二個假設是H2:中介變量和結果變量之間不得存在混雜因素。
    H2是一個特殊的假設,在經典的因果分析或項目評估中不存在。由H2得知,應該控制處理后潛在混雜因素的存在,然后,為了滿足這一假設,需要調整中介-結果關系的共同原因,例如,有關管理質量的信息或其他因素(W),可以混淆這一關系。在這種情況下,需要仔細考慮所有可能的處理后的混雜因素,并將它們納入分析,因為處理的隨機化不再是控制w的充分條件。
    要確定自然的直接和間接影響,需要兩個假設。特別是:
    H3:在處理變量和中介變量之間不能存在混淆因素.
    H4:中介變量和結果關系之間不得有受處理變量影響的混雜因素
    同樣,為了滿足H3,將處理隨機化就足夠了。事實上,可以把中介看作是一種中間結果。在這種情況下,如果處理是隨機的,或者如果控制了與D和M相關的所有預處理變量,D和M之間的路徑不會混淆。如果再次考慮前面的例子,公司的規模可以是處理-中介關系的一個混雜因素,那么它必須包含在協變量集(X)中,或者再次隨機分配D。本文需要的最后一個假設是H4。
    H4是一個強有力的假設,因為它要求從處理到中介的道路上沒有任何阻礙,這也會影響結果。如果機制變量在處理后不久發生,這一假設更有道理(VanderWeele & Vansteelandt, 2009)。如果考慮H4,將不得不考慮可能受處理影響的因素,這些因素反過來可能會影響中介和/或結果。例如,獲得補貼的公司可能會得到更多的好處(稅收、官僚主義),這反過來可能會影響研發投資和生產率。這個假設的問題是,即使在分析之前就想到了這些因素,也無法得到這些混雜因素的準確測量值,因為事先不知道它們在被處理后會是何值。
    需要注意的是,假設1-4暗示了時間順序的假設(Cole & Maxwell, 2003)。如果時間順序假設不被滿足,那么沒有未測量的混淆假設也不被滿足,那么關聯就不能代表興趣的因果效應。需要注意的是,隨機化處理并不足以排除中介分析中的混雜問題。處理變量的隨機化排除了D - Y和D - M混淆的問題,但不能保證M - Y無混淆因素的假設成立。這是因為即使處理是隨機的,中介因子通常也不是隨機的。關鍵是,未測量的M?Y的混淆不會對總效應的估計產生偏差,但會對直接和間接效應的估計產生偏差。
    4.2序列可忽略性下的識別
    關鍵的理解是,在隨機性設計下,ATE是可以識別的,但直接和間接的影響是不可以的。即使存在處理和中介的雙重隨機化,在沒有進一步假設的情況下也不能確定處理變量的影響。事實上,即使處理和中介都是外生的,然后滿足傳統的外生性假設,簡單地結合T對M的影響和M對Y的影響也不足以識別間接效應。在這個方向上的一個重要步驟是被稱為”序列可忽略性”的假設。對這一假設有不同的解釋,有不同的含義和不同的形式。使用最多、可能也是最靈活的版本是Imai et al.(2010)給出的版本。在形式上,它表示為:

    序列可忽略性假設的第一部分,式(4)是處理的經典條件獨立性,也被稱為無遺漏變量偏差,條件外生性或無混淆,如Imbens(2004)。通過公式(4),沒有未觀察到的混雜因素影響給定X的處理和中介和/或結果,這意味著可以一致確定D對Y的影響和D對M的影響。在非實驗設計中,這一假設的有效性取決于處理前協變量的豐富程度,而在實驗設計中,如果處理是在X定義的分類中隨機化或無條件隨機化,則這一假設成立。序列可忽略性假設的第二部分,公式(5)表明,一旦以D和X為條件,就沒有未觀察到的混雜因素共同影響中介變量和結果變量。這意味著在中介和結果之間不存在未觀察到的混雜因素,排除了X未捕捉到的處理后的混雜因素。這是一個強有力的假設,因為隨機化的處理變量和中介因子并不足以使該假設成立,除此之外,如前一小節提到的,如果處理變量和中介因子在較短的距離內測量,這是更合理的。序列可忽略性的最后一部分,式(6)是常見的支持假設。根據傾向匹配得分的相關文獻,在給定M和X的情況下,接受或不接受處理的條件概率大于0。根據貝葉斯定理,這意味著,如果M是離散的,Pr(Mi=m|Di=d,Xi=x) >0;如果M是連續的,則M的條件密度在給定D和X的情況下大于0。式(6)的主要含義是,在X的條件下,中介變量不一定是處理變量的確定性函數;否則,在不同的處理狀態下,沒有可比較的中介變量個體(Huber, 2019)。換句話說,為了比較由處理狀態定義的同一組內的不同中介狀態,一旦對D和X設定條件,M一定會有不同的值。在序列可忽略性下(方程4-6),可以確定因果機制。此外,還有可能得到反事實量E(Yi(d,M(d’)|Xi=x))的非參數識別,如Imai et al.(2010)所證明的,這意味著平均自然直接效應(ADE)和平均自然間接效應(ACME)的非參數識別在標準因果中介分析中,反事實量的非參數識別如下:

    其中,假設有一個連續的中介變量,第一個等式遵循迭代期望定律,利用式(4)建立第二個、第四個和最后一個等式;公式(5)建立了第三和第五個等式,而第六個等式是由Mi = Mi(Di)和Yi = Yi(Di, Mi(Di)),也被稱為觀測性規則(VanderWeele, 2015)或一致性假設(Imai et al., 2011)。
    反事實分析中使用的序列可忽略性與結構模型中使用的經典外生性假設顯著不同。特別是,正如前面提到的,要確定因果機制,以及從T到Y再到M的間接影響,這對于處理變量和中介變量來說是不夠隨機化的。不同的是,如果使用結構模型,它只需要滿足外生性假設,這意味著T和M的雙隨機化是充分的。然而,只有在不存在異質性效應的情況下,得到的估計是一致的。特別地,在第一種情況下,可以確定處理變量的因果中介效應(T→M→Y),而在第二種情況下,只能確定中介的因果效應(T→M和M→Y),這兩個量只有在沒有異質性的情況下才重合。在滿足外生性假設和不存在異質性的情況下,可以始終只估計CDE,因為在這種特殊情況下這個量等于NDE。有趣的事實是,在異質性存在的情況下,如果處理變量和中介變量是隨機的,外生性假設仍然成立,但M和Y的誤差項之間的相關性不同于0,這意味著結構模型不能捕捉到對這種效應的偏差估計。
    4.3序列可忽略性的其他解釋
    這個結果的主要限制是,非參數識別只在不考慮處理后混雜因素的情況下才有效,這意味著處理前可觀察的混雜因素集必須足夠控制,而這一要求并不總是可信的。Robins(2003)已經解決了這個問題。在他的完全隨機因果解釋結構樹圖模型(FRCISTG)中,他使用不同版本的序列可忽略性,第一部分與等式(4)相同,而等式(5)被替換為Yi(d’,m)?Mi(d)|Di=d, Zi=z,Xi=x,其中Z是處理后混雜因素的向量。這是一個重要的實踐優勢,因為它可以控制可能混淆中介體和結果之間關系的可觀察變量。但這是以加入直接和間接效應之間不相互作用的參數假設為代價的:Yi(1,m)?Yi(0,m) = Bi,其中Bi是一個獨立于m的隨機變量。這個條件有兩個含義:(i)不存在異質性,(ii)無論中介的水平如何,直接效應的值相同,即直接效應和間接效應之間的獨立性。因此,有一個重要的均衡點:如果以后混雜因子為條件,需要假設一個非交互假設來識別自然效應,這是一個非常嚴格的條件且不允許非參數識別。另一方面,如果不以處理后的混雜因子為條件,而是假設所有的X都足以控制它們,那么就可以在沒有任何參數限制的情況下非參數地識別效應。
    Pearl(2001)給出了序列可忽略性的另一種表達。特別地,在定理1和定理2中識別平均自然直接效應和定理4中識別平均自然間接效應,他使用了一組不同的假設,在任何情況下都得到了Imai等人(2010)給出的ADE和ACME的相同表達式。值得注意的是,序列可忽略性暗含了Pearl的假設,而反過來的假設并不總是正確的,但在實踐中,這只是技術上的區別。序列可忽略性的另一個優點是,它比Pearl的假設更容易解釋,在Pearl的假設中,兩個潛在量之間存在獨立性。Pearl也指出了這種解釋上的困難:”反事實獨立性的假設只有在結構形式下才能得到有意義的證實”(Pearl, 2001,第416頁)。
    Petersen等人(2006)給出了序列可忽略性的進一步版本。他將方程[4]分成2個部分,Yi(d,m)?Di|Xi =x 和 Di?Mi(d)|Xi=x ,方程[5]同理。這只是數學上的差異,因為在隨機化處理的實驗設計中,(4)式與它們是等價的。為了確定自然直接效應,他們還假設非處理狀態下的潛在中介值獨立于潛在結果。通常來說,E[Yi(d,m)-Yi(0,m)|Mi(0) = m, Xi= x] =E[Yi(d,m)-Yi(0,m)|Xi= x],這意味著中介因子在非處理狀態下的潛在值Mi(0)不提供任何關于處理效應的額外信息。這個額外的假設對于確定反事實量Y(d,M(0))是必要的。在任何情況下,如果處理變量是隨機的,這最后一個假設對于Imai et al.(2010)給出的非參數識別都是不必要的,這使其序列可忽略性再次成為一個更好的解決方案。
    五、準自然實驗的設計
    最新的中介分析研究考慮了基于潛在結果框架的更通用的識別方法,通常用于處理評估(Rubin, 1974),以克服結構模型的局限性。這種方法的黃金標準是處理的隨機性,這在實驗中很容易滿足。當處理變量或中介變量不能從外部確定時,估計相關參數并給出因果解釋的唯一方法是使用準實驗設計,其中內生性可以在特定的假設下控制。中介分析借鑒了因果文獻中的這些方法,以確定和估計因果機制,但迄今為止只有少數研究使用這些方法。在工具變量中可以找到一些例子(see for example Burgees et al., 2015; Dippel et al., 2019; Frolich & Huber , 2017; Geneletti, 2007; Imai et al., 2013; Jhun , 2015; Powdthavee et al., 2013; Robins & Greenland, 1992),雙重差分法(see Deuchert et al., 2019; Huber et al., 2017) and synthetic control (see Mellace & Pasquini, 2019)。在下一節中,本文將討論其中一些目前還沒有使用的關于斷點回歸的研究。
    5.1 工具變量
    一些文獻通過工具變量(IV)方法處理因果機制(見Imai等人,2013;robins & greenland,1992,等等)。原因是,在一些實證應用中,序列可忽略性并不是一個充分的假設來排除處理后混雜因素的存在,一個工具變量可能是解決中介變量的內生性問題的一個重要工具。在其他情況下,即使在處理前的一組協變量條件滿足條件后,處理變量也不是外生性的,第二種工具變量可以用于這種內生性。可以找到兩種用IV進行中介分析的方式。一些作者通過結構模型確定了直接和間接影響。例如,Powdthavee等人(2013)通過中介收入研究了教育對主觀幸福感(SWB)的影響。他們利用澳大利亞各州不同的教育法律時間和個人收入的沖擊(如彩票中獎)分別作為處理變量和中介變量工具。假設中介變量之間是相互獨立的,他們在2SLS框架內使用SEM估計直接和間接影響。其他研究使用了兩種工具和參數識別,如burges等人(2015)和Jhun(2015)。Ten等人(2007)使用參數限制,如處理-協變量交互項作為中介工具,同時在結果模型中不存在處理-中介、中介-協變量和處理-協變量相互作用,這意味著強結構限制的識別模型。Dunn和Bentall(2007)、Small(2012)和Gennetian等人(2002)利用處理與觀察到的協變量的交互項作為工具來確定中介因素對結果的因果效應的其他研究。Dippel等人(2019)最近發表了一篇文章。他們提出了一種新的識別策略,在存在所有關鍵變量內生性的情況下,使用單個工具打開因果關系的黑匣子。事實上,在中介分析中,大多數識別方法都假定這種處理與隨機分配一樣有效。它們的貢獻并不假設任何關鍵關系中不存在內生性,也不需要額外的工具,但它在未觀察到的變量之間強加了因果關系。這些方法的局限性在于,它們不允許直接效應和間接效應之間存在異質效應。
    研究IV的中介分析的第二種方法是使用潛在結果框架。Chen等人(2017)做出了重要貢獻,他們通過兄弟姐妹的大小(也被解釋為生育選擇)作為中介,研究了第二胎的性別對第一胎教育結果的影響。在他們的研究中,他們假設兄弟姐妹的性別是隨機的,并在第二次出生時使用雙胞胎指標作為中介工具(遵循Angrist等人的研究,2010;Black等人,2005;Rosenzweig & Wolpin, 1980)。他們的IV估計給出的因果解釋僅限于符合條件的家庭,這些家庭的兄弟姐妹大小會隨著第二胎雙胞胎的增加而增加,即M(Z = 1) > M(Z = 0),但另一方面,考慮到異質性效應,即處理變量和中介變量之間的相互作用。尤其值得一提的是,他們發現,有一個弟弟會降低頭胎女孩的潛在兄弟姐妹體型,這種正面的間接影響抵消了對她教育結果的負面直接影響,導致總體影響接近于零。這些結果為以前的文獻中沒有發現的家庭環境中的性別偏見提供了新的證據。由于總效應的分解以及兄弟姐妹大小和兄弟姐妹性別之間相互作用所捕獲的異質性的存在,這是可能的。Frolich和Huber(2017)給出了使用潛在結果方法的第二個貢獻。他們使用反事實的框架,并使用兩種不同的工具分別對處理變量和中介變量獲得非參數識別,然后,允許他們的內生性。此外,工具變量和中介變量可以是離散的或連續的。他們的結果的主要優點是,他們識別了所有處理方案的自然和控制效應,克服了僅識別根據任一內生變量依從性定義子群CDE的局限性(見Miquel, 2002)。他們將這種方法應用于兩項實證研究。其一是教育通過收入對社會生活結果的影響。1971年,英國將最低離校年齡從15歲提高到16歲(另見Brunello等人,2016;Oreopoulos, 2006),而年度個人收入是由意外收入工具(加德納和奧斯瓦爾德,2007;林達爾,2005)。他們發現教育對社會生活功能有正向影響,但分解總效應(LATE)顯示出正向的直接影響,而間接影響接近于0且不顯著。然后他們得出結論,教育影響社會功能,但通過不同于收入的機制(Huber等人,2017)。
    5.2雙重差分法
    第一個貢獻是由Deuchert等人(2019)提出的,該研究使用了不同于序列可忽略性和工具變量方法的框架來識別直接和間接影響。他們在子群體或階層中應用雙重差分(DID)方法(Frangakis & Rubin, 2002),根據二元中介變量對是否受到處理的反應定義,揭示了總體效應,這意味著存在四個子群體:總是接受者、從不接受者、復制者和對抗者(例如,參見Angrist等人,1996)。特別地,他們識別出了對總接受者和從不接受者的直接影響,其中中介變量對是否處理沒有反應,也就是說,是否處理不會改變機制的狀態,對應的是已經受到控制的直接影響,然后他們識別出了間接影響和對復制者的直接影響,其中中介變量對處理有反應。他們使用的主要假設是經典的隨機處理分配;第二種是來自于局部平均處理效應(LATE)文獻的單調性假設(見Angrist et al.,1996;Imbens & Angrist, 1994),排除了對抗者的存在。最后一組重要的假設是共同趨勢假設,它來自DID文獻,但現在是跨層次定義的。這一事實可以控制處理后的混雜因素,并允許不同的混雜因素對不同層次特定潛在結果的影響,只要這些差異是時間常數。正如本文所討論的,在中介機制的重要層次下的利益影響的識別一直受到批評,因為在DID框架中不允許對復制者的直接和間接影響進行分解,而專注于可能不如整個群體有趣的子群體(VanderWeele, 2008)。但由于之前的一組假設,作者確定了對復制者的影響,他們提出了一個實證應用,其中對子群體的影響與政治決策相關。第二種批評涉及文獻中中介和基本分類因果效應之間的混淆(VanderWeele,2012)。特別需要注意的是,E[Y1?Y0|M(1)=1, M(0) = 0]是處理變量對復制子組結果的總因果效應,它并不總是對應于中介效應。事實上,可以觀察到,即使中間變量不影響結果,這種影響也可能是非零的,這意味著M不是中介。當M是處理變量對結果變量的影響的替代物時,這種情況就會發生:替代物關注的是處理對結果的影響是否可以通過處理對中間變量的影響來預測,而中介關注的是處理的影響是否通過中介進入結果。一個好的代理變量可能經常是一個中介機制,但并不是必要的(VanderWeele, 2012)。基本分類是研究代理變量的一個很好的框架,而自然效應(Pearl, 2001)是研究中介的合適概念。Lindsay(2012)給出了一個直觀的例子,她提供的證據表明,職業學院項目(D)這一計劃將對那些改變工作環境人的后續收入有重大影響,但對那些不會改變工作環境接觸的人沒有影響。在她的分析中,她使用貝葉斯方法進行基本分類,并使用協變量試圖預測不同的個體屬于哪個主要階層。但是,即使這些假設成立,可能仍然存在一些中介結果關系的未測量混雜因素,如動機(U),使M成為代理變量而不是中介變量,如圖4。

    一種可能的解決方案是使用基本分類方法研究中介,但需要添加序列可忽略性假設,以排除處理后混雜因素的潛在存在。
    5.3 合成控制法
    使用合成控制方法(SCM)研究因果機制的唯一貢獻來自Mellace和Pasquini(2019)。該方法的主要優點是,即使只存在一個處理個體和幾個控制個體,它也能估計總的因果效應(Abadie et al.,2010)。他們延展了SCM,允許將總效應分解為其直接和間接部分,從而定義了中介分析合成控制(MASC)。他們使用的步驟包括重新加權控制個體干預后的結果,方法是選擇權重,使治療組和對照組在干預前的可觀察特征以及干預后的中介值中的距離最小化。這可以模擬在沒有干預的情況下,如果中介設定為她正在處理的潛在中介,被處理者會發生什么情況(Mellace & Pasquini,2019)。特別是,他們采用了Abadie等人(2010)所提出的具有交互固定效應的動態因子模型。
    六、結論
    鑒于中介分析方法在過去幾十年中在經濟學中呈指數增長,本文回顧了中介分析的主要貢獻。本文解釋了中介分析如何解開因果關系的黑匣子,并展示其在經濟應用中的潛力。中介機制揭示并衡量政策背后的因果機制,為經濟學家提供更多的信息。這個框架不僅可以識別估計策略是否有效,還可以確定它為什么有效。雖然中介分析的目標對經濟學家和政策制定者很有吸引力,但關于使用哪種方法的辯論仍未結束。本文接著介紹了主要的傳統方法和新的替代方法,以準實驗設計為代表。這些方法基于反事實的框架,利用對參數函數形式的假設缺失來估計處理變量的因果影響。此外,鑒于中介的內生性,反事實方法對協變量的選擇不太敏感,這是一個關鍵問題。本文在中介框架內回顧了這些方法的重要支撐依據,討論了工具變量、雙重差分和合成控制方法,展示當前的成果和進展。演示了反事實框架如何適用于中介分析,以及它們如何共同提供一種替代解決方案以估計因果機制,并得出經濟性和政策性的影響。

    關于機制分析、中介和調節效應分析的文章:

    1.計量回歸中的交互項到底什么鬼? 捎一本書給你2.計量經濟學中"交互項"相關的5個問題和回應3.實證機制分析那些事,機制分析什么鬼?,4.政策評估中"中介效應"因果分析, 增添了文獻和Notes5.內生變量的交互項如何尋工具變量, 交互項共線咋辦6.因果中介效應分析出現在頂刊, 是時候使用新方法了7.中介和調節效應自助法檢驗,針對非正態截面數據8.面板數據中介效應的計算程序, 打開面板這扇門9.中介和調節效應操作指南, 經典書籍和PPT珍藏版10.中介效應分析的四種方式, 原則方法和應用綜述11.中介效應分析的方法和模型, 一篇聽說必須看的文獻12.多重中介效應的估計與檢驗, Stata MP15可下載13.具有調節變量的中介效應分析, moderated mediation14.具有調節變量的中介效應程序和數據, 獨家解讀相關結果15.有限混合模型FMM,異質性分組分析的新籌碼16.省份/行業固定效應與年份固定效應的交乘項固定效應17.面板數據中去中心化的交互項回歸什么情況18.面板交互固定效應是什么, 白聚山教授推動了最前沿的研究19.廣義合成控制法gsynth, 基于交互固定效應的因果推斷,20.一個完整的實證程序, 以logit或ologit為例,21.跨數據比較回歸系數技巧,22.U型, 倒U型, 還是線性關系, 你平常的做法不靠譜,23.DID中行業/區域與時間趨勢的交互項, 共同趨勢檢驗, 動態政策效應檢驗,24.機制分析做到極致的JPE趣文, 身高與收入,25.機制分析, 中介渠道, 調節效應必讀系列合集,26.自變量和中介變量是內生的情況咋辦?放在因果中介的框架,27.調節變量, 中介變量和控制變量啥區別與聯系?28.多個中介變量如何檢驗中介效應?,29.中介變量需要放到回歸中去嗎?何時放何時不放?,30.機制分析, 中介渠道, 調節效應必讀系列合集,31.三張圖秒懂, 混淆, 中介, 調節, 對撞, 暴露, 結果和協變量的復雜關系,32.中介效應檢驗流程, 示意圖公布, 不再畏懼中介分析,33.主流: KHB法測度中介效應, 無論線性還是非線性模型, KHB都能分解出直接和間接效應!34.控制、調節和中介變量,系說,35.學習機制分析應該閱讀的經典材料有哪些?36.操作講解中介效應機制分析:原理, 程序, Bootstrap方法及其應用,37.Top5最新: 為什么富有的父母有富有的孩子? 一篇學好機制分析的佳作!38.必讀, 宗教是如何阻礙經濟發展的? 基于DID, IV和各種機制分析的AER量化史分析!39.中介效應最新進展: 中介效應中的工具變量法使用方法及其代碼!40.中介效應分析新進展和檢驗方法!41.中介分析: 一份實踐者指南, 來自大牛的頂刊文章總結!42.重新思考BK中介模型, 關于中介效應分析的神話與事實!43.中文刊上用中介效應模型的實證文章? 這位學者使用頻率很高!44.爭議, 因果推斷經驗研究中的中介效應與調節效應,45.我最近看到AER, JPE文章, 人家用的就是類似中介效應三步走方法,46.針對經濟學領域中介效應模型問題的回應和理性討論,47.《當代財經》期刊打響了經濟學領域反對溫忠麟中介效應模型的第一槍!

    下面這些短鏈接文章屬于合集,可以收藏起來閱讀,不然以后都找不到了。

    2.5年,計量經濟圈近1000篇不重類計量文章,

    可直接在公眾號菜單欄搜索任何計量相關問題,

    Econometrics Circle




    數據系列空間矩陣 | 工企數據 | PM2.5 | 市場化指數 | CO2數據 |  夜間燈光 官員方言  | 微觀數據 | 內部數據
    計量系列匹配方法 | 內生性 | 工具變量 | DID | 面板數據 | 常用TOOL | 中介調節 | 時間序列 | RDD斷點 | 合成控制 | 200篇合輯 | 因果識別 | 社會網絡 | 空間DID
    數據處理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
    干貨系列能源環境 | 效率研究 | 空間計量 | 國際經貿 | 計量軟件 | 商科研究 | 機器學習 | SSCI | CSSCI | SSCI查詢 | 名家經驗
    計量經濟圈組織了一個計量社群,有如下特征:熱情互助最多前沿趨勢最多、社科資料最多、社科數據最多、科研牛人最多、海外名校最多。因此,建議積極進取和有強烈研習激情的中青年學者到社群交流探討,始終堅信優秀是通過感染優秀而互相成就彼此的。

      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 色噜噜噜亚洲男人的天堂| XXXXXHD亚洲日本HD| 国产日韩久久免费影院| 国产精品久久久久久无码五月 | 久久香蕉国产线看观看怡红院妓院| 伊人色综合久久天天小片| a级黑人大硬长爽猛出猛进| 成人免费A级毛片无码片2022| 国产精品 视频一区 二区三区| 永久免费av网站可以直接看的| 国产边打电话边被躁视频| 韩国免费a级毛片久久| 日本怡春院一区二区三区| 小污女小欲女导航| 超碰人人超碰人人| 欧美高清狂热视频60一70| 特级毛片A级毛片免费播放 | 久草热8精品视频在线观看| 国产男人的天堂在线视频| 国产综合色在线精品| 四虎国产精品成人| 人妻精品动漫H无码中字| 又大又粗又硬又爽黄毛少妇| 人妻系列无码专区69影院| 国产一区二区三区在线观看免费| 欧美交A欧美精品喷水| 男女动态无遮挡动态图| 无码AV人片在线观看天堂| 又粗又紧又湿又爽的视频| 日韩人妻中文字幕精品| 婷婷综合久久中文字幕蜜桃三电影| 国产精品 自在自线| 免费无码黄网站在线观看| 丝袜美腿一区二区三区| 狠狠做五月深爱婷婷伊人| 国产目拍亚洲精品二区| 亚洲国产精品一区二区WWW| 无遮挡免费高清羞羞视频| 亚洲V天堂V手机在线| 亚洲AV无码之国产精品网址| 国产精品 视频一区 二区三区 |