問題介紹: 老師您好,向您請教幾個問題。做雙重差分,采用的樣本數據是企業自行匯報的,因變量數據存在較多缺失,有幾個問題: (1)是否一定要驗證因變量的缺失是隨機的? (2)將因變量數據未缺失的企業設定為dum=1,缺失的企業設定dum=0,用其它反映企業特征的變量進行組間均值比較,這種方法,能否用來驗證因變量的缺失沒有引起樣本選擇偏差? (3)若是上述方法可行,是只對政策出臺前的特征變量進行比較,還是需要對整個樣本期間的特征變量進行比較?謝謝! 問題解答: 樣本背后都有一個需要推斷的總體。首先得看樣本中的所有企業是否是某個總體的隨機樣本或是能代表這個總體,如果不能的話,那樣本分析結果的外推性本身就是很含糊的,樣本內部的缺失值就沒有討論的必要了。如果樣本代表了一個清晰的總體,最好需要看一看取值缺失是否會影響樣本的代表性。(2)中的方法很正確,拿來比較的變量最好是企業的外生變量,比如成立年份、所屬行業、所有制性質等,這些變量基本不會受到政策影響,因此也就無所謂之前還是之后的了。 本期關鍵詞:雙重差分;數據缺失 (通過關鍵詞搜索,可以在公眾號內找到更多相關解答哦) 本期知識科普: |
|
來自: 新用戶68639482 > 《待分類》