該文探討的核心問題是,在經濟衰退期畢業的大學生,是否會因宏觀經濟的暫時低迷而遭受長期的職業生涯負面影響?
作者想比較在好年景畢業的大學生和在壞年景畢業的大學生誰以后混得更好。 但問題是,這兩撥人可能從一開始就不是同一種人。 這就好比你想比較穿紅色球衣的球隊和穿藍色球衣的球隊誰更強,但如果強隊都愛選紅色球衣,那無論比賽結果如何,紅色隊的勝率天然就更高。 這個強隊愛選紅色的現象,就是選擇偏差。它讓你無法判斷成績到底是球衣顏色帶來的,還是球隊本身實力決定的。 下面結合該文的背景,咱們想象有兩所高中,分別是學霸中學和普通中學。 現在有2種情形出現。 一是正常年景(經濟好),此時找工作容易,賺錢快。只有學霸中學里最頂尖、最想深造的學生才會去上大學(因為放棄眼前高薪工作的代價太大)。普通中學的學生大部分都直接去打工賺錢了。所以,這一年畢業的大學生,幾乎全是真學霸。 二是困難年景(經濟差),此時找工作難,工資低。學霸中學的學生肯定還是去上大學。同時,普通中學里一些比較聰明、但又沒那么拔尖的學生一想,反正也找不到好工作,不如去讀個書鍍鍍金,于是他們也去上了大學。所以,這一年畢業的大學生里,混進了一部分普通中學的機靈鬼。 現在問題來了,10年后,你發現正常年景畢業的那批大學生平均工資更高。你能得出結論說在好年景畢業會導致你未來收入更高嗎? 當然不能。 因為完全有可能是這個原因——正常年景畢業的那批人本身全是真學霸,他們能力強,所以未來工資高。而困難年景畢業的那批人里有一部分普通學生,拉低了整體的平均工資。 你看到的工資差異,既有畢業時機的影響,也混雜了這群人本身是誰的影響。這就是選擇偏差,即不同年份的大學生群體,是被選擇出來的不同構成的群體,不能直接放在一起比。 作者如何解決這個問題?檢驗選擇性偏差是不是很嚴重,而不是一上來就開始堆砌IV、PSM啥的,畢竟弱不嚴重或者說不影響研究結論,那不是更好么。 作者做了如下兩件事來驗證這兩撥人到底是不是同一種人。 1.看經濟好壞會不會大幅改變上大學的人數。 他擔心經濟一差,普通學生會大量涌入大學,dramatically改變大學生群體的構成。 但是,他檢驗后發現經濟變差時,上大學的人數只是微微增加了一點,遠沒有到洪水泛濫的程度。 這說明,普通學生并沒有因為經濟差就一窩蜂地全都跑來上大學。 ![]() 2.看學霸和普通學生的差距會不會變。 他擔心經濟差時,跑來上大學的普通學生會把大學生群體的整體學霸濃度給稀釋了。 于是,他比較了大學生和非大學生在能力測驗分數和家庭背景(比如父母是不是高學歷、家里有沒有書)上的差距。然后看這個差距會不會隨著經濟好壞而變動。 回歸發現,無論經濟好還是經濟差,大學生群體都比非大學生群體明顯更聰明、家境更好。而且,這個聰明和家境的優勢程度幾乎不隨經濟波動而變化。 ![]() 這就好比,無論是豐收年還是災年,學霸中學的學生考上大學的比例都遠高于普通中學,這個壓倒性優勢從來沒有改變過。災年只是讓普通中學的尖子生也多了一兩個考上的名額,但完全不足以撼動學霸中學的絕對統治地位。 因此,作者的檢驗結果表明,雖然經濟差的時候,確實會有少數邊緣學生被擠進大學,但大學畢業生群體作為一個整體,其精英底色非常穩定,并沒有因為經濟波動而發生質的改變。 因此,不同年份的大學畢業生群體基本上還是同一種人,是可比的。之后觀察到的他們長期工資的差異,就更有可能真的是由畢業時的經濟環境造成的,而不是由群體本身的質量差異造成的。 這就排除了選擇偏差的嚴重干擾,讓研究的結論變得更加可靠。 如果真的存在嚴重的選擇偏差怎么辦? 常見的處理方法包括控制變量,加入能力測試(AFQT)、家庭背景等指標;工具變量(IV),利用外生沖擊來識別經濟環境的影響。Heckman兩階段,在存在樣本進入問題時進行修正。限制樣本,只考察背景相似的人群,確保可比性。 在本文中,作者主要依靠檢驗+控制變量的方式,說明選擇性偏差存在,但程度不大,不會改變主要結論。
7年,計量經濟圈近2000篇不重類計量文章, 可直接在公眾號菜單欄搜索任何計量相關問題, Econometrics Circle |
|