2020年,各級教育、財政等部門和各級各類學校,大力推進精準資助,完善管理規范[1]。 精準資助 存在的挑戰 學生資助工作是一項復雜、系統、長期的工作,在精準化過程中存在諸多挑戰,具體如下: 1.信息來源單一,準確度不足。資助信息主要來源于學生提交的申報材料,可能存在有的困難學生由于心理因素不提交申報,以及還有學生在求學期間家庭突發重大事故沒有及時申報的情況。這樣一來,收集的信息可能存在缺失或與客觀事實存在失真,對資助對象的識別提出了更高的要求[2]。 2.名額分配精準度不高。傳統的按比例分配名額的方式簡單易于執行,但由于每年的生源情況不同,每個學生的家庭狀況千差萬別,會出現學生家庭經濟困難程度與獲得的資助等級不匹配的情況,因此對資助對象的精準分級提出了更高要求。 3.評定主觀占比高。常見的評定方式包括:民主評議、信函索證、個別訪談、家訪等[3]。在評定過程中,存在評委對學生不熟悉,只能通過材料或側面了解情況,或因各班級、學院間評委對量化評估的理解和處理標準存在差異,導致評定結果不準確。 4.評定的及時性要求高。資助工作要求每學年認定一次,且集中于9月[3],時間緊、審核和評定數據量大,對資助資金發放的及時性提出了挑戰。 5.資金發放需透明易監管。資助工作涉及資金量大,學生關注度高,確保資助資金精準發到需要的學生手中,且易于審核對賬,這便對資金發放的透明化監管提出了更高的要求[4]。 6.缺少對資助學生信息持續跟蹤和反饋。精準資助是一項長期工作,每年有大量數據沉淀,如果能將其有效利用,會對了解研究困難學生構成、優化資助資金分配方式等提高資助效果的措施提供極大幫助。 針對上述問題,本文提出了一種基于綜合評價的大數據精準資助平臺,并給出業務支撐應用實例。 大數據 在精準資助中的應用 積極推進大數據信息技術與學生資助工作的深度融合,推動應用與創新,對提升教育治理體系和治理能力現代化水平具有重大意義[5]。 建設校級精準資助大數據平臺,通過采集整合不同業務部門的學生全量數據、構建綜合評價指標體系、建立精準資助分析模型,以及分析結果可視化展示,可為助學工作的開展提供有效依據。平臺具有以下特點: 1.學生數據的全量化。通過關聯采集多個學校部門的數據來源,一方面能了解學生的真實消費水平,另一方面便于從全校層面進行資助等級評定和統籌名額分配。解決傳統申請學生數據來源單一和按經驗分配名額的問題,為高校實施精準資助提供參考方案。 2.學生資助的混合化。探索包括學生經濟情況、學業情況、生活情況、網絡動態等多維度的綜合評價指標體系,能在海量學生數據中發現雖然沒有申請學校經濟補助但確實需要關愛的學生,并通過電子補助等隱性方式發放[6],維護學生的自尊。 3.效果評估的可視化。通過可視化圖表,一方面可以直觀地看到學生資助的效果,了解學生在獲得資助后的生活、學習改善等實質性幫助情況,便于建立檔案長期跟蹤[7];另一方面可以展示資金落實情況,加強對資助資金的常態化監督,確保資助資金合理合規使用。 基于綜合評價的 精準資助平臺設計 平臺架構設計 精準資助平臺基于動態可擴展的物理基礎設施資源,使用Hadoop技術實現海量數據分布式存儲和高效計算服務。 精準資助平臺根據分層設計的思路,依次分為大數據平臺基礎層、數據采集與轉換層、數據指標體系層、數據應用層,平臺架構如圖1所示。 ![]() 圖1 大數據精準資助平臺架構 1.大數據平臺基礎層 建立面向全過程的數據質量和數據安全管控體系,保證數據信息的準確、規范、完整、一致,對數據傳輸、存儲、訪問控制、人員等方面進行有效安全管控。 建設大數據計算與存儲集群,采用“Hadoop+Spark”的混搭架構,處理大批量離線數據和實時流數據,并存儲入MySQL、HBase中。 2.數據采集層 采集來自學校內不同系統的學生信息與動態。精準資助需要用到的學生綠色通道、貸款信息、學習成績、就業、一卡通消費等數據,主要來自教務、學工、助學、就業、一卡通、網絡計費、門禁等7個系統。 根據統一數據標準對采集數據進行去重、完整性校驗及清洗等ETL(Extract-Transform-Load,抽取—轉換—加載)處理,生成ODS(Operational Data Store,操作數據存儲)數據體。 3.綜合指標體系層 對來自各系統的各類結構化、非結構化、半結構化、實時流數據進行一致性校驗,構建面向多數據維度的綜合評價指標體系,分層次地實現了從操作數據ODS到數據倉庫DW(Data Warehouse)再到數據集市DM(Data Market)的數據匯聚,用于多角度支持分析決策,為后續的數據可視化展示、數據挖掘提供基礎。 4.數據應用層 包括應用框架、各類服務工具,以及滿足精準資助需要的統計報表和數據可視化頁面,通過模型庫及自定義算法來實現數據挖掘、多維分析、預測決策相關業務需求。 業務場景分析 根據上文描述精準資助存在的問題,從精準資助學生的業務邏輯出發,設計困難學生個體畫像(困難學生識別、困難學生定級)、困難群體分析(從學院角度分析、從年度角度分析、從困難程度角度分析等)、建議關愛學生挖掘、資助效果評估等精準資助場景,如圖2所示。 ![]() 圖2 精準資助大數據業務模型 從不同系統收集的收入情況、消費情況、學業情況、生活信息等多方位綜合數據進行分析,得出困難學生畫像,并確定困難指數,給出資助定級建議;根據消費習慣等數據分析可以發現雖然未申請貧困生,但可能需要學校關愛的學生名單建議;根據資助前后的學習成績、消費結構、行為變化等數據跟蹤,進行學生個體資助效果評估等。 基于綜合評價的指標體系構建 通過精準資助場景分析發現,涉及業務數據多且指標存在復用。因此,需要構建基于綜合評價的指標體系,指標體系應具備系統性、一致性、層次性,使用該指標體系分析場景,每一個場景都可以實現一次完整的數據分析。 數據采集自多個業務系統,能從個人申請、學習、生活、上網較為全面地反映出學生生活學習中主要經濟影響因素,具備全量數據基礎。 通過進一步對來自各系統的數據進行一致性校驗,可確保數據的邏輯關系正確。 把相關的指標歸為一類,構成指標群,在指標群的基礎上進一步匯聚形成指標層,便于清晰地反映精準資助的場景目標。 在層次性設計中,綜合評價指標體系從數據類型、分析維度、業務匯聚三個層次方面,構建數據立方體。 將來自不同系統學生活動數據,按照數據類型程度匯總為: 資助情況、消費結構、學業情況、生活情況、上網情況等,對應大數據平臺的DWD(Data Warehouse Detail,數據倉庫細節)層; 在學年度、困難等級、學院/專業、生源地、資金發放等多個維度上,進行分析匯總,形成的分析維表,對應大數據平臺的DWS(Data Warehouse Service,數據倉庫服務)層,具備查詢展示基礎; 結合場景需求,匯聚成場景分析結果,對應大數據平臺的DM層。 ![]() 圖3 綜合數據評價指標體系 最終形成數據一點鉆取,多層次展示的精準資助評價指標體系,如圖3所示。 大數據精準 資助平臺的應用 基于綜合評價的大數據精準資助平臺已在北京師范大學助學中心得到應用,可以滿足快速從海量學生數據中檢索困難學生信息及其日常動態相關畫像;展示在校困難學生群體情況及相關資助落實情況;并能發現潛在需要資助的學生,提示相關單位進行處理。 相較傳統資助流程,基于綜合評價的精準資助平臺為助學中心提供了更為快速、便捷的檢索和直觀的分析展示,實現了困難學生個體畫像視圖、困難群體分析、建議關愛學生等多項功能,并為資金發放提供了有效監管。 困難學生個體畫像 展示了學生的資助、消費、學業、生活情況及變化,通過信息整合,實現個人多維度對比,如圖4所示。有助于助學管理部門或輔導員快速全面地認識學生,提高資助管理工作的精細化程度。 ![]() 圖4 困難學生個人畫像 困難群體分析 分析包括時間、困難等級、培養層次學院等不同維度的困難學生結構、能夠快速實現對某個整體特征信息的概覽,如圖5所示。 ![]() 圖5 困難群體分析 建議關愛學生 通過對學生就餐、日常消費等數據的實時監測及處理,發現一定周期內存在消費異常的隱性困難學生,進一步通過計算該學生的經濟困難指數來輔助學校進行認定并發放補助,如圖6所示。 ![]() 圖6 建議關愛學生名單 資金落實情況 從校級層面來看,可以按月展示資助資金發放的平均使用情況,如圖7所示;從個體層面來看,可以查詢每個學生的獎學金、助學金、勤工工資、臨時補助、貸款發放的明細信息。 ![]() 圖7 資助資金落實情況 根據精準資助不同應用場景對基礎數據、分析指標及可視化方面的需求,本文設計了基于綜合評價的精準資助大數據平臺,解決了傳統資助模式中的信息來源單一、貧困生定級主觀占比高、處理周期長、不能跟蹤反饋等問題,為助學部門提供了個性化、可視化的應用服務。 實踐應用表明,精準資助大數據平臺能夠高效、可靠地監測、分析、反饋學生動態;平臺提供多角度的綜合數據分析計算指標體系,提高了貧困生定級準確性;通過數據關聯分析、數據挖掘及預測預警,能夠更加人性化地關愛需要幫助的學生。隨著數據評價體系的不斷完善,精準資助系統支撐的應用場景將更加豐富。 參考文獻(上下滑動查看) 作者:李璐穎、盧小清、陳平、王興建(北京師范大學信息網絡中心) |
|