鄔書豪,車聯網數據挖掘工程師 ,R語言中文社區專欄作者 Kaggle是由聯合創始人、首席執行官Anthony Goldbloom和Ben Hamner于2010年在墨爾本創立,主要為開發商和數據科學家們提供舉辦機器學習競賽、托管數據庫、編寫和分享代碼的平臺。其最重要的價值體現在可以讓競賽者盡可能的去使用和設計建模方法去解決現實中的難題,促進社會的發展。持續到現在,Kaggle已經發展了7年了。近幾年,Kaggle社區的活躍人數出現了非常可觀的增長。尤其是2017年期間,從2016年的471K人迅速增長到了895K人,Kaggle的迅速壯大從一定程度上體現出了Data Science在世界的普及。 Kaggle身為全球最大機器學習競賽社區,從初創到現在提供諸多數據競賽和練習。上百個不同數據及要求的Kaggle競賽難易差別極大,這往往就是數據小白們不知道如何去實踐的關鍵障礙之一。當然,對于學習過python數據科學工具包或者R語言基礎知識和機器學習的基礎理論知識后,參與Kaggle實戰是全方位的提高自己數據科學能力的最好方式。 針對這個高端大氣上檔次的社區,有的同學就要問了,Kaggle適合小白學習嗎?適合小白用來提高數據科學能力嗎?答:適合,非常必要! 那么,針對于小白,會不會太難了呢? 答:不會難,選擇合適簡單的Kaggle競賽案例就好,加以運用是全方位的提升,質的飛躍! 首先呢,Kaggle競賽的數據方向非常全面,涉及到了實際工作中的很多行業數據。而且數據有大有小,對于剛入門的小白來說,利用小數據進行實踐和練習是相當好的選擇。其次,競賽有多個分類,比如“Featured”、“Research”等,進而適合不同學歷和不同技能的人去參加。總而言之呢,不同的數據需要不同的處理和建模方式:缺失值、異常值、降維、可視化、各種算法的嘗試和模型融合等......從而從各個方面去讓我們意識到自己的不足,去自主學習提升自己的數據科學能力。 提高數據科學能力是數據分析師,數據挖掘工程師的基本功,構成漲薪的重要支撐,提高數據科學能力大家都非常的關心期待。 Kaggle十大案例 天善智能社區推出了適合零基礎小白的《Kaggle十大案例精講課程》,目的是為了幫助零基礎和有些基礎的同學全方位的提高自己的數據科學能力。完成十個案例的學習,對于入門數據分析師和數據挖掘工程師的工作方面,可謂好處頗多!案例不僅僅幫助學習者鞏固基礎知識,更可以試圖幫助初學者突破瓶頸。 我們從上百個Kaggle競賽里面精選了10個最簡單易懂、最深入淺出、最適合零基礎的同學學習的十大經典好案例!!!有的同學又要問了,啥叫零基礎啊,即使你是文科生小白,甚至都沒有學過R或者python,這都沒有關系!!!《kaggle十大案例精講課程》就是為了幫你打開新世界的大門!!! 《Kaggle十大案例精講課程》不僅僅提供高質量的案例講解視頻,分享從數據處理、數據可視化展示+機器學習建模+模型評估一整套數據科學技術,而且提供案例的數據和代碼給學員反復練習!!!講師的案例講解PPT同樣提供,講知識講重點敲黑板,住你破冰數據之門!!!全方位的提高數據能力! 這門精品案例課程,對于新手來說非常友好。在這里,不僅僅可以學習到在工作中會經常用到的數據處理、數據可視化的諸多方法,還可以學到了機器學習基礎概念、很多經典算法:隨機森林建模、支持向量機建模、knn建模、回歸樹建模、樸素貝葉斯建模、決策樹、k均值聚類以及特征選擇、交叉驗證、簡單調參、定制調參、模型融合、模型評估。全部學習完成課程以后,對于數據科學能力的綜合提高是非常大的。 我們錄制了兩個免費的Kaggle上最適合入門提高的競賽 · 員工離職預測(預測員工離職:二分類問題): https://edu./course/240 · 數據科學從業者調查報告(數據預處理,可視化): https://edu./course/240 最后呢,我強烈建議你把這十個案例的代碼全部都敲十遍,但是需要注意的是代碼并不是關鍵,最關鍵的是為什么需要這行代碼,這行代碼的作用是什么!!!案例的諸多代碼不論是在你的實習、正式工作當中其都是非常非常通用的,所以你要細啃細嚼課程的十大案例!!學完本課程,突破數據科學能力吧!!! |
|