不僅數(shù)據(jù)分析師的招聘中要求具備可視化,和使用PPT制作分析報(bào)告的技能。對(duì)于非數(shù)據(jù)分析師的崗位,例如產(chǎn)品、市場、運(yùn)營等,每天也會(huì)接觸大量的圖表。學(xué)習(xí)和工作中,很多想法都需要利用圖表與領(lǐng)導(dǎo)溝通。 今天我們就來聊聊如何看懂圖表。 1.圖表中的6種元素 圖表元素一般包括6項(xiàng): 第1個(gè)是圖表標(biāo)題,用于介紹圖表的主題; 第2個(gè)是橫軸縱軸標(biāo)題; 第3個(gè)是類別名稱; 第4個(gè)圖例:用各種符號(hào)和顏色代表圖形里的不同類別; 第5個(gè)是網(wǎng)格線,方便看到每個(gè)元素大概在圖形中哪個(gè)部分; 第6個(gè)是數(shù)據(jù)來源:賦予數(shù)據(jù)可信度。 為了圖表精簡,這6個(gè)元素不必要所有都用上。 下面圖片中的圖表數(shù)據(jù)來源:TalkingData移動(dòng)數(shù)據(jù)研究中心的《招聘類APP用戶人群洞察報(bào)告》,數(shù)據(jù)周期:217年12月-2018年3月。后面涉及設(shè)計(jì)到的招聘類APP圖表都來自這個(gè)數(shù)據(jù)分析報(bào)告。 2.表格 因?yàn)槲覀兂Uf的圖表就是:圖形+表格。當(dāng)我們想展示排名前幾的產(chǎn)品名稱時(shí),用表格可以很方便的展示給用戶。下面圖片中的表格是排名前10的招聘類APP。 從表格中我們可以看出,2018年2月,傳統(tǒng)綜合招聘平臺(tái)代表-智聯(lián)招聘、前程無憂51job的APP應(yīng)用活躍指數(shù)以較大領(lǐng)先優(yōu)勢(shì)居于招聘類APP前兩位。 雖然Boss直聘、獵聘同道、拉鉤等平臺(tái)主打高端人才招聘、互聯(lián)網(wǎng)人才招聘等細(xì)分定位,但是在用戶規(guī)模上仍然難以與傳統(tǒng)綜合平臺(tái)競爭。 所以我們可以得出的數(shù)據(jù)結(jié)論是,傳統(tǒng)綜合招聘平臺(tái)在用戶規(guī)模上仍居于領(lǐng)先。 之前社群會(huì)員給我發(fā)求助問題,說自己在拉勾網(wǎng)上投簡歷,連個(gè)面試機(jī)會(huì)都沒有。這其實(shí)就是忽略了傳統(tǒng)綜合招聘平臺(tái)。我給他的建議是同時(shí)在綜合招聘平臺(tái)智聯(lián)招聘、前程無憂51job上投簡歷,很快就收到了面試通知,這位社群會(huì)員現(xiàn)在已經(jīng)成功拿到58同城的數(shù)據(jù)分析師offer。 使用表格時(shí)需要記住一點(diǎn),要讓設(shè)計(jì)融入背景,讓數(shù)據(jù)占據(jù)核心地位。不要讓厚重的邊框和陰影與數(shù)據(jù)爭奪用戶的注意力。相反,使用窄邊框或者干脆去掉邊框,來突出數(shù)據(jù)。 3. 4種常見的圖形 我把經(jīng)常使用的圖形分為4類:散點(diǎn)圖、折線圖、柱狀圖、條形圖。其他很多圖形都是從這4種類型衍化而來的。不管是經(jīng)濟(jì)學(xué),還是在數(shù)據(jù)分析報(bào)告中,我們經(jīng)常會(huì)看到這4種常見的圖形。 1)散點(diǎn)圖 假如我們想知道學(xué)生為某門考試花費(fèi)的學(xué)習(xí)時(shí)間和考試成績這兩個(gè)變量的關(guān)系。如果我們將這個(gè)數(shù)據(jù)集放到一個(gè)二維表格里,是無論如何也沒辦法發(fā)現(xiàn)這兩個(gè)變量之間有什么關(guān)系的。 我們可以把每個(gè)學(xué)生的數(shù)據(jù)繪制成點(diǎn)放到圖中,其中每個(gè)點(diǎn)的橫坐標(biāo)值是橫軸x上的考試花費(fèi)時(shí)間,點(diǎn)的縱坐標(biāo)的值是縱軸y考試分?jǐn)?shù)。這樣的圖就叫做散點(diǎn)圖,散點(diǎn)圖可以顯示出數(shù)據(jù)之間的相關(guān)性。 當(dāng)我們想知道兩個(gè)指標(biāo)互相之間有沒有關(guān)系,散點(diǎn)圖是最好的工具之一。因?yàn)樗庇^。尤其是大數(shù)據(jù)量,散點(diǎn)圖會(huì)有更精準(zhǔn)的結(jié)果。在回歸分析中我們經(jīng)常會(huì)用到散點(diǎn)圖。 2)折線圖 對(duì)于時(shí)間序列的數(shù)據(jù),我們用折線圖來可視化,也就是用線條將相關(guān)的數(shù)據(jù)點(diǎn)相連,幫助我們用肉眼觀察隨著時(shí)間變化,數(shù)據(jù)是如何變化的趨勢(shì)。 下面圖片是春節(jié)假期前,招聘類APP周活躍率保持在一個(gè)穩(wěn)中有降的狀態(tài)。春節(jié)假期后,隨著“金三銀四”人才招聘高峰期的臨近,招聘類APP周活躍率進(jìn)入了一個(gè)爆發(fā)增長期,用戶規(guī)模最大的智聯(lián)招聘、前程無憂51job增長態(tài)勢(shì)尤其明顯。 3)柱狀圖 對(duì)于分類數(shù)據(jù)這種離散數(shù)據(jù),需要查看數(shù)據(jù)是如何在各個(gè)類別之間分布的,這時(shí)候就可以使用柱狀圖。我們?yōu)槊總€(gè)類別畫出一個(gè)柱子。 柱狀圖可以有一組或多種多組數(shù)據(jù)類別里對(duì)比。下面圖片中對(duì)比了三個(gè)招聘類APP用戶,其中智聯(lián)招聘、獵聘同道APP用戶更多集中在三線及以下城市。而拉勾APP一線城市用戶占比接近40% 。 以后你找工作,就要根據(jù)自己的城市選擇合適的招聘APP來投簡歷。 柱形圖還有許多豐富的應(yīng)用。 堆積柱狀圖不僅能比較各類別總體區(qū)別,還能同時(shí)還能看出每個(gè)類別中子成分的占比情況。但這種圖形會(huì)讓用戶產(chǎn)生視覺上的壓力。因?yàn)槌说撞康淖映煞郑ㄒ簿褪蔷o貼x軸的那個(gè)子成分),你很難比較其他子成分,這讓肉眼比較變得很困難。 瀑布圖可用于抽離出堆疊柱狀圖中的一部分重點(diǎn)關(guān)注,或者展示起點(diǎn)和結(jié)果以及其中的上升下降等變化。 下圖中的瀑布圖例子,用于展示過去一年中公司職員總數(shù)的變化情況。 在圖的左側(cè),我們可以看到年初這個(gè)團(tuán)隊(duì)的職員總數(shù)。從左到右,我們首先看到數(shù)據(jù)的提升:新招聘以及從組織的其他團(tuán)隊(duì)轉(zhuǎn)崗來的職員。之后數(shù)據(jù)減少:轉(zhuǎn)崗到別的團(tuán)隊(duì)或是離職。最后一列代表了在年初基礎(chǔ)上增減之后的年末職員總數(shù)。 直方圖是柱形圖的特殊形式,當(dāng)我們想要看數(shù)據(jù)集的分布情況時(shí),選擇直方圖。直方圖的變量劃分至不同的范圍,然后在不同的范圍中統(tǒng)計(jì)計(jì)數(shù)。在直方圖中,柱子之間的連續(xù)的,連續(xù)的柱子暗示數(shù)值上的連續(xù)。 下圖中的直方圖可以顯示出男性身高數(shù)據(jù)集的分布呈現(xiàn)正態(tài)分布。橫軸是身高,以5厘米為單位。縱軸是每一段5厘米各有多少人。 4)條形圖 條形圖就是將豎直的柱狀圖翻轉(zhuǎn)90度得到的圖形。與柱狀圖一樣,條形圖也可以有一組或多種多組數(shù)據(jù)。 下面圖片是移動(dòng)大數(shù)據(jù)服務(wù)商極光大數(shù)據(jù)《2017第2季度app榜單》顯示前10名的app。 如果非要為分類數(shù)據(jù)挑選一種圖形,那就是條形圖。為什么呢? 首先,條形圖非常容易閱讀。水平條形圖在類別名稱很長的時(shí)候非常方便,因?yàn)槲淖质菑淖蟮接視鴮懙模c大多數(shù)用戶的閱讀順序一致,這使得你的圖形容易閱讀。而柱狀圖在類別名稱很長的時(shí)候是沒有辦法很好的展示的。 其次,由于我們處理信息的方式是從左上角開始,在頁面或者屏幕上畫“之”字,這正是水平條形圖的結(jié)構(gòu)。我們會(huì)在實(shí)際數(shù)據(jù)之前先看到類別的名稱。這意味著當(dāng)我們看到數(shù)據(jù)時(shí)已經(jīng)了解了其所代表的含義,不像豎直柱狀圖那樣在數(shù)據(jù)和類別名稱之間來回轉(zhuǎn)動(dòng)眼球。 條形圖還有許多豐富的應(yīng)用。例如堆積條形圖。堆積條形圖和堆積柱狀圖類似,堆積條形也可以展示不同類別間整體或者子成分的比較。 如果左右端有著一致的基線,堆疊條形圖可以用于可視化對(duì)一件事情從負(fù)面到正面的觀點(diǎn)占比,使得比較最左側(cè)和最右側(cè)的部分變得更簡單。例如下圖中收集的調(diào)查問卷數(shù)據(jù)進(jìn)行可視化。 現(xiàn)在我們已經(jīng)了解了4種常見的圖形,下面圖片我們看下由這4種類型演化出來的其他圖形類型。 4.其他圖形
餅圖是用面積表示一組數(shù)據(jù)的占比。下圖是我公眾號(hào)(猴子聊人物)中對(duì)不同渠道閱讀文章占比的餅圖。 需要注意的是,我們要避免使用餅圖,因?yàn)槿搜鄄簧瞄L在二維空間進(jìn)行定量的度量,這使得這類圖表很難閱讀。當(dāng)餅圖的各部分大小相近時(shí),你很難判斷哪一塊更大。比如20%和25%在餅圖上憑肉眼是難以分辨出區(qū)別的。 所以,餅圖應(yīng)該避免使用。
箱線圖用來展示數(shù)據(jù)集的描述統(tǒng)計(jì)信息,也就是四分位數(shù)。線的上下兩端表示某組數(shù)據(jù)的最大值和最小值。箱子的上下兩端表示這組數(shù)據(jù)中排在前25%位置和75%位置的數(shù)值。箱中間的橫線表示中位數(shù)。 下圖的箱線圖是對(duì)不同工作經(jīng)驗(yàn)的薪酬比較。橫軸是工作年限,縱軸是薪酬。通過比較數(shù)據(jù),我們可以看出隨著年份上升,薪資待遇的上升也是非常明顯的,尤其是3-5年這一段,提升的跨度非常之大。另外,從現(xiàn)有數(shù)據(jù)來看,數(shù)據(jù)分析師似乎是個(gè)常青的職業(yè)方向,在10年內(nèi)大概不會(huì)因?yàn)槟挲g的增長導(dǎo)致收入下降。 再比如你是一位互聯(lián)網(wǎng)電商分析師,你想知道某商品每天的賣出情況:該商品被用戶最多購買了幾個(gè),大部分用戶購買了幾個(gè),用戶最少購買了幾個(gè)。箱線圖就能很清晰的表示出上面的幾個(gè)指標(biāo)以及變化。
熱力圖是用高亮形式展現(xiàn)數(shù)據(jù)。下圖是智聯(lián)招聘APP和拉勾APP用戶在北京的工作地點(diǎn)。從圖中高亮紅色的區(qū)域,我們可以看出智聯(lián)招聘APP用戶北京工作地在全市范圍內(nèi)均有分布,而拉勾APP用戶在北京工作地更多的集中在中關(guān)村、上地、望京、國貿(mào)等互聯(lián)網(wǎng)企業(yè)密集區(qū)域。 我們生活中最常見的例子就是用熱力圖表現(xiàn)道路交通狀況,老司機(jī)一眼就知道哪些路段擁堵,哪些路段順暢,從而選擇合適的開車路線。 互聯(lián)網(wǎng)產(chǎn)品中,熱力圖可以用于網(wǎng)站/APP的用戶行為分析,將用戶瀏覽、點(diǎn)擊、訪問頁面最多的位置以高亮的可視化形式表現(xiàn)。從而根據(jù)用戶行為改善網(wǎng)頁、APP的設(shè)計(jì)。
雷達(dá)圖在商務(wù)、財(cái)務(wù)領(lǐng)域應(yīng)用較大,適合用在固定的框架內(nèi)表達(dá)某種已知的結(jié)果。因?yàn)檫@個(gè)圖形像雷達(dá)(圖)的放射波,而且具有指引經(jīng)營“航向”的作用,所以叫做雷達(dá)圖。 下圖是三個(gè)招聘類APP用戶中,獵聘同道APP用戶更加偏好個(gè)戶美容、汽車、健康、家具等類型應(yīng)用,對(duì)于個(gè)人生活品質(zhì)要求更高。拉勾APP用戶對(duì)于母嬰類應(yīng)用興趣要遠(yuǎn)低于其他兩個(gè)APP用戶。比起孩子,拉勾APP用戶更關(guān)注房產(chǎn),租房、買房是他們的重心所在。
詞云圖是對(duì)數(shù)據(jù)集中出現(xiàn)頻率較高的“關(guān)鍵詞”給予視覺上的突出,從而過濾掉大量的文本信息,使用戶只要一眼掃過文本就可以看到出現(xiàn)頻率較高的關(guān)鍵詞。 下圖是從招聘網(wǎng)站爬取的公司對(duì)數(shù)據(jù)分析師的技能要求關(guān)鍵詞,用這些關(guān)鍵詞我們做出詞云圖。通過詞云圖,我們發(fā)現(xiàn)公司需求頻率最高的技能是表格神器Excel和查詢語言SQL,這一點(diǎn)需要各位小伙伴注意,如果要想從事數(shù)據(jù)分析師崗位,SQL和Excel看起來是必備技能。
漏斗圖經(jīng)常用來做用戶轉(zhuǎn)化率的可視化,其中最著名的就是硅谷用戶增長專家肖恩·埃利斯在他的書《增長黑客—如何低成本實(shí)現(xiàn)爆發(fā)式成長》中提出的AARRR漏斗模型。 這個(gè)模型對(duì)應(yīng)的分別是5個(gè)過程:Acquisition(獲取用戶),Activation(激活用戶),Retention(提高留存),Revenue(增加收入),Referral(病毒傳播)。 這套體系模型也不僅適用于互聯(lián)網(wǎng)行業(yè),它也可以應(yīng)用到面向大眾消費(fèi)者的各個(gè)行業(yè)中,幫助業(yè)務(wù)成長,實(shí)現(xiàn)經(jīng)濟(jì)增長。下面我們分別看下這個(gè)漏斗圖中的每個(gè)部分。 1)Acquisition(獲取用戶) 這個(gè)環(huán)節(jié)用一句話來概括就是:用戶如何找到我們? 在互聯(lián)網(wǎng)行業(yè)中,很多創(chuàng)業(yè)公司死掉并不是因?yàn)樗麄兊臉I(yè)務(wù)或產(chǎn)品不行,而是因?yàn)樗麄兊墨@客成本很高,并且沒有辦法降下來。肖恩最初在硅谷的云存儲(chǔ)業(yè)務(wù)的創(chuàng)業(yè)公司Dropbox工作。這家公司開始時(shí)每獲得一名用戶的成本高達(dá)400美元,而它提供的付費(fèi)服務(wù)每年是99美元。
2)Activation(激活用戶) 這個(gè)環(huán)節(jié)用一句話來概括,就是用戶的首次體驗(yàn)如何? 很多手機(jī)應(yīng)用,注冊(cè)用戶不少,但是打開率不高。你要做的是激活他們,讓他們真正地使用產(chǎn)品。 想喚醒休眠用戶,就得先摸清楚產(chǎn)品的“啊哈時(shí)刻”(Ahamoment)。什么叫“啊哈時(shí)刻”呢? 說白了就是讓用戶感受到產(chǎn)品亮點(diǎn)情不自禁地發(fā)出贊嘆的時(shí)刻,它對(duì)應(yīng)的就是打動(dòng)用戶的產(chǎn)品亮點(diǎn)。比如網(wǎng)易云音樂,在眾多音樂軟件中突圍的亮點(diǎn)就是評(píng)論,用戶打開軟件,可能第一件事不是聽歌,而是看評(píng)論,心里面會(huì)有一些贊嘆。 要想激活用戶,得繪制一幅通往“啊哈時(shí)刻”的路線圖。比如你負(fù)責(zé)的產(chǎn)品是個(gè)購物軟件,在新用戶體驗(yàn)到啊哈時(shí)刻之前,必須要完成下面這些步驟:下載app,找到所需商品,放入購物車,創(chuàng)建賬戶,輸入姓名,加入信用卡和配送信息,然后點(diǎn)擊購買。在這一系列動(dòng)作中,到底用戶停留在了哪一步?是搜不到要的東西,還是創(chuàng)建賬戶太麻煩,或者是頁面設(shè)置不合理?你要計(jì)算每個(gè)節(jié)點(diǎn)用戶的損失率,來相應(yīng)地提高產(chǎn)品性能,改善用戶體驗(yàn)。 接下來,你可以通過游戲化的做法,給用戶獎(jiǎng)勵(lì),比如打卡、積分。你還可以通過觸發(fā)物,喚醒用戶,比如推送信息等。這些都需要反復(fù)的試驗(yàn),才能找到最有效的激活方法。這方面得到app就做的不錯(cuò),可以作為案例研究。 3)Retention(提高留存) 第三個(gè)環(huán)節(jié)是留存。也就是用戶會(huì)回來嗎?
在這個(gè)階段,你要明白習(xí)慣是如何形成的。這里有一個(gè)經(jīng)典的案例,就是亞馬遜的會(huì)員服務(wù)。在剛推出時(shí),許多分析人士都說這個(gè)計(jì)劃必定會(huì)失敗,因?yàn)槊绹呐渌统杀臼呛芨叩模?9美元的會(huì)員服務(wù)給會(huì)員免費(fèi)配送一年,亞馬遜肯定會(huì)虧。但亞馬遜的真正目標(biāo)是改變?nèi)藗兊牧?xí)慣,讓他們?cè)谫徫镏辛?xí)慣會(huì)員優(yōu)惠價(jià)格,習(xí)慣免運(yùn)費(fèi),從而不再去其他家買東西。 留存用戶根據(jù)初期、中期和長期階段有不同的做法,增長黑客可以通過分組來觀察,并持續(xù)提供實(shí)際回報(bào)來留住用戶。 有段時(shí)間Facebook發(fā)現(xiàn)自己用戶流失得很厲害,之前注銷賬號(hào)的確認(rèn)頁面有一段提示:你是不是要注銷啊,你確認(rèn)下,你再多確認(rèn)一下,OK你去意已決那就給你注銷。 后來Facebook改變了下確認(rèn)頁面,在注銷結(jié)束之前增加了一個(gè)頁面。這個(gè)頁面它會(huì)把跟你互動(dòng)比較親密的五個(gè)朋友頭像列出來,然后配上文字說:你確定你要注銷嘛?你如果要注銷的話,這些人再也看不到你了,你也再也關(guān)注不了這些朋友的新的情況了,你是不是要再考慮一下? 就是這個(gè)東西增加了3%的留存可能,相當(dāng)于Facebook一年有三百萬個(gè)流失就這樣被避免掉了。 4)Revenue(增加收入) 也就是如何賺到更多錢? 完成了上面所有的步驟,終于來到最有挑戰(zhàn)性的一關(guān),那就是如何從用戶身上獲得真正的收益。比如讓用戶續(xù)訂、創(chuàng)造更多的廣告位等等。 雖然商業(yè)模式不同,變現(xiàn)的方式不同,但是有一個(gè)概念需要重視,那就是夾點(diǎn)(pinchpoint),它指的是損失潛在收益的地方。對(duì)于電商企業(yè)來說,用戶從挑選商品到完成購買之間是一個(gè)危險(xiǎn)區(qū),很多人中途會(huì)放棄購買。增長團(tuán)隊(duì)要評(píng)估這些常見夾點(diǎn),分析用戶在這些點(diǎn)放棄的原因。 5)Referral(病毒傳播) 用一句話來概括就是:用戶會(huì)告訴他人嗎? 比如這次薛兆豐菜市場經(jīng)濟(jì)學(xué),下面幾張海報(bào)的目的就是讓用戶分享到朋友圈,從而讓更多的讓看到這個(gè)活動(dòng),實(shí)現(xiàn)病毒傳播效果。 前面我們已經(jīng)學(xué)會(huì)了常見的圖表。下次我們?cè)倭牧模鎸?duì)不同的業(yè)務(wù)場景,如何選擇并繪制出有效的圖表。 推薦:如何用最短的時(shí)間找到初級(jí)數(shù)據(jù)分析師工作?
|
|