久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

     期盼又見晨曦 2019-07-18

    來源: AskTempo

    哪些在具體業(yè)務(wù)中,如何有效應(yīng)用,快速落地一個項目應(yīng)用實踐呢?今天我們將以一個行業(yè)實際案例為主,依據(jù)“數(shù)據(jù)挖掘方法論”“詳細(xì)可參閱歷史推文《數(shù)據(jù)挖掘方法論》”為大家詳細(xì)解析,如何快速完成一個項目應(yīng)用實踐,通過數(shù)據(jù)挖掘技術(shù)和方法,獲取業(yè)務(wù)應(yīng)用價值。

    數(shù)據(jù)挖掘方法論為開展數(shù)據(jù)挖掘項目提供了一套完整的、高效的、質(zhì)量可控的項目管理過程。CRISP-DM方法論將一個數(shù)據(jù)挖掘項目的生命周期分為六個階段,其中包括業(yè)務(wù)理解(businessunderstanding),數(shù)據(jù)理解 (data understanding),數(shù)據(jù)準(zhǔn)備(data preparation),建立模型(modeling),評估模型(evaluation)和結(jié)果部署(deployment)。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    那么,在一個實際的數(shù)據(jù)挖掘工作中,如何落地實踐這套挖掘方法論呢?下面我們將以“公募基金精準(zhǔn)營銷”為例,詳細(xì)介紹數(shù)據(jù)挖掘項目開展流程和步驟【建模工具采用:TempoAI完成】。

    階段一:業(yè)務(wù)理解(businessunderstanding)

    業(yè)務(wù)背景:券商發(fā)行的公募基金產(chǎn)品,傳統(tǒng)的營銷方式為外呼人員電話營銷。傳統(tǒng)電話營銷方式存在的問題主要有兩點:

    • 工作量巨大,因為是用全量客戶名單來打電話營銷:開展10萬人次外呼營銷任務(wù),要4個外呼人員1年的工作量;
    • 意向成功率過低,平均接通率54%,意向成功率18.09%左右。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    涉及部門:信息技術(shù)部、營銷部、客服部(外呼中心)

    業(yè)務(wù)目標(biāo):提升意向成功率,優(yōu)化外呼營銷策略,切實增加意向成功用戶數(shù),提高投入產(chǎn)出率。

    分析方案:

    • 分類預(yù)測:構(gòu)建潛客預(yù)測模型,預(yù)測高概率購買公募基金的潛在客戶,為券商提供精準(zhǔn)營銷客戶名單。

    分析成果驗證:將分析產(chǎn)生的預(yù)測會夠買的人員名單,提供給外呼中心,進(jìn)行外呼推薦公募基金產(chǎn)品,最終將推薦名單外呼和傳統(tǒng)的外呼效果進(jìn)行比對,對比外呼成功率,從而判斷分析成果是否顯著。

    階段二:數(shù)據(jù)理解 (dataunderstanding)

    收集的數(shù)據(jù)表信息包括:

    • 借記卡用戶基本信息表
    • 信用卡用戶基本信息表、用戶狀態(tài)標(biāo)識代碼表
    • 信用卡卡片信息表、信用卡卡片代碼表、卡片狀態(tài)標(biāo)識代碼表
    • 信用卡交易流水信息表
    • 用戶的業(yè)務(wù)信息表
    • 公共信息表:商戶代碼MCC碼表、用戶職業(yè)代碼表等
    • 歷史外呼反饋信息表
    • 信用卡違約狀態(tài)及未還款的歷史數(shù)據(jù)
    • 設(shè)備信息

    針對收集到的數(shù)據(jù)信息,進(jìn)行數(shù)據(jù)理解

    用戶特征探索:待營銷用戶群體的分布形態(tài),營業(yè)部分布,性別分布,風(fēng)險等級分布及業(yè)務(wù)開通情況。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    階段三:數(shù)據(jù)準(zhǔn)備(datapreparation)

    數(shù)據(jù)準(zhǔn)備工作包括為建模工作準(zhǔn)備數(shù)據(jù)的選擇、轉(zhuǎn)換、清洗、構(gòu)造、整合及格式化等多種數(shù)據(jù)預(yù)處理工作。這里主要進(jìn)行了數(shù)據(jù)指標(biāo)體系設(shè)計、建模所需字段的生成、缺失值處理等。

    TempoAI數(shù)據(jù)處理:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    階段四:建立模型(modeling)

    基于用戶基本信息如風(fēng)險等級、開戶年限、年齡等,資產(chǎn)信息如總資產(chǎn)、近一年最大資產(chǎn)、近半年日均資產(chǎn)等,產(chǎn)品交易信息如股票交易次數(shù)、近兩年最后買公墓基金天數(shù)、近半年理財持有比例,構(gòu)建用戶公募基金潛客預(yù)測模型,基于該模型,可以預(yù)測高概率購買公募基金的潛在客戶,為券商提供精準(zhǔn)營銷客戶名單。在TempoAI中構(gòu)建的建模流程如下:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    建模步驟說明:

    1、讀取數(shù)據(jù)

    拖入關(guān)系數(shù)據(jù)庫輸入節(jié)點,選擇數(shù)據(jù)源,選擇購買公募基金用戶的歷史數(shù)據(jù)集,完成數(shù)據(jù)讀取。

    2、設(shè)置角色

    在設(shè)置角色節(jié)點,選擇參與模型訓(xùn)練的變量設(shè)置自變量(影響因素)和因變量(預(yù)測變量)。

    自變量為:用戶基本信息/資產(chǎn)信息及產(chǎn)品交易信息等字段;

    因變量為:flag(是否購買公募基金,1代表購買,0代表不夠買)。

    3、數(shù)據(jù)拆分

    為了保證模型的可靠性,我們一般將原始數(shù)據(jù)集拆分成兩個或三個數(shù)據(jù)集,這里我們拆分為兩部分:一部分用于訓(xùn)練模型,另外一部分用于測試模型的泛化能力(預(yù)測能力)。如下圖所示,70%的數(shù)據(jù)作為訓(xùn)練集 30%的數(shù)據(jù)作為測試集。

    4、梯度提升決策樹

    選擇一個分類算法,構(gòu)建分類模型,這里我們選擇梯度提升決策樹算法,將數(shù)據(jù)拆分后的訓(xùn)練集接入算法,參數(shù)設(shè)置如下:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    5、訓(xùn)練集分類評估

    將算法的M端口和D端口連接一個分類評估節(jié)點,評估訓(xùn)練集的預(yù)測效果。分類評估節(jié)點參數(shù)設(shè)置如下:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    6、模型利用

    將算法輸出的M端口連接模型利用節(jié)點,同時將數(shù)據(jù)拆分后的測試集D端口接入模型利用,這里將利用梯度提升決策樹產(chǎn)生的模型對測試數(shù)據(jù)集進(jìn)行預(yù)測。

    7、測試集分類評估

    將模型利用輸出的M端口和D端口連接一個分類評估節(jié)點,評估測試集的預(yù)測效果。

    8、模型輸出

    將訓(xùn)練好的模型輸出到模型庫。

    9、連接END端點

    完成流程構(gòu)建,點擊執(zhí)行。

    階段五:評估模型(evaluation)

    評估模型,指在此階段,需要從技術(shù)層面判斷模型效果以及從業(yè)務(wù)層面判斷模型在實際商業(yè)環(huán)境當(dāng)中的實用性。

    流程執(zhí)行成功后,可在洞察頁面,查看流程執(zhí)行的結(jié)果:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    這里我們主要看分類模型評估結(jié)果及分類模型預(yù)測結(jié)果。

    • 點擊“梯度提升決策樹節(jié)點”查看分類模型內(nèi)容及預(yù)測結(jié)果數(shù)據(jù)集:

    下圖為模型內(nèi)容:決策樹及層級說明信息

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    下圖為預(yù)測結(jié)果數(shù)據(jù)集信息:可從業(yè)務(wù)角度評估預(yù)測結(jié)果的合理性。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    • 點擊“分類評估節(jié)點”查看分類評估結(jié)果(包括訓(xùn)練集評估和測試集評估)

    訓(xùn)練集評估結(jié)果:包括模型的準(zhǔn)確率、混淆矩陣、ROC/PR、Lift曲線、Gains曲線、基尼系數(shù) 、K-S曲線。綜合各評估指標(biāo)及曲線,模型評估效果較好。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    測試集評估結(jié)果:如下圖

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    階段六:結(jié)果部署(deployment)

    經(jīng)過模型訓(xùn)練和模型測試,得到了比較理想的預(yù)測模型。需要將模型的成果書面化,結(jié)合前幾個階段進(jìn)行總結(jié),形成數(shù)據(jù)“分析報告”。如果涉及到工程化應(yīng)用,還需要將模型發(fā)布成不同方式(調(diào)度、同步/異步服務(wù)API、實時服務(wù)等),供其它業(yè)務(wù)系統(tǒng)進(jìn)行整合,形成最終的決策應(yīng)用系統(tǒng),需要“部署應(yīng)用”。

    分析報告

    TempoAI洞察頁面,支持直接導(dǎo)出Word格式的完整挖掘流程建模分析報告。如下圖所示:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    部署應(yīng)用

    構(gòu)建一個預(yù)測流程,利用訓(xùn)練好的模型,然后把預(yù)測流程發(fā)布,并部署為應(yīng)用。

    (1)構(gòu)建預(yù)測流程

    將要預(yù)測的數(shù)據(jù)作為數(shù)據(jù)源,讀取并利用已輸出的分類預(yù)測模型,構(gòu)建預(yù)測流程。如下所示:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    (2)發(fā)布預(yù)測流程

    進(jìn)入“部署”“-“發(fā)布”,將預(yù)測流程發(fā)布。

    (3)構(gòu)建調(diào)度

    在“部署”-“應(yīng)用”,將已發(fā)布的預(yù)測流程構(gòu)建調(diào)度任務(wù)。平臺提供任務(wù)調(diào)度器,可配置調(diào)度任務(wù),將的一個或多個流程在指定的日期范圍內(nèi)按一定的頻率定期執(zhí)行,完成預(yù)測任務(wù)。如下所示:

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    (4)構(gòu)建服務(wù)

    在“部署”-“應(yīng)用”,用戶可將已發(fā)布流程構(gòu)建一個服務(wù),根據(jù)流程數(shù)據(jù)源的不同,分為同步服務(wù)、異步服務(wù)和流服務(wù)。同步服務(wù):支持第三方系統(tǒng)通過Thrift/Rest調(diào)用流程,實時返回預(yù)測結(jié)果。異步服務(wù):支持第三方系統(tǒng)通過Rest調(diào)用流程,按照指定頻率定期執(zhí)行,完成模型構(gòu)建或數(shù)據(jù)預(yù)測,預(yù)測結(jié)果輸入到指定數(shù)據(jù)庫。流服務(wù):開啟服務(wù),當(dāng)Kafka的隊列中有消息時,即可執(zhí)行流程,完成對于流式數(shù)據(jù)的實時處理。

    (5)服務(wù)調(diào)用

    第三方系統(tǒng)可調(diào)用相應(yīng)的API,通過在第三方系統(tǒng)輸入?yún)?shù),調(diào)用服務(wù),并返回服務(wù)的執(zhí)行狀態(tài)。

    調(diào)用方式:打開該服務(wù)的測試頁面,“下載示例代碼”、“下載SDK”。將下載的示例代碼文件中的代碼段復(fù)制粘貼,即可通過運行代碼調(diào)用該異步服務(wù)。調(diào)用接口可供營銷業(yè)務(wù)系統(tǒng)進(jìn)行整合,形成最終的決策應(yīng)用系統(tǒng),給營銷外呼中心提供營銷名單,指導(dǎo)實際業(yè)務(wù)的開展。

    (6)部署結(jié)果驗證

    將預(yù)測分析產(chǎn)生的預(yù)測購買人員名單,提供給外呼中心,進(jìn)行外呼推薦公募基金產(chǎn)品,最終將推薦名單外呼和傳統(tǒng)的外呼效果進(jìn)行比對,對比結(jié)果如下:推薦外呼11天,撥打5877通電話(占傳統(tǒng)外呼36.01%),得到意向客戶數(shù)1664個,是傳統(tǒng)外呼開展32天的整體意向客戶數(shù)的1.08倍。結(jié)合營銷活動的成本和成果兩個方面考慮,綜合效果提升3.14倍。

    美林?jǐn)?shù)據(jù):如何快速完成一個數(shù)據(jù)挖掘分析項目?

    【會員企業(yè)】美林?jǐn)?shù)據(jù)

    美林?jǐn)?shù)據(jù)技術(shù)股份有限公司(簡稱:美林?jǐn)?shù)據(jù),NEEQ:831546)是國內(nèi)知名的數(shù)據(jù)治理和數(shù)據(jù)分析服務(wù)提供商,重點面向企業(yè)客戶提供數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)分析與挖掘、數(shù)據(jù)開發(fā)應(yīng)用為主的大數(shù)據(jù)產(chǎn)品及增值解決方案,引領(lǐng)大數(shù)據(jù)應(yīng)用和產(chǎn)業(yè)數(shù)據(jù)運營等創(chuàng)新服務(wù)模式。

    公司專注數(shù)據(jù)價值發(fā)掘、深耕行業(yè)應(yīng)用,以大數(shù)據(jù)、人工智能技術(shù)及產(chǎn)品創(chuàng)新應(yīng)用為方向,構(gòu)建企業(yè)核心競爭力。公司現(xiàn)已形成數(shù)據(jù)資源管理平臺(TempoDM)、數(shù)據(jù)可視化平臺(TempoBI)、人工智能平臺(TempoAI)系列大數(shù)據(jù)管理與分析應(yīng)用系列產(chǎn)品,為企業(yè)級用戶提供一體化、一站式大數(shù)據(jù)服務(wù)。依托領(lǐng)先的產(chǎn)品和技術(shù)優(yōu)勢,美林?jǐn)?shù)據(jù)聚焦智能制造、智慧能源兩大核心領(lǐng)域,同時拓展智慧軍工、汽車裝配、家電制造、智慧水務(wù)、智慧金融等細(xì)分領(lǐng)域,致力于打造企業(yè)級大數(shù)據(jù)應(yīng)用樣板,以數(shù)據(jù)驅(qū)動業(yè)務(wù)、探索行業(yè)數(shù)據(jù)運營新模式。

    編輯:于騰凱

    — 完 —

      本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
      轉(zhuǎn)藏 分享 獻(xiàn)花(0

      0條評論

      發(fā)表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 欧洲国产精品无码专区影院| 欧美成本人视频免费播放| 日韩欧美在线观看一区二区视频| 亚洲av永久无码精品天堂久久| a级国产乱理伦片在线观看al| 亚洲欧美人成电影在线观看| 国产成人高清在线观看视频 | 国产精品中文字幕av| 欧美牲交a欧美牲交aⅴ图片| 一区二区三区鲁丝不卡| 青草青草久热精品视频在线观看| 国产欧美日韩A片免费软件| 亚洲va久久久噜噜噜久久狠狠| 亚洲 日本 欧洲 欧美 视频| 亚洲欧美中文日韩V在线观看| 国产精品视频第一区二区三区 | 国产波霸爆乳一区二区| 亚洲精品无码永久在线观看你懂的| 午夜无码大尺度福利视频| 重口SM一区二区三区视频| 日日摸夜夜添夜夜添无| 久久综合亚洲色一区二区三区| 亚洲国产欧美一区二区好看电影 | 国产综合色在线精品| 精品人妻二区中文字幕| 成 人 色 网 站免费观看| 一夲道无码人妻精品一区二区| 丁香婷婷色综合激情五月| 放荡的美妇在线播放| 亚洲欧美综合人成在线| 人妻AV中文字幕一区二区三区| 日产国产一区二区不卡| 亚洲国产成人AⅤ毛片奶水| 国产午夜福利在线视频| 国产成人一区二区三区视频免费| 2021国产成人精品久久| 国产免费1卡2卡| 精品偷拍一区二区三区| 日韩亚洲AV人人夜夜澡人人爽| 少妇办公室好紧好爽再浪一点| 狠狠人妻久久久久久综合|