久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    百度人工智能詳細分析

     mrjiangkai 2017-10-29

    百度人工智能詳細分析

    本文源自 太平洋證券 人工智能專題研究之一

    證券分析師 王文龍、徐中華

    信息化顧問團 楊凱 整理

    百度AI平臺將逐步開放,助力構建百度AI生態圈

    “云+大腦”打磨升級構成百度AI平臺

    百度AI開發者大會(Baidu Create 2017)上,百度AI平臺架構圖首次完整亮相,全新開放了視頻、語音、AR/VR、機器人視覺、自然語音處理等五大類目共14項全新能力,此次開放的技術能力總共有60個,是目前最全面的AI技術開放平臺。百度AI平臺由百度大腦及百度云組成,分為云、大數據、算法層、感知層、認知層、平臺層五大層次,核心能力的開放已達60余項。

    百度人工智能詳細分析

    圖表1:百度AI平臺的架構

    作為百度AI平臺的核心,百度大腦由算法層、感知層、認知層、平臺層共同組成,是業界第一個完整清晰地把認知層和感知層放在一起的人工智能平臺。

    • 算法層包括大數據、深度學習,是百度大腦的底層基礎。

    • 感知層包括語音識別、圖像識別、視頻理解和增強現實/虛擬現實4大核心技術能力,賦予機器“聽懂、看懂”的能力;

    • 認知層包括領先的自然語言處理、知識圖譜、用戶畫像能力,賦予機器“理解”能力。

    • 平臺層即百度AI開放平臺,集合了百度所有的AI能力并將逐漸開放給所有開發者。

    百度人工智能詳細分析

    圖表2:百度大腦各層次能力

    多領域在人工智能方向進行戰略構建

    百度自2013年1月組建專注于Deep Learning(深度學習)的研究院—Institute of Deep Learning(簡稱IDL)開始,百度便已經積極布局人工智能:

    • 機構設立方面:公司先后成立自然語言處理部(2010年)、百度硅谷人工智能實驗室(2014年)、自動駕駛事業部(2015年)、度秘事業部(2017年)、AR實驗室(2017年)、智能駕駛事業群組(IDG,2017年)、深度學習技術及應用國家工程實驗室(2017年)等。其中:今年3月22日,百度通過內部郵件宣布進一步深度整合包括NLP、KG、IDL、Speech、Big Data等在內的百度核心技術,組成百度AI技術平臺體系(Artificial Intelligence Group,簡稱“AIG”)。近期,百度對AIG進行了調整:

      • 單獨成立智慧機場業務部、智能客服與金牌銷售業務部。智慧機場業務部重點面向航空服務領域;智能客服與金牌銷售業務部,融合語音識別、自然語言處理等前沿技術,提升企業與客戶電話溝通中的效率和效能。該技術通過對呼叫中心的通話歷史語音進行分析,提取客戶畫像、優秀銷售經驗,并在通話過程中進行實時語音識別及分析等方式,結合當前客戶情況與銷售特點,個性化推薦適合的銷售思路與話術要點。

      • 強化了AI應用技術研發,原隸屬于研究院的幾個技術團隊升格為獨立的技術部門,包括視覺技術部、人臉技術部、增強現實技術部等。

      • 成立AI技術平臺與生態部,進一步整合推動百度所擁有的自然語言處理、知識圖譜、深度學習、語音圖像、大數據等技術。

    • 人才儲備方面:2017年,百度與北京航空航天大學合作設立人工智能專業;目前,BAT的AI人才布局中百度總數領先,占比2.54%。

    • 技術落地方面:語音開放平臺上線(2013年)、DeepSpeech深度語音識別系統(2014年)、小度機器人(2014年)、全球首個基于深度學習的大規模在線翻譯系統(2015年)、機器人助理“度秘”(2015年)、無人駕駛汽車相關技術(2015年)、AR技術幫助伊利等零售商進行營銷(2016年)、針對移動設備打造的增強現實平臺“度視”(2016年)、醫療大腦等百度大腦(2016年)、百度輸入法4.0引入人工智能(2016年)、百度AR先后與歐萊雅合作,帶來全新廣告營銷方式(2016年)、與KFC合智能推薦點餐(2016年)、與神農架合作AR觀山(2016年)、《但丁密碼》AR面具海報(2016年)、G-1智能高清機頂盒(2016年)、烏鎮世界互聯網大會人臉識別閘機(2016年)、海爾與美的搭載DuerOS打造智能家居(2017年)、家庭陪伴型機器人“分身魚”(2017年)、國航用人工智能進行人臉識別(2017年)。

    • 資本投入方面:自2016年開始,公司先后投資美國科技公司ZestFinance、激光雷達公司Velodyne LiDAR、人工智能語音助手平臺開發商Raven Tech、計算機視覺公司xPerception、以色列視頻捕捉技術公司Pixellot、投資上海漢楓科技及室內導航公司IndoorAtlas、參股新西蘭VR/AR/3D成像公司8i、收購專注于語音喚醒和自然語言理解的人工智能創業公司KITT.AI(2017年)等。

    2017年1月,陸奇先生加入百度擔任集團總裁兼CEO,圍繞人工智能在集團架構、業務以及人事方面大刀闊斧進行改革,包括將自動駕駛事業部(L4)、智能汽車事業部(L3)、車聯網業務(Car Life etc)合并組建新的智能駕駛事業群組(IDG),并向汽車行業及自動駕駛領域的合作伙伴提供一款名叫Apollo的開放軟件平臺。

    國外方面,Amazon、Facebook布局人工智能主要是為了智能其各自的傳統主業以使自身在各自領域保持競爭力,而Google及IBM則是從集團層面對其人工智能生態建設進行了整體規劃。國內方面,阿里巴巴在人工智能方面的行動主要是針對具體的應用場景進行智能化,而騰訊則主要是通過在各事業部組建AI團隊來推進集團人工智能的發展。

    圖表3:其他科技巨頭在AI的布局概況

    公司名稱布局細節
    Google1、谷歌大腦:創建于2011年,目標是創造更智能的軟件和系統,從而改善人的生活。研究領域包括機器學習算法和技術、用于機器學習的計算機系統、自然語言理解、感知、醫療、機器人、音樂與藝術生成等。TPU、TensorFlow均來自谷歌大腦。2、谷歌NLU:專注于自然語言理解的團隊,與谷歌大腦是并列存在的關系。最新研究興趣包括句法、語篇、對話、多語言建模、情緒分析、問答、概述、使用有標記和未標記的數據與最先進的模型和間接監督來構建更好的學習系統。目前公開的最重要的成果就是被稱為“世界準確度最高的自然語言解析器SyntaxNet”。這是一個基于TensorFlow的自然語言理解神經網絡。谷歌在該平臺上訓練的模型的語言理解準確率超過90%。3、谷歌歐洲研究院:2016年6月在蘇黎世成立,研究領域為機器學習、自然語言理解、機器感知及數據壓縮。4、DeepMind:2010年在英國成立,2014年被谷歌以4億英鎊收購,收購后仍保持獨立運行,專注于深度強化學習,研究目標是通用人工智能。AlphaGo是DeepMind最知名的項目。2017年7月5日,DeepMind表示將在加拿大埃德蒙頓開設第一家AI研究中心。5、機器學習忍者項目:從谷歌內部團隊挑選有天賦的約20名程序員,為期6個月的人工智能人才培養項目。與谷歌大腦有合作關系。6、工程師團隊:谷歌25000名工程師中,有數以千計的人熟練掌握機器學習。7、應用:谷歌云機器學習API、翻譯、Waymo(前谷歌無人車部門,現在是Alphabet子公司)、Inbox等。8、收購:語言與圖像識別、生物識別、深度學習、智能家居、機器人領域的公司。
    Facebook1、Facebook人工智能實驗室(FAIR):2013年12月成立,是Facebook的AI基礎研究實驗室,目標是推動機器智能領域的進步。這是Facebook人工智能技術的核心部門。2、工程團隊:直接負責對接到Facebook的核心功能,比如廣告、搜索、新聞流、密鑰和Instagram。3、FBLearner Flow平臺:于2014年底在FAIR內部研究,后轉交給AML團隊,是Facebook研發基于AI的產品的支柱。這個平臺能幫助任何工程師輕松地開啟和管理機器學習實驗,而無需處理硬件基礎架構。每月運行約120萬的實驗。4、應用機器學習部門(AML):成立于2015年9月,是科學突破與產品使用連接起來的部門。包括4個主要團隊:核心機器學習、計算攝影、語言技術及自然語音識別。5、Language Technology團隊:該團隊在AML保護傘下,專注于開發翻譯、語音識別和自然語言理解,是部署實際軟件的地方,而FAIR是推動Facebook人工智能實驗的地方。6、Lumos:2016年11月首次披露,構建在FBLearnerFlow之上,是專用語圖像和視頻理解的AI平臺。7、收購:圖像和語言理解領域的公司。
    IBM1、商業解決方案Watson:2014年1月初,IBM宣布組建“Watson Group”,旨在進一步開發、商用及增強“Watson”及其他認知技術。同時,IBM還推出了兩項Watson數字顧問服務,一項用于幫助企業從海量數據獲得洞見,另一項則旨在使得數據可視化。2014年3月,Waston開始與紐約基因中心合作。5月,IBM通過Watson收購了人工智能創業公司Cognea,該公司為用戶提供個性化虛擬助手服務。2015年,Watson被部署在IBM 2014年收購的云計算基礎設施業務Softlayer上。2016年,以腫瘤為重心,Watson在慢病管理、精準醫療、體外檢測等九大醫療領域中實現了突破。2、AI技術:語音語義、深度學習神經網絡(收購了AIchemyAPI)3、云平臺:IBM Bluemix開放云技術平臺(PaaS+7種IBM Watson服務)、機器學習平臺SystemML4、硬件:TrueNorth(SyNapse成果)5、產業布局:深藍、與蘋果、軟銀進行智能機器人合作、VR游戲、物聯網、醫療服務6、收購:認知計算、搜索、人機對話、數據分析領域的公司
    Amazon1、服務:Amazon Lex、Amazon Polly以及Amazon Rekognition,分別定位于可編寫自然人機交互、語音轉換服務以及圖像識別。2、平臺:Amazon ML、Spark & EMR、Kinesis流數據處理平臺、Batch批次處理、ECS3、引擎:MXNet、TensorFlow、Caffe、Theano、Pytorch、CNTK4、基礎設施:GPU、CPU、IoT、移動5、1492團隊:旨在發掘醫療行業中的新機會,同時關注軟件和硬件項目。目前,他們正在試圖從傳統電子醫療檔案中挖取和整合數據;希望建立一個遠程醫療的平臺;探索基于Echo和Dash Wand的醫療應用等6、收購:圖像識別、圖像與語言理解領域的公司
    阿里巴巴1、AI部門:iDST(數據科學與技術研究院)、阿里人工智能實驗室、NASA計劃、參與“工業大數據應用技術國家工程實驗室”、與清華北大一起搭建大數據系統軟件國家工程實驗室2、AI產品線:ET大腦(工業、醫療、環境)、ET基礎服務(機器學習、智能語音、人臉識別、印刷文字識別、人機對話)3、資本布局:戰略投資日本機器人公司SBRH、入股山西嘉世達機器人
    騰訊1、AI機構:人工智能實驗室(AI Lab,負責基礎性研究工作)、各個事業部都有AI團隊(負責AI應用研究)2、應用方向:游戲AI、社交AI、內容AI、工具型AI3、智能產品:小冰、小微、云搜和文智、優圖人臉識別、QQ物聯、微信硬件平臺、叮當智能語音助手、絕藝(類似AlphaGo)、深度學習平臺DI-X4、資本布局:投資Diffbot、iCarbonX(碳云智能)、CloudMedX、Skymind、Scaled Inference;戰略入股搜狗;購買特斯拉5%股票。

    可以看到,百度在AI方面的布局已經相對完善,無論是從AI部門的設置、集團戰略定位,還是從開放的各類技術平臺,均能夠幫助百度更快地構建生態圈,以此帶來更多場景應用的落地。

    AI平臺開放、百度生態建設延伸至端

    百度AI平臺以百度智能云為基礎、百度大腦為核心,目前開放DuerOS和Apollo兩大平臺向終端下沉,與云端一起初步構建起AI生態圈。同時,深度學習開放平臺PaddlePaddle具備易用、高效、靈活和可伸縮等特點,使程序員可以快速應用深度學習模型來解決各種實際問題,加快實驗室技術在各類場景的應用落地,促進百度AI生態的擴散。

    百度人工智能詳細分析

    圖表4:百度AI平臺與生態構建

    百度AI平臺的開源有助于百度吸引更多優秀的開發者參與進來,在幫助完善AI平臺功能的同時,培養用戶的使用習慣,構建起開發者生態。此外,還可以通過開發者使實驗室技術更快地在具體場景落地。百度可憑借開放的平臺尋找到更多的合作者,構建起合作伙伴生態,共同推出行業解決方案和生態合作方案。

    DuerOS:開放的對話式人工智能系統

    百度在2017CES上推出了DuerOS。此外,百度還發布了DuerOS智慧芯片,具有:“三低、三高”的特點—低成本、低門檻、低消耗、高安全、高集成、高附加。這款DuerOS智慧芯片已將DuerOS與紫光展銳RDA5981完美集成;還采用了ARM公司mbed OS內核及其安全網絡協議棧,實現了與云端的安全連接,降低了設備商應用開發門檻。

    7月15日,在Baidu Create 2017上,度秘事業部總經理景鯤發布了DuerOS開放平臺。該平臺以DuerOS對話系統為核心層,應用層為智能設備開放平臺,能力層為技能開放平臺。其中技能開放平臺目前已經擁有10大品類、100多項原生技能且支持第三方資源和內容接入。作為中國版Alexa,未來百度將以DuerOS為切入點,進一步推動集團人工智能生態的構建。

    百度人工智能詳細分析

    圖表5:DuerOS開放平臺整體架構

    【參考資料:Alexa】

    Alexa是Amazon推出的一款語音助手,可以對語音指令進行處理并做出語音回復或執行相應操作,截止2017年6月底,Alexa語音助手已擁有超過1.5萬項技能,比官方2月份公布的1萬多項增長了一半多。

    百度人工智能詳細分析

    圖表6:語音助手技能數量(單位:項)

    目前Alexa主要應用于智能音箱、智能家居、可穿戴設備、購物助手等。亞馬遜允許設備制造商通過使用Alexa語音服務(AVS)將Alexa不斷增長的語音功能集成到自己的連接產品中。該語音服務(AVS)是一種云服務,提供基于云的自動語音識別(ASR)和自然語言理解(NLP)。

    Alexa的語音識別系統框架主要包括四大塊:信號處理(Signal processing)、聲學模型(Acoustic model)、解碼器(Decoder)和后處理(Post processing)。

    首先將收集來的聲音進行一些信號處理,將語音信號轉化到頻域,每10毫秒的語音生成一個特征向量,發送到后面的聲學模型。聲學模型把音頻分成不同的音素。接下來解碼器可以解出概率最高的詞串。最后一步是后處理,把單詞組合成易讀取的文本。

    百度人工智能詳細分析

    圖表7:Alexa語音識別步驟

    其中,聲學模型就是一個分類器,輸入的是向量,輸出的是音頻類別對應的概率。該模型是一個典型的神經網絡,底部是輸入的信息,隱藏層將向量轉化到最后一層里的音素概率。

    一個美式英語的Alexa語音識別系統,會輸出美式英語的音素。以美式英語為基礎的Echo,錄了幾千小時的美式英語語音來訓練神經網絡模型,這個成本非常高。但是,世界上還有很多其它的語言,比如德語,如果再從頭用幾千小時的德語語音訓練,成本太高。所以,這個神經網絡模型有趣的地方就是可以“遷移學習”,它可以保持原有模型中其它層不變,只把最后一層換成德語。兩種不同的語言,音素大部分是不一樣的,但是仍然有不少相同的部分。因此,僅使用少量的德語語音數據,就可以在稍作改變的模型上得到較準確的德語結果。

    現在,DuerOS可以將搭載Alexa的智能音箱變成能聽懂中文。未來,百度將把DuerOS打造成AI時代的“安卓”,為AI開發者鋪墊好技術基礎,幫助其更方便快捷地開發智能語音交互設備,從而打造以DuerOS為入口的智能語音生態鏈。

    Apollo:自動駕駛開放平臺

    百度AI的核心突破口當屬自動駕駛,首先是成立智能駕駛事業群組(IDG)。緊接著于今年4月在上海車展上發布了“Apollo”計劃,向汽車行業及自動駕駛領域的合作伙伴提供開放的、完整的、安全的軟件平臺,幫助他們快速搭建一套屬于自己的自動駕駛系統。Apollo開放平臺的發布標志著百度在人工智能的系統級開放進程更進一步,這也是全球范圍內自動駕駛技術的第一次系統級開放。百度將致力于將Apollo打造成汽車工業時代的安卓,但是比安卓更開放、能量更大。

    7月5日百度AI開發者大會上,百度首次對外公布Apollo詳細的路線圖、技術框架以及首期開放Apollo 1.0的能力。會上,百度宣布Apollo生態合作伙伴聯盟規模超50家,目前Apollo生態合作伙伴聯盟已輻射OEM、Tier1、地圖公司、芯片公司、基金投資、個人開發者、創業公司、研究機構及政府機構等,成為全球最強大的自動駕駛生態。

    Apollo將提供一套完整的軟硬件和服務系統,包括車輛平臺、硬件平臺、軟件平臺、云端數據服務等四大部分。此外,百度還將開放環境感知、路徑規劃、車輛控制、車載操作系統等功能的代碼或能力,并且提供完整的開發測試工具。并且,百度還會在車輛和傳感器等領域選擇協同度和兼容性最好的合作伙伴,推薦給接入Apollo開放平臺的第三方合作伙伴使用,進一步降低自動駕駛的研發門檻。

    Apollo核心技術的總體技術框架由4個部分組成:

    • Apollo的開放的軟件平臺,核心有四個模塊:

      • (1)自定位模塊,百度具備業界領先的高精地圖與傳感器的能力融合,能夠為每一個車輛提供低成本、全天候的精準定位。

      • (2)感知模塊,感知是自動駕駛工業當前的創新重點,百度的感知模塊將多個傳感器組合在一起,通過人工智能技術,使每一輛車都能看清、看懂路況,看到每一個行人、每一個車輛、每一個障礙物。

      • (3)車輛規劃控制,使用AI+大數據以及最安全的駕駛策略,可以精準控制每一輛車,同時可以適合各個不同的路況。

      • (4)底層的運行框架,核心是安全性、可靠性和實時控制,能支持Intel和NVIDIA不同的芯片。

    • Apollo的服務平臺:

      • (1)高精地圖服務,是自動駕駛的基礎。

      • (2)仿真引擎,快速累積海量的數據,能夠使開發者日行百萬公里。

      • (3)安全服務。百度將為開發者提供持續、高度安全的服務。

      • (4)DuerOS,為每一輛提供智能化車內體驗。參考硬件平臺和參考車輛平臺,能支持各種各樣的不同的計算硬件,從CPU到GPU到FPGA。同時還支持各種不同的傳感器,從GPS到IMU到攝像頭、激光雷達、雷達等等。通過將各個模塊的融合,Apollo為每一個開發者提供了從零到一的能力進入自動駕駛研發。

    百度人工智能詳細分析

    圖表8:2017年7月發布的Apollo路線圖

    百度人工智能詳細分析

    圖表9:Apollo平臺開放情況(紫色為Apollo1.0開放部分,紅色部分為Apollo1.5開放部分)

    2017年9月20日,百度宣布Apollo1.5正式開放,包含障礙物感知、決策規劃、云端仿真、高精地圖服務、端到端的深度學習(End-to-End)等五大核心開放能力,并支持晝夜定車道自動駕駛。其中,原本計劃于年底開放的端到端的深度學習(End-to-End)在9月20日宣布提前開放。

    能力一:障礙物感知

    感知模塊的目標是在給定從激光雷達傳感器獲得的三維點云數據后提供感知障礙的能力。它能檢測、分段和跟蹤以高精度地圖ROI方式定義的障礙。此外,它預測障礙物的運動和姿態信息(如航向、速度等)。核心的3D感知模塊是基于大規模點云數據訓練的深度卷積神經網絡(CNN)的障礙物檢測和分割算法,包括高精地圖ROI過濾、基于CNN的障礙物檢測與分割、MinBox障礙物框構建和HM物體跟蹤。

    圖表10:3D感知模塊的組成部分

    模塊子模塊描述
    感知核心模塊高精地圖ROI過濾高精地圖ROI過濾算法根據地圖定義的ROI,對其外部的點云進行過濾。它的主要目標在于過濾掉一些無人車不關注的背景物體(例如道路周圍的建筑物、樹木等),以便讓后續算法只關注道路上的障礙物。
    基于CNN的障礙物檢測與分割經過高精地圖ROI過濾后,不在ROI區域內的背景障礙物(比如建筑物,樹木等)已去除。因此,對ROI內部(比如可行駛道路和交叉口)的點云進行物體檢測和分割,從而得到前景障礙物例如小轎車、卡車、自行車、行人等。該算法基于全卷積深度神經網絡學習點云特征并預測障礙物的相關屬性,并根據這些屬性建構鄰接圖進行基于連通片分析的障礙物分割。該算法將先進的深度學習技術引入到點云障礙物檢測領域,能夠從大量數據中學習有效特征進行障礙物的檢測與分割,其分割精度遠遠優于傳統方法。
    MinBox障礙物框構建MinBox障礙物框構建3D框構架算法為檢測和分割出的障礙物建立相應的邊界框。由于遮擋和離LiDar距離較遠問題等問題,障礙物的點云可能非常稀疏或者只覆蓋某一部分。inBox障礙物框算法能夠根據檢測到的障礙物點構建出最符合其朝向的邊界框。
    HM物體跟蹤HM目標物體算法用于跟蹤ROI中檢測和分割得到的障礙物。該算法將當前幀檢測到的障礙物與之前跟蹤到的物體進行關聯、刪除老的跟蹤物體、生成新的跟蹤物體,形成最終的跟蹤表輸出,并預測障礙物的位置,速度和朝向等信息

    止目前Apollo已有70多家合作伙伴。新增合作伙伴包括OEM主機廠、Tier1供應商、開發者生態公司。同時百度宣布Apollo基金“雙百計劃”,將在三年內投入100億資金,完成超過100家項目的投資,未來將進一步壯大Apollo平臺的生態聯盟。

    能力二:決策規劃

    決策規劃模塊根據實時路況、感知模塊輸出的信息、道路限速等信息做出相應的軌跡預測和智能規劃,同時兼顧安全性和舒適性,提高行駛效率。決策規劃模塊主要由障礙物檢測、路徑規劃、選擇與控制三部分組成。

    圖表11:決策規劃模塊的組成部分

    模塊子模塊描述
    決策規劃模塊障礙物預測將位置模塊得到的定位信息(車輛的位置、速度與加速度)與感知核心模塊中得到的障礙物信息(如位置、方向、速度、加速度)結合,預測障礙物之后一系列可能的運動方式(如速度和路徑)及各種運動方式對應的概率。目前預測方式有三種:路徑預測、自由(隨機)移動預測、障礙物運動區域預測。
    路徑規劃基于定位信息、感知核心模塊提供的障礙物信息、對障礙物運動的預測,同時考慮安全與舒適度,計算出車輛運行的無障礙路徑。
    選擇與控制根據當前車輛的狀態、規劃功能給出的路徑以及車上人員發出的指令,運用不同控制算法生成指令(如轉向、減速、剎車)并傳遞給汽車。

    能力三:高精度地圖

    高精度地圖與普通電子地圖的主要區別是高精度地圖擁有更精確的車輛位置信息和更豐富的道路元素數據信息,起到構建類似于人腦對于空間的整體記憶與認知的功能,可以幫助汽車預知路面復雜信息,如坡度、曲率、航向等,更好地規避潛在的風險。是實現自動駕駛的關鍵所在。此外,高精度地圖還起到了車輛間共享路況信息、識別交通標志的作用。

    能力四:云端仿真

    其中開放云端仿真功能作用極為重要,在正常的產品開發過程中,良好的仿真測試環境將方便產品開發者在模擬環境中快速測試產品的性能、可靠性等,加快產品的迭代測試周期從而提高產品測試效率:

    圖表12:云端仿真功能的作用

    開放內容功能模塊功能子模塊描述
    開放功能內置高精地圖的仿真場景基于不同的路型,基于不同的障礙物類型,基于不同的道路規劃,基于不同的紅綠燈信號。
    場景上傳調試支持同時多場景的高速運行,支持單算法模塊的上傳運行,支持系統整套算法和運行環境的上傳與運行。
    智能場景通過判別系統本期開放5個判別標準:碰撞檢測,闖紅燈檢測,限速檢測,在路檢測,到達目的地檢測
    3D展示功能提供實時路況,算法模塊輸出的可視化信息,以及無人車本身狀態的全局信息。
    開放能力核心能力智能陪練該功能可以讓自動駕駛路測更安全。
    真實場景重建和多算法認證在真實交通流復現的基礎上,支持感知、規劃、控制多算法模塊驗證,讓自動駕駛算法驗證更為嚴謹。
    日行百萬提供不間斷的仿真測試,通過多次快速迭代來自動優化算法結果,讓自動駕駛技術的發展更高效。
    解決方案發現問題允許開發者定義和選擇各類評判打分標準,在云端仿真器中運行場景并發現問題。
    解決問題查問題場景反映出的現象,進而改進或替換系統里的相應模塊,再次運行場景,直到問題解決。
    驗證問題可自動拉取核心場景資源,針對測試中產生的問題,快速驗證新算法,并支持單步調試與驗證。此外,還提供不間斷的仿真測試,通過多次快速迭代來自動優化算法結果,做到研發全流程支持。

    能力五:端到端

    按照2017年7月百度發布的規劃,端到端深度學習能力比原定的2017年12月提前了3個月,開放速度有所加快。本次開放的障礙物感知和決策規劃能力使車輛能夠實現不分晝夜的精準障礙物識別,并能通過深度神經網絡精準預測行駛路徑,從而做出最終的駕駛決策。

    百度IDG部門的郁浩在百度技術沙龍上的演講中提到,和Apollo中端到端學習相對的是傳統無人駕駛項目中主要使用的規則式系統,這是過去二十多年無人駕駛研究的主流方向。規則式系統從車輛開始是一個閉環:從車輛到車上的傳感器,獲取輸入信息,這些信息經過感知層處理,提取出道路、行人和車輛等各種信息。在感知到的信息的基礎之上,再加入高精地圖等一些靜態信息,把動態信息和靜態信息結合到一起形成較完備的世界模型(World Model)——對外部環境的完備描述。在此基礎之上就可以進入到決策模塊產生決策,然后控制模塊把決策信號傳遞給車輛。

    百度人工智能詳細分析

    圖表13:規則式系統

    上圖是一個很簡單的閉環模式,也有很多人提出了相關的或類似的架構,比如國際汽車工程師學會(SAE)在上邊閉環的基礎上,更細化分成大環、小環和各個模塊之間的關系。

    百度人工智能詳細分析

    圖表14:國際汽車工程師學會(SAE)推薦的系統架構圖

    為了使規則式系統能夠滿足自動駕駛的需要,需要不斷細化、得到更復雜的功能模塊圖,真正系統落地時往往有上千個模塊。因此規則式系統有3個特點:

    • 系統十分復雜,需要人工設計上千個模塊;

    • 高精地圖成本很高:規則式系統對外界有很大依賴,高精地圖精度要到厘米級。這也帶來需要及時更新等問題;

    • 對車載硬件計算能力要求很高,規則式系統中每一個模塊都有相應的深度學習應用,部署在車上的每個模塊都對計算資源需求很高,車上可能需要運行幾個,甚至十幾個深度學習網絡。

    簡單地歸納一下,與規則式系統相比,端到端學習更像是在模擬、貼合人的思考過程,包括人的下意識思考。相對規則式系統而言,端到端學習成本更低,但需要大量優質數據來讓機器進行學習、篩選各種情況下有效的路徑。

    百度人工智能詳細分析

    圖表15:Rule based與End-to-End比較

    端到端的已有案例

    Apollo1.5的合作者Momenta基于定車道晝夜自動駕駛能力,很快完成了實車驗證。實際道路測試表明,搭載了Apollo1.5的平臺即使在夜間可視度不佳的情形下,依舊能完成各種復雜的交通場景識別。

    另一個合作伙伴智行者科技在Apollo平臺上打造的無人駕駛掃路車,目前已經在北京一家園區正式落地,開創了Apollo自動駕駛作業車的先例。2017 CES Asia展會上,百度聯合長城汽車、NVIDIA,在哈弗H7展示了基于單目攝像頭+百度深度學習技術的端到端自動駕駛解決方案,進行了公開試乘。

    百度人工智能詳細分析

    圖表16:封閉園區的固定路線的接駁

    Apollo平臺目標實現生態,開源廣納合作者參與

    自Apollo1.0發布2個多月后,其在知名開源平臺Github上已經聚集了6000多的開發者,位居開源平臺前列。Apollo GitHub將自己定義為一個開放的、完整的、安全的自動駕駛平臺,以靈活和高性能的技術架構,為全自動駕駛提供支持。

    Apollo開源代碼資源可以分為三部分,分別是apollo、apollo-platform、apollo-kernel。

    第一部分,apollo該部分有入門文檔,介紹了Apollo的基本信息。modules文件夾中是各個模塊(如感知模塊perception,預測模塊prediction,端到端e2e)的開源內容。還有一些其他文件夾:docker沙箱,scripts腳本,third_party第三方開源代碼,tools工具。說明文檔推薦使用已經設置好的沙箱模式。

    第二部分,apollo-platform該部分內容用來提供平臺支持,目前主要是一套經過修改的ROS(機器人操作系統)。

    第三部分apollo-kernel,該部分內容用來提供核心支持,目前Apollo核心使用的是修改過的Linux Kernel 4.4.32。

    Apollo生態鏈及標的公司

    無人駕駛快速落地,行業生態起到了關鍵性作用,對比手機的Android系統來看,在Android系統2009年面世之前,各個手機廠家都有自己的操作系統,而在Android系統出來后,短短幾年內,各大手機廠商操作系統都統一在開源的Android系統之下(蘋果公司的IOS除外),而沒有跟上這個趨勢的廠商(如諾基亞、摩托羅拉等)很快就銷聲匿跡了。現在Apollo平臺,正如Android系統初生之時,在國內有一統平臺的潛質,Apollo目前已經擁有70多家合作伙伴,已有多家合作伙伴采用公司的平臺進行產品研發,未來前景良好。因此,如果關注A股上市公司,建議投資者重點關注參與到Apollo產業鏈的公司,尤其是那些細分行業的龍頭,具有良好的爆發性機會。

    圖表17:Apollo合作伙伴分類

    分類合作伙伴當前及潛在合作機會
    高校(5家)北京航空航天大學、北京理工大學、清華大學、上海交通大學、同濟大學前沿技術探索及研發合作等
    政府相關(5家)北京亦莊等場地支持及政策支持等。如在北京亦莊示范區封閉試驗場預計將于2017年底建成并對外提供服務,其一期建設內容為占地面積600畝的模擬特大城市交通場景的智能網聯汽車測試基地,將容納國內外各類車型進行研發試驗與測試。
    汽車制造商(19家)北京汽車、北汽新能源等在智能汽車的多領域進行合作,重點在于Apollo平臺在各個汽車廠的汽車產品上的落地,這需要車廠提供相關的接口和研發支持。如何北京汽車的合作內容包括在智能汽車、車聯網、L3級智能駕駛、高精度地圖及車載地圖、聯合品牌運營等領域展開合作等。

    分類合作伙伴當前及潛在合作機會
    汽車租賃、打車企業一嗨租車、首汽租車等智能駕駛汽車的終端用戶
    自動駕駛相關企業AutonomouStuff利用Apollo開放能力改裝自動駕駛車
    地平線機器人基于車機或自動駕駛系統合作
    路暢科技
    MOMENTA
    VIRES
    智行者科技合作的無人駕駛掃路機已投放
    芯片供應商英特爾提供自動駕駛相關芯片
    紫光展銳
    英偉達
    軟件及解決方案供應商微軟基于自動駕駛相關系統軟件及解決方案合作
    中科創達
    博世
    車聯網企業博泰合作提供更為安全、便捷、經濟的智能駕駛方案
    同行者
    遠特科技
    通訊供應商中興通訊綜合通信解決方案提供商
    IT學習、社區極客幫技術學習、交流服務
    優達學城
    CSDN

    Apollo保持著每周數十次頻率的代碼更新,從2017年7月到9月兩個多月時間新增6.5萬行代碼。同時,Apollo獲得全球開發者的積極響應。截止2017年9月20日,共有1300多個合作伙伴下載使用了Apollo開源代碼,近百個合作伙伴通過Apollo官網申請開放數據。上線當月,在全球最大的開源社區Github的全球C++類項目中排名第一,6000多個開發者推薦使用Apollo開源軟件。

    PaddlePaddle:深度學習開放平臺

    PaddlePaddle前身是百度于2013年自主研發的深度學習平臺,一直為百度內部工程師研發使用。2016年9月,百度宣布其深度學習平臺PaddlePaddle在開源社區Github及百度大腦平臺開放。2017年年初,PaddlePaddle可在Google開源的Docker容器集群管理系統Kubernetes運行,并成為目前唯一官方支持Kubernetes的深度學習框架,兩個開源項目的結合意味著深度學習對于廣大開發者正變得“觸手可及”。

    PaddlePaddle具備5大優勢:

    • 靈活:PaddlePaddle支持大量的神經網絡架構和優化算法,支持任意復雜RNNs結構。

    • 高效:PaddlePaddle會每一級的計算、內存、架構及通信進行優化,以充分利用異構計算資源。

    • 可擴展:PaddlePaddle能通過優化通信,獲得高吞吐量和性能。

    • 易用:Paddlepaddle可以使開發者更加專注于模型的高層結構。

    • 可快速部署:由于PaddlePaddle簡單、可擴展的特性,因此可被快速部署到各類應用場景中。

    百度人工智能詳細分析

    圖表18:幾類深度學習平臺的比較

    • TensorFlow:大部分功能可以通過從庫里直接調取代碼實現,不需要手動編程。內存占用較大,且不支持時間序列的卷積。

    • Theano:相較于深度學習,其更適合數值計算優化。它允許自動功能梯度計算。但目前不具備多GPU支持和水平功能。

    • Caffe:注重計算機視覺,靈活性不夠,安裝過程較繁瑣。如果有新的改動,需要使用C++和CUDA進行編程;對于較小的改動,可以使用其Python或Matlab來完成。

    • Torch:是一個很好的平臺,但是開發語言Lua較小眾,學習成本大。實現并且優化了基本的計算單元,使用者可以在此基礎上編寫自己的算法。

    • MXNet:支持Python、R、C++等多種語言,特別受R語言使用者的歡迎,并且有獨特的多GPU擴展功能。

    • PaddlePaddle:使用界面類似于Caffe,并且較好地支持RNN與NLP以及多CPU/GPU并行計算。相較于較TensorFlow,PaddlePaddle能幫助開發者聚焦于構建深度學習模型;相較Caffe,PaddlePaddle支持更多應用場景。

    百度人工智能詳細分析

    圖表19:Paddle與TensorFlow在RNN下的表現

    目前,PaddlePaddle已經被應用于百度的30多個主要產品,如外賣菜品識別、預估出餐時間、海量圖像識別分類、字符識別(OCR)、機器翻譯和自動駕駛等領域。

    百度“能聽會看”作為觸手、帶動技術領域的商業化落地

    從“能聽”走向“能聽懂”的學習之路

    1、百度以語音識別為切入點,構建人工智能生態圈。

    2017年,百度語音開放生態2.0。目前,百度語音開放生態已經構建起包括模型層、功能層、交互層、接入層的四層開放架構,已有近25萬開發者納入生態圈,日調用總數達20億次。在開放生態2.0中,百度將開放遠場識別及喚醒技術、定制化語音合成、語音合成音色等技術:

    • 遠場語音識別及喚醒技術:百度通過數據增強技術,復用百度積累的海量搜索語音數據和世界領先的語音模型識別,將近場語音技術完整遷移到遠場。此外還適配包括Intel、科大訊飛、科勝訊在內的主流麥克風陳列。同時對家居場景進行定向噪聲優化;

    • 定制化語音合成技術:包括定制化文本轉語音技術、語音合成標注語言標簽語言、基礎標簽及百度擴展內容;

    • 開放音色合成:包括自然音色和個性化及明星合成音色;

    百度人工智能詳細分析

    圖表20:語音技術開放現狀

    目前,百度已與聯想、中興、長虹、索尼、iReader、攜程、特斯拉等品牌合作,構建包含模型層、功能層、交互層、接入層的語音開放架構。

    語音識別的目標是以電腦自動將人類的語音內容轉換為相應的文字,其應用包括語音撥號、語音導航、室內設備控制、語音文檔檢索、簡單的聽寫數據錄入等。

    直到第三次人工智能熱潮來臨,深度學習的崛起、高性能計算和大數據的迅速發展才使語音識別從實驗室走出并開始實現商業落地。近年來語音識別準確率得到了極大的提升。2016年11月,搜狗、百度、科大訊飛相繼宣布其中文語音識別率達到了97%。

    百度人工智能詳細分析

    圖表21:語音識別錯誤率在近幾年得到了極大降低

    語音識別作為人工智能核心技術之一,目前各科技巨頭都將其作為切入點,積極布局人工智能。在智能語音領域方面的布局,科技巨頭和初創公司的打法有所差異,具體表現為:

    • 科技巨頭:圍繞主業,開放應用平臺,同時通過收購、戰略合作等手段補齊短板,打造人工智能生態圈;

    • 智能語音成熟公司:基于原有技術優勢,從單一技術廠商向人工智能產業生態構建者進軍;

    • 其他創業公司:深耕細分領域,重點布局家居、車載、機器人。

    2、自然語言處理技術賦予機器認知能力

    人類語言與計算機之間相互作用的研究領域稱為自然語言處理(簡稱NLP)。它結合了計算機科學、人工智能和計算語言學。開發人員利用NLP可以組織和構建知識,執行自動總結、翻譯、命名實體識別、關系提取、情感分析、語音識別和主題分割等任務。目前,中國在自然語言處理領域的專利數量占比僅次于美國。

    自百度誕生之日起,中文分詞這種的基礎NLP技術便已經應用于搜索引擎。自然語言處理專家王海峰博士加入百度后對百度NLP工作進行了重新梳理。在加強分詞、專名識別、query需求分析、query改寫等傳統方向的同時還拓展了機器翻譯、機器學習、語義搜索、語義理解、智能交互、深度問答、篇章理解等新的技術方向。在他的帶領下,NLP團隊已經包括了算法開發、系統實現、學術研究、語言學、產品設計和架構、前端、客戶端工程開發等多領域的人才,全面支持百度各種產品應用。

    百度人工智能詳細分析

    圖表22:百度自然語言處理技術概要

    歷經17年的積累,2013年百度首次開發了NLP Cloud平臺,擁有20多種NLP模塊,每天的請求數超1000億次,每日流量達數十億次,已為超2萬個企業和開發者提供百度翻譯API,應用于百度搜索、Feed、O2O和廣告等業務與產品方向。此外,百度還提供語音翻譯及利用字符識別技術進行的圖片內容翻譯。

    在Baidu Create 2017上,百度開放了基于百度自然語言處理技術的理解與交互技術平臺UNIT(Understanding and Interaction Technology Platform),包括詞法分析、情感分析、機器翻譯、語義表示、語言模型、語義相似度等技術,為機器賦予“理解”能力。

    百度人工智能詳細分析

    圖表23:UNIT整體框架

    UNIT基于百度海量的搜索數據、問答數據、網頁數據等為對話系統的開發提供大數據保障,為每個不同的對話任務智能推薦相關數據,以供進一步的訓練數據標注。并首次推出理解與交互“對話訓練師”模式讓普通開發者乃至零編程基礎的人都能成為訓練師。對話系統通過與訓練師對話便可不斷完善系統功能、提升對話能力。目前,UNIT已經應用于車載、客服、家居等場景。

    百度人工智能詳細分析

    圖表24:訓練師模式

    全方位視頻理解技術使機器不僅“會看”,還會理解

    在Baidu Create 2017上,百度發布了全方位視頻理解技術,包括視頻分割技術、語義理解、人臉識別及機器人視覺等。

    • 視頻分割技術是無人駕駛/機器人的核心技術,對數據和精度要求很高,需要像素級別的輸出信息和更多的視頻訓練數據。目前百度具有世界第一個室外語義分割RGBD視頻數據集。

    • 語義理解技術包括視頻封面選摘技術、視頻分類/標簽技術、視頻智能對比技術、視頻審核色情識別技術、視頻公眾人物識別技術、視頻結構化分析技術,并將上線視頻細粒度識別技術。

    • 人臉識別:百度已經運用200萬人的2億張照片進行人臉識別基礎模型訓練,實現人臉檢測、人臉對比及人臉查找,并已應用于百度魔圖、百度網盤、百度識圖等產品中。此外,百度人臉識別還具備活體識別功能。

    • 機器人視覺開放平臺由攝像機IMU模組、SLAM、障礙物檢測、地圖重建、語義識別5大部分構成且已開源。其中,SLAM采用雙目視覺慣性算法,定位結果延遲小誤差低;云端API提供人臉識別、物體檢測和字符識別功能。

    計算機視覺是最主要的人工智能基礎技術之一,主要包括信息采集、模型訓練及識別。目前,計算機視覺在圖像識別和人臉識別兩大領域的準確率都已經超過人類極限。計算機視覺技術主要包括圖像及視頻處理、人臉識別、文字識別、智能監控等,其中人臉識別已經廣泛應用于安防、公安、金融等行業。在計算機視覺領域,我國與國外的差距較小。2014年3月,香港中文大學湯曉鷗教授團隊的GaussianFace算法在人臉識別數據庫LFW上準確率達98.52%,在全球首次突破人眼識別能力。目前,中國在計算機視覺方面的專利已躍居世界第一,占當前全球專利公開數量的55%,并且增長勢頭強勁。

    百度人工智能詳細分析

    圖表25:計算機視覺專利數量分布(單位:%)

    今年1月,百度研究院成立AR實驗室,同時推出AR開放平臺DuMix供開發者及內容創作者使用。在Baidu Create 2017上,百度發布全新DuMix AR開放平臺,提供基礎的AR技術,包括AR SDK、內容制作工具、云端內容平臺和內容分發服務4大部分:

    • Dumix AR SDK:支持本地識別跟蹤、語音交互、SLAM等20多項功能,幫助移動APP集成AR。

    • 內容制作工具:開發者可以使用素材模版庫和制作工具開發AR內容,也可以使用百度認證的內容供應商體系,快速為開發者提供全面專業的內容制作服務。

    • 云端內容管理平臺:通過云平臺方式,提供內容管理、更新,渠道管理,數據統計等多種內容管理服務;

    • 內容分發服務:百度還會在手機百度APP、搜索/Feed等百度系入口上提供優質AR體驗的分發服務,通過Dumix AR制作和接入的AR,將可以觸達百度的億級用戶。

    百度人工智能詳細分析

    圖表26:DuMix AR的能力特點和技術優勢

    未來,DuMix AR開放平臺將通過打通手機百度上內容分發渠道,提供更多場景的AR行業解決方案,賦能各行各業,共同探索AR價值。

    總結:人工智能仍在探索階段,各家技術方向并不完全趨同,又涉及整個產業鏈的融合能力,因此,最終落地形態和成熟的商業場景存在較大的不確定性。

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 午夜高清福利在线观看| 国产成人综合95精品视频| 2019亚洲午夜无码天堂 | 亚洲天堂在线观看完整版| 久久99热只有频精品8| 国产日韩一区二区四季| 成年女人片免费视频播放A| 黄色A级国产免费大片视频| 无码激情亚洲一区| 欧美国产日产一区二区| 无码一区二区三区中文字幕 | 午夜精品久久久久成人| 日韩欧国产精品一区综合无码| 成人AV无码一区二区三区| 国产一区二区不卡91| 人妻系列无码专区69影院| 高清无码一区二区在线观看| 精品国产一区二区三区2021| 亚洲国产成人影院播放| 国产尤物精品自在拍视频首页| 国产在线超清日本一本| 国产猛男猛女超爽免费视频| 国产午夜福利在线视频| 粗大挺进朋友人妻淑娟| 国产高清不卡一区二区| 天天澡日日澡狠狠欧美老妇| 国产卡一卡二卡三精品| 亚洲欧洲精品一区二区| 亚洲毛片不卡AV在线播放一区| 亚洲更新最快无码视频| 久久亚洲精品情侣| 男女性杂交内射女bbwxz| 四虎影视永久无码精品| 欧美大胆老熟妇乱子伦视频 | 真人无码作爱免费视频| 亚洲欧美日韩在线码| 亚洲国产欧美一区二区好看电影| 最爽无遮挡行房视频| 依依成人精品视频在线观看| 日本熟妇XXXX潮喷视频| 亚洲精品人成网线在播放VA|