今天主要給大家做一個關(guān)于人工智能的歷史和發(fā)展現(xiàn)狀的分享。人工智能可能對絕大多數(shù)同學(xué)來說比較陌生,所以我會盡可能地做到通俗易懂。 (一)達特茅斯會議 人工智能的英文叫做“Artificial Intelligence”,這個名詞的提出可以追溯到1955年,在具有歷史意義的達特茅斯會議(在達特茅斯大學(xué)舉辦)上由青年教師John McCarthy聯(lián)合其他四位專家提出的。 1955年,第一臺通用計算機ENIAC剛剛問世九年時間(1946年)。可以看到,在這一年,達特茅斯學(xué)院的老師在思考“人工智能”概念的前瞻性,讓人驚嘆。也就是說,他們在思考剛剛被造出來的這個27噸的龐然大物,究竟能在多大程度上能夠改變我們的生活,能夠替代甚至超越人所能做到的智能的事情。 1946年造成的世界上第一臺計算機ENIAC。這臺機器占地180平米,用了18,000個真空管,重量近50噸。 實際上,1955年這個會議提出的proposal是舉辦十個人參與,歷時兩個月的小型閉門會議。因為學(xué)校有兩個月的暑假,希望對“Artificial Intelligence”這個概念做一個比較深入的討論。 1955年的達特茅斯之夏:人工智能發(fā)展史上里程碑式的會議紀(jì)要 和很多大而空的會議不同,麥卡錫在proposal中列舉了7個具體希望討論解決的問題:如邏輯推斷與語言的關(guān)系,隨機性和創(chuàng)造性的關(guān)系等。他希望這十個專家經(jīng)過兩個月的閉門會議的討論后,可以解決其中的一到兩個問題。
后見之明來看,希望能夠在兩個月時間完整解決哪怕是任何一個問題都是樂觀的。在2016年的今天,很多當(dāng)年所提出的問題仍然在不斷被研究者探索。 (二)奇人麥卡錫 麥卡錫的才華,在其童年時代就得以彰顯。上高中時,他就開始自學(xué)加州理工(Caltech)的數(shù)學(xué)課程,所以后來他正式進入加州理工大學(xué)學(xué)習(xí)時直接跳過了前兩年的課程。可惜由于他的體育課程沒有達到成績,最終也花了約5年的時間才畢業(yè)。完成普林斯頓大學(xué)的博士學(xué)習(xí)之后,正式加入達特茅斯大學(xué)成為一名老師,其后加入麻省理工學(xué)院(MIT)。 當(dāng)麥卡錫提出“人工智能”這個概念及相關(guān)思考的時候年方二八。 我有個有意思的觀察:青年教師,與功成名就的學(xué)者(established researcher)有很大的區(qū)別。大家可能知道,美國當(dāng)老師是終身制(tenure track)的,也就是說,當(dāng)學(xué)校在聘任一個老師大概在第六年或第七年的時候,若他們認(rèn)為這個老師是一個合格的老師的話,沒有特別的理由,學(xué)校是不能開除這個老師的。這樣的制度對于保證老師的學(xué)術(shù)獨立很有意義。 成為終身教師并不容易,各學(xué)校會有其嚴(yán)格的考核來驗證一個教師是否定達到了相應(yīng)的學(xué)術(shù)標(biāo)準(zhǔn),包括老師每年發(fā)表論文,提出的proposal等。像MIT這一類的大學(xué),他們對自己教師的篩選是非常嚴(yán)格的。不過,這樣的制度并非無懈可擊。為了得到終身職位,有不少年輕老師在自己研究生涯的前五六年會以一種超負(fù)荷的形式在思考研究,發(fā)文著書。但一旦目標(biāo)達成,塵埃落定,他的研究心態(tài)就會發(fā)生很大變化,失去了原有的沖勁和動力。我自己喜歡的一個MIT教授就有這樣的情況。 我們國家衡量老師,喜歡用“教授”“博導(dǎo)”“院士”這樣的頭銜去衡量其能力。實際情況可能恰恰相反,做出最優(yōu)創(chuàng)建型的貢獻的人的年齡往往不是特別高,多集中于二三十歲的年紀(jì)。如果大家選擇導(dǎo)師,不要太在意其頭銜,要更多了解其研究能力。 (三)黃金十年 談回人工智能,達特茅斯會議與會的十個研究者其實在人工智能領(lǐng)域做出了非常多的貢獻。麥卡錫本人也在1971年問鼎圖靈獎。1960年到1970年進入到人工智能研究的一個高峰期。一方面是美國政府包括NASA和美國國防部等對人工智能的研究給予了足夠多的資金和項目支持。 當(dāng)年的研究者有一個很樂觀的判定。他們當(dāng)時有一句話是說“machines will be capable, within twenty years, of doing any work aman can do”在二十年以內(nèi),他們希望造出來的計算機就已經(jīng)可以做到人所能做到的事情,就包括對圖片的理解,對音頻的識別,對自然語言的理解等問題。
回顧這段歷史,我們發(fā)現(xiàn)不要說五十年前,即便在2016年的今天,尤其是在這兩年,雖然AI取得了令人矚目的成果,但很多我們?nèi)四茏龅氖聶C器還是沒法完全替代。 (四)70后的失落 在經(jīng)歷60年代的一個相對比較過分樂觀時期后,從74年開始,人工智能不論在美國還是其他國家,都經(jīng)歷了一個funding cut的階段。包括美國國防部在內(nèi),投了很多錢后發(fā)現(xiàn),當(dāng)時樂觀的科學(xué)家所立項的機器翻譯,語音識別等項目,最終結(jié)果遠未到可用。舉例來講,機器翻譯概念在1940年代就已經(jīng)提出來了,逐步產(chǎn)生了一些研究工作和成績。但即便到今天的AI巨頭Google、百度所實現(xiàn)的英漢翻譯結(jié)果,還是不倫不類,離人工翻譯還有很大差距。 所以在1974年到往后的十年間,由于產(chǎn)出低于預(yù)期,人工智能的投入就有很大的減少,特別是政府投入。再后來日本提出第五代機器人的研究,又有了一些新的政府投入產(chǎn)生。整個AI的研究經(jīng)費多次起伏。所以說大家可以看到雖然現(xiàn)在AI有比較大的成功,在很多問題上取得突破性進展,本身的發(fā)展并不是一帆風(fēng)順的。 并且,在學(xué)術(shù)界拿funding也是有很多技巧與注意事項。比如人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeural Network)領(lǐng)域的研究,在90年代很難拿到資助和發(fā)表文章,但到2006年以后,隨著深度學(xué)習(xí)(Deep Learning)方法的崛起,目前各大AI相關(guān)會議雜志都被深度學(xué)習(xí)占去半壁江山。 可能有同學(xué)玩過我們的編詩姬,這個小程序是基于深度學(xué)習(xí)理論中特定的一類神經(jīng)網(wǎng)絡(luò),叫Recurrent Neural Network(RNN)所實現(xiàn)的。這個程序自己閱讀了全唐詩五萬首詩,學(xué)習(xí)相應(yīng)的一個語言模型,然后對于一個意象能逐字填出一首詩,而沒有建立任何人工的規(guī)則。有網(wǎng)友評價我們的編詩姬說對平仄的處理有些問題,有時沒有嚴(yán)格地按照韻腳來押韻。其實這也是我們在寫這個程序時刻意不去做的事情。因為我們希望程序在學(xué)習(xí)了幾萬手詩的樣本后可以自動地學(xué)習(xí)出詩歌的意象,對仗規(guī)則,標(biāo)點使用,押韻等。 如果大家對這個方面比較熟悉感興趣,在1月28日自然雜志nature剛剛發(fā)表了一篇Google DeepMind團隊的文章:基于深度神經(jīng)網(wǎng)絡(luò)做出來的圍棋程序,第一次打敗了人類的職業(yè)選手。這件事在整個科技界圍棋界,引起了軒然大波。 2015年1月《自然》雜志的封面文章 最近幾年,深度學(xué)習(xí)方法絡(luò)對于語音識別,圖片識別,自然語言處理,和類似圍棋的博弈游戲,都產(chǎn)生了很大的推動。 深度學(xué)習(xí)會作為人工智能的終極主算法(Master Algorithm)嗎?我認(rèn)為不是。相比于很多理論數(shù)學(xué)分支,AI還是一個很年輕的領(lǐng)域,在理論基礎(chǔ)和實際應(yīng)用上都還有大量空白等待填補。相信在未來的十年里,AI會滲透到大家生活的方方面面。 |
|