·GPT-4到來,更多生成式人工智能應用程序開發出來,開源和去中心化的努力將繼續增加,訓練大型語言模型的數據要開始耗盡了,歐盟通過人工智能法案,搜索革命,普通民眾將首次使用完全無人駕駛的汽車,為機器人技術建立基礎模型。 2022年人工智能(AI)的進展快到讓人喘不過氣來,可能當你剛剛弄懂最新情況時,一篇新論文或新發現又會使你的理解過時。 7月,一名叫Blake Lemoine的谷歌工程師認為谷歌的對話語言模型LaMDA是有意識的,它應該享有與人類平等的權利。當月DeepMind宣布,其AlphaFold模型預測了地球上幾乎每個具有測序基因組的生物體的幾乎所有已知蛋白質結構。 OpenAI的DALL·E 2,Stable AI和CompVis的Stable Diffusion把人工智能生成內容(AIGC)變成了科技界最火熱的縮寫詞。8月初,一位名叫Jason Allen的美國人在美術比賽中提交3張人工智能生成的圖像,其中一件作品獲得了數字藝術/數字攝影類別的最高獎項,引發了社交媒體上關于藝術本質以及成為藝術家意味著什么的激烈辯論。 ![]() 用DALL-E繪制的騎馬的宇航員。 到了年終,全世界為OpenAI的大型對話語言模型ChatGPT癲狂了。5天之內,超過100萬用戶注冊使用ChatGPT,讓它寫詩、寫代碼,聊人生。 在這一年飛速發展的基礎上,2023年的人工智能會有什么變化?監管是否會遏制住人工智能帶來的問題?強大、變革性的新形式人工智能是否會出現,就像ChatGPT一樣顛覆某個行業? GPT-4到來 GPT-4是OpenAI強大的生成語言模型的下一代產品,預計將在新年伊始發布,相對于GPT-3和3.5來說性能會有巨大的變化?;贕PT-3.5開發的ChatGPT足以讓世界瘋狂,但僅僅是GPT-4發布的前奏而已。 GPT-4會是什么樣子?也許不會比GPT-3大多少。在今年早些時候發表的一篇有影響力的研究論文中,DeepMind的研究人員確定,當今的大型語言模型實際上比它們應該有的規模要大,為了獲得最佳的模型性能(考慮到有限的計算預算),今天的模型應該有更少的參數,但在更大的數據集上訓練。換句話說,訓練數據勝過模型大小。 GPT-4有可能是多模態的:也就是說,除了文本之外,它將能夠處理圖像、視頻和其他數據模式。這將意味著,它可以將文本提示作為輸入并產生圖像,或者將視頻作為輸入并通過文本回答有關問題。 一個多模態的GPT-4將是一個重磅炸彈。然而,更有可能的是,GPT-4將是一個純文本的模型,在語言任務上的表現重新定義技術水平。具體而言,這將是什么樣子呢?GPT-4可能在兩個語言領域表現出驚人的飛躍,即記憶(保留和參考以前對話中的信息的能力)和總結(將大量文本提煉為基本元素的能力)。 更多生成式人工智能應用程序 隨著Prisma實驗室的人工智能自拍應用Lensa的走紅,我們可以期待很多類似的應用出現。 Mozilla基金會的高級政策研究員Maximilian Gahntz說,將生成式人工智能整合到消費者技術中會放大這種系統的影響,無論是好的還是壞的。例如,Stable Diffusion從互聯網上獲取了數十億張圖片,直到它“學會”將某些詞語和概念與某些圖像聯系起來,但文本生成模型常常很容易被欺騙,以支持攻擊性的觀點或產生誤導性的內容。 Knives and Paintbrushes開放研究小組的成員Mike Cook同意Gahntz的觀點,即生成式人工智能將繼續被證明是一種有問題的變革力量。但他認為,2023年是生成式人工智能“最終開始談錢”的一年。 “僅僅激勵一個專家群體(創造新技術)是不夠的。技術要想成為我們生活的長期組成部分,它必須讓某人賺大錢,或者對普通大眾的日常生活產生有意義的影響?!盋ook說,“所以我預測,我們將看到一個切實的推動力,使生成式人工智能真正實現這兩件事中的一件,并取得不同的成功?!?/p> 8月初,一位名叫Jason Allen的美國人在美術比賽中提交3張人工智能生成的圖像,其中一件作品獲得了數字藝術/數字攝影類別的最高獎項。 開源和去中心化的努力將繼續增加 2022年,少數人工智能公司主導了舞臺,主要是OpenAI和Stability AI。但在2023年,隨著構建新系統的能力超越“資源豐富和強大的人工智能實驗室”,鐘擺可能會向開源方向擺動。 Gahntz說,社區可能會導致對正在構建和部署的系統進行更多審查。如果模型是開放的,將使更多的關鍵研究成為可能,這些研究指出了與生成式人工智能有關的許多缺陷和危害。 這種以社區為中心的例子包括EleutherAI和BigScience的大型語言模型。Stability AI也在資助一些社區,比如專注于音樂生成的Harmonai和生物技術實驗集合 OpenBioML。 訓練和運行復雜的人工智能模型仍然需要資金和專業知識,但隨著開源工作的成熟,分散的計算可能會挑戰傳統的數據中心。 BigScience最近發布了開源的Petals項目,向實現分散開發邁出了一步。Petals讓人們貢獻他們的計算能力,以運行通常需要高端GPU或服務器的大型AI語言模型。 “現代生成模型的訓練和運行在計算上很昂貴。”艾倫人工智能研究所(Allen Institute for AI)的高級研究科學家Chandra Bhagavatula說:“粗略估計,ChatGPT每天的支出約為300萬美元。為了使其在商業上可行并能更廣泛地使用,解決這個問題將是很重要的?!?/p> 然而,只要方法和數據仍然是專有的,那么大型實驗室將繼續擁有競爭優勢。最近,OpenAI發布了Point-E,一個可以在文字提示下生成3D物體的模型。雖然OpenAI開源了這個模型,但沒有披露Point-E的訓練數據的來源,也沒有發布這些數據。 ![]() 最近,OpenAI發布了Point-E,一個可以在文字提示下生成3D物體的模型。 訓練大型語言模型的數據要開始耗盡了 說數據是新的石油已經成為一種陳詞濫調。這個比喻是恰當的:這兩種資源都是有限的,都有被耗盡的風險。這種擔憂最迫切的人工智能領域是語言模型。 正如前面所說,建立更強大的大型語言模型的最有效方法不是讓它們更大,而是在更多的數據上訓練它們。但世界上還有多少語言數據呢?更確切地說,還有多少語言數據能達到可接受的質量門檻?互聯網上的許多文本數據對訓練大型語言模型來說是沒有用的。 這是一個具有挑戰性的問題,根據一個研究小組的說法,世界上高質量文本數據的總存量在4.6萬億至17.2萬億個符號之間,這包括世界上所有的書籍、科學論文、新聞文章、維基百科、公開代碼,以及互聯網的大部分其他內容,經過質量過濾后的數據。 換句話說,我們可能會在一個數量級內耗盡世界上所有有用的語言訓練數據供應。這可能是對語言人工智能持續進步的一個重大障礙。私下里,許多領先的人工智能研究人員和企業家都擔心這個問題。 隨著研究人員尋求解決迫在眉睫的數據短缺問題,預計明年將在這一領域看到大量的關注和活動。一個可能的解決方案是合成數據,盡管關于如何操作的細節還很不清楚。另一個想法是:系統地轉錄全世界的口語內容。 歐盟的人工智能法案 人工智能技術正在迅速發展,監管也在迅速發展。雖然美國已經通過了各種基于州的人工智能相關法案,但大家期待的是更大的政府監管——以歐盟人工智能法案的形式。12月6日,歐盟人工智能法案向成為法律邁進了一步,歐盟理事會通過對法案草案的修正案,為歐洲議會“最終確定其共同立場”打開了大門。 歐盟人工智能法案是第一批關于人工智能的廣泛監管框架之一,預計將在2023年成為法律,可能會改變公司開發和部署人工智能系統的方式。 像美國紐約市的人工智能招聘法規這樣的地方性法規也會帶來改變,該法規要求用于招聘、雇用或晉升的人工智能和基于算法的技術在使用前要進行偏見審計。 不過,在任何人被罰款或指控之前,預計會有更多關于規則和法庭案件的爭論。企業仍可能在即將出臺的法律中爭奪有利地位,比如人工智能法案的風險類別。 目前的規則將人工智能系統劃分為四個風險類別,每個類別都有不同的要求和審查水平。最高風險類別的系統,即“高風險”人工智能(如信用評分算法、機器人手術應用程序),必須滿足某些法律、道德和技術標準,才允許進入歐洲市場。風險最低的類別,即“最低或無風險”的人工智能(如垃圾郵件過濾器,人工智能視頻游戲),只規定了透明度義務,如讓用戶知道他們正在與人工智能系統互動。 有些企業會希望進入最低的風險類別,以減少自己的責任和對監管機構的可見度。 搜索革命 上周有媒體報道,谷歌內部針對ChatGPT發出“紅色代碼”。而在12月中旬,You.com宣布已經向生成式人工智能應用開放了其搜索平臺。然后在圣誕節前夕,You.com首次推出YouChat,稱之為“帶有引文和實時數據的對話式人工智能,就在你的搜索欄里”。 這一切加起來,可能是2023年搜索領域的一場真正的戰斗。谷歌每天處理數十億次搜索,所以它不會很快消失。但也許ChatGPT甚至You.com將開啟圍繞人工智能和搜索未來的新的、富有想象力的思考。 搜索是人們瀏覽和獲取數字信息的主要手段,是現代互聯網體驗的核心。在ChatGPT之后,對話式搜索的概念得到了廣泛關注。如果你能與人工智能代理進行動態對話,以找到要找的東西,為什么要輸入一個查詢并得到一長串鏈接? 對話式搜索有一個光明的未來。不過,在它準備好進入黃金時段之前,需要解決一個主要挑戰:準確性。目前,它們偶爾會完全自信地分享與事實不符的信息。OpenAI首席執行官Sam Altman最近警告說:“現在依靠ChatGPT做任何重要的事情都是一個錯誤?!贝蠖鄶涤脩舨粫邮芤粋€95%甚至99%時間都準確的搜索應用,以可擴展和更強大的方式解決這個問題,將是搜索創新者在2023年面臨的主要挑戰之一。 除了You.com,Character.AI、Metaphor和Perplexity是一波有前途的年輕初創公司,它們希望與谷歌對抗,用大型語言模型和對話界面重塑消費者搜索。 但消費者搜索并不是大型語言模型將改變的唯一類型的搜索。企業搜索也同樣處于一個新的黃金時代的邊緣。像Hebbia和Glean這樣的初創公司正在引領使用大型語言模型改造企業搜索的潮流。 下一代搜索的機會也已經超出了文本范圍。人工智能的最新進展為多模態搜索開辟了全新的可能性:即跨數據模態查詢和檢索信息的能力。 鑒于視頻占了互聯網上所有數據的80%,沒有任何一種模式比視頻代表著更大的機會。想象一下,能夠毫不費力地精確搜索視頻中的某個特定時刻、人、概念或行動。 自谷歌在互聯網時代崛起以來,搜索的變化出乎意料的小。明年,由于大型語言模型的出現,這將開始發生巨大的變化。 普通民眾將首次使用完全無人駕駛的汽車 在自動駕駛汽車領域經過多年不成熟的炒作和未實現的承諾之后,最近發生了一些事情,但似乎很少有人注意到:真正的無人駕駛汽車已經到來。 如果你在舊金山,你可以下載Cruise應用程序,叫一輛無人駕駛的汽車,把你從A點送到B點。Cruise目前只在夜間(晚上10點到凌晨5點半)提供這些無人駕駛服務,但該公司預計幾周內將在整個舊金山提供全天候的服務。Cruise的競爭對手Waymo緊隨其后。 ![]() Cruise的夜間無人駕駛出租車服務。 2023年,機器人出租車服務將迅速從一個迷人的新奇事物過渡到一個可行、方便、甚至平凡的城市交通方式。道路上的機器人出租車的數量和用戶人數將激增。簡而言之,自動駕駛汽車即將進入其商業化和規模化階段。 除了舊金山之外,預計明年至少還有兩個美國城市將向公眾提供完全的無人駕駛服務。可能的候選地點包括鳳凰城、奧斯汀、拉斯維加斯和邁阿密。 為機器人技術建立基礎模型 斯坦福大學一個研究小組去年提出的“基礎模型”一詞,是指在廣泛的數據上訓練出來的大規模人工智能模型,它不是為某一特定任務而建立的,而是可以在廣泛的不同活動中有效地執行。 基礎模型一直是人工智能的關鍵驅動力。今天的基礎模型強大得令人驚嘆,但是無論它們是像GPT-3這樣的文本生成模型,還是像Stable Diffusion這樣的文本到圖像模型,或者像Adept這樣的計算機行動模型,都只在數字領域運作。 在現實世界中行動的人工智能系統,例如自動駕駛汽車、倉庫機器人、無人機、人形機器人,到目前為止仍然大多沒有被新的基礎模型范式所觸及。 這種情況將在2023年改變。預計關于機器人基礎模型的早期開創性工作將來自世界領先的人工智能研究機構:DeepMind、谷歌大腦或者OpenAI。 為機器人建立一個基礎模型,換句話說,為物理世界建立一個基礎模型,意味著什么?這樣的模型可能會在來自不同傳感器模式(如相機、雷達、激光雷達)的大量數據上進行訓練,以發展對物理學和現實世界物體的普遍理解:不同的物體如何移動,如何相互作用,它們有多重、多脆弱、多柔軟或多靈活,當你觸摸、掉落或投擲它們時會發生什么。這種現實世界的基礎模型可以針對特定的硬件平臺和下游活動進行微調。 參考資料: https:///information-technology/2022/12/please-slow-down-the-7-biggest-ai-stories-of-2022/ https:///2022/12/26/what-to-expect-from-ai-in-2023/?guccounter=1 https:///ai/the-5-top-ai-stories-im-waiting-for-in-2023-the-ai-beat/ https://www./sites/robtoews/2022/12/20/10-ai-predictions-for-2023/?sh=4de34f18fab7 |
|