
人工智能(AI)行業迎來瘋狂的一夜,谷歌(Google)、AMD先后上新,終于要“打爆”OpenAI和英偉達了。
鈦媒體App 12月7日消息,北京時間今天凌晨,谷歌CEO桑達爾·皮查伊 (Sundar Pichai) 宣布,谷歌公司正式發布迄今為止功能最強大、最通用的多模態人工智能(AI)大模型:Gemini(中文稱“雙子座”)。

具體來看,谷歌最新發布的Gemini 1.0系列,主要是英語模型,共包括三個不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),將全面內置最新、最強大的自研 AI 超算芯片Cloud TPU v5p。
谷歌表示,在六項基準測試中,大杯的Gemini Pro性能表現優于GPT-3.5;而在30項性能基準測試中,超大杯Gemini Ultra超越了目前最強模型GPT-4。甚至,Gemini Ultra在MMLU測試上得分高達90.0%,即數學、物理、法律等57個領域測試中,Gemini Ultra成為第一個超越人類專家水平的 AI 模型。
與此同時,12月7日凌晨,芯片巨頭AMD在美國圣何塞發布備受矚目的全新Instinct MI300X AI 加速芯片(APU),由十多個臺積電5nm/6nm小芯片組成,擁有1530億個晶體管,封裝CPU+GPU,支持高達192GB的HBM3內存容量,瞄準這一英偉達主導的 AI 算力芯片市場。
皮查伊表示,Gemini是 AI 模型的巨大飛躍,最終將影響幾乎所有的谷歌產品。同時,人類正式迎來Gemini新時代的第一步,邁向真正的通用人工智能(AGI Model)。
“MI300X是我們迄今為止最先進的產品,也是業內最先進的 AI 加速芯片。”AMD CEO蘇姿豐(Lisa Su)則直示,“AI 是50多年來單一最重要、最具變革性的技術,不止是很酷的新技術,也真切地改變計算世界的未來。”
然而,略帶遺憾的是,截至目前,無論是MI300X,還是Gemini 1.0系列模型,都不會在中國大陸市場進行銷售和服務,預計AMD或將推出“中國特供”的合規產品。

AMD公司CEO蘇姿豐
谷歌Gemini性能超越GPT-4,最新自研芯片TPU v5p模型訓練速度提高280%
自2022年11月30日起,美國 OpenAI 公司發布了 AI 聊天機器人 ChatGPT 風靡全球,成為全球增長最快的消費應用之一。它不僅能夠寫詩、編程,還能創作劇本、協助面試、發表論文,甚至提供廣泛的搜索服務,顯示出極大的生產力解放潛力。
作為在 AI 技術上投入時間最長并擁有眾多核心技術的公司,谷歌面對 ChatGPT 的出色表現和技術優勢顯得措手不及。市場擔憂,ChatGPT 可能會取代傳統搜索引擎,對谷歌的搜索廣告業務造成影響。
為應對這一挑戰,谷歌于今年2月內部發起了內部“紅色代碼警報”(code red),創始人拉里·佩奇和謝爾蓋·布林重回公司,并緊急推出 ChatGPT競品Bard,以及投資超過4億美元給ChatGPT競品 Anthropic。
然而,盡管Bard在發布后進行了多次迭代升級,但市場反饋普遍不佳,認為其產品倉促、性能和體驗不及 ChatGPT或微軟推出的GPT-4版必應搜索。
如今,谷歌終于準備好反擊了,發布了傳聞已久的“谷歌殺手锏”、史上性能最強、超越GPT-4的通用 AI 模型Gemini 1.0。
多模態Gemini,是迄今規模最大、能力最強的谷歌大模型,在文本、視頻、語音等多個領域超越了GPT-4,是真正的一雪前恥。
據The Information報道稱,谷歌本來計劃在2024年公布Gemini,但如今,谷歌似乎改變了策略,以在OpenAI經歷董事會重組和內部動蕩期間搶占輿論焦點。目前谷歌公布的最新論文中,Gemini的研發團隊超過800人。
具體到產品中,新的Gemini系列包括三個模型版本:Gemini Ultra(超大杯)、Gemini Pro(大杯)和Gemini Nano(中杯)。

其中,Gemini Ultra(超大杯)是三者中性能最強大的模型,適用于高度復雜的任務,計劃明年內置于谷歌聊天機器人Bard中;Gemini Pro(大杯)是最適合在各種任務中通用、可擴展的模型,目前已內測于Bard上;Gemini Nano(中杯)則主要在端側設備中,執行最高效任務的 AI 模型,將首次用于谷歌Pixel 8 Pro上。
與Bard相比,Gemini和Bard都是 Google AI 開發的大型語言模型(LLMs),但它們有不同的特點和優勢。其中,Gemini更擅長生成創意文本格式,例如詩歌、代碼、腳本、音樂作品、電子郵件、信件等,而Bard更擅長在挑戰性問題下,提供信息和全面的答案。如果用戶需要獲得信息和全面的答案,Bard將是一個更好的選擇。
據谷歌官網介紹,Gemini 1.0亮點主要包括五個方面:最先進的性能測試結果,新的推理以及創意功能,性能強大且高效的 AI 超算系統,責任與安全,以及可用性。
首先,性能測試方面,在32個性能基準測試中的30個中,Gemini Ultra模型超越了現有最先進的GPT-4。其中,在MMLU(大規模多任務語言理解)測試中,Gemini Ultra以90.0%的成績首次超過了人類專家,這一測試綜合了數學、物理、歷史等57個科目;此外在UltraMMMU多模態測試中也取得59.4%高分;在圖像基準測試中,Ultra未使用OCR就超越了強大的GPT-4V,顯示出其多模態和更復雜的推理能力。

新的功能點上,Gemini 1.0 具有復雜的多模態推理能力,可幫助理解復雜的書面和視覺信息,而且它擁有通過閱讀、過濾以及理解信息,從數十萬份文件中提取見解的卓越能力,將有助于在從科學到金融等多個領域以數字化速度實現新的突破。另外在經過訓練之后,Gemini 1.0可以同時識別并理解文本、圖像、音頻等,且編碼能力AlphaCode 2具有巨大的改進,編碼性能超過85%的參賽程序員,比前代AlphaCode高出將近 50%。
算力方面,Gemini 1.0 采用谷歌設計的TPUs v4 和 v5e芯片上進行大規模 AI 訓練。谷歌稱,在TPUs上,Gemini的運行速度明顯快于早期規模更小、性能更弱的模型。此外,今天,谷歌還發布迄今為止功能最強大、效率最高且可擴展性最強的TPU系統 Cloud TPU v5p,旨在為訓練前沿 AI 模型提供支持,從而將加速 Gemini 的開發。
需要重點提及的是,谷歌TPU v5p芯片采用臺積電5nm/7nm工藝,相比前代TPUv4推理芯片,v5p更多是針對生成式 AI 所研發的訓練芯片。每個TPU v5p pod(服務器組)都由8960個芯片組成,它通過TPU帶寬最高的芯片間互連(ICI)以每秒4800Gbp速度在3D拓撲結構中連接。與TPU v4相比,TPU v5p的Flops性能提高了2倍以上,高帶寬內存(HBM)增加了3倍。同時,TPU v5p訓練大模型的速度比上一代TPU v4快2.8倍(280%),而借助第二代SparseCores,TPU v5p訓練嵌入密集模型的速度比TPU v41快1.9倍以上。
責任和安全方面,谷歌稱將致力于負責任地推進 AI,特別是在開發具有先進多模態能力的 Gemini 模型時,依據 Google AI 原則和嚴格的產品安全政策,增加了新的保護措施,全面考慮潛在風險,并在開發的每個階段進行測試和風險降低。此外,谷歌與外部專家合作進行壓力測試來確保內容安全,且建立了專門的安全分類器來識別和過濾有害內容,確保Gemini更加安全和包容。
可用性方面,谷歌宣布,從今天開始,Bard將使用Gemini Pro 的微調版本來進行更高級的推理、規劃和理解,并將以英語版本在170多個國家和地區提供服務(不包括中國大陸),以及計劃未來擴展至不同模型和新的語言、地點;另外,從12月13日起,開發者和企業客戶可以通過谷歌AI Studio或谷歌云Vertex AI訪問Gemini Pro的API,而Gemini Nano則內置于Pixel 8 Pro。
谷歌稱,未來幾個月,Gemini將應用于谷歌更多的產品和服務,如搜索、廣告、Chrome瀏覽器和 Duet AI。根據測試,在谷歌搜索中內置Gemini,它能夠為用戶提供更快的搜索生成體驗(SGE),用戶在美國的英語搜索延遲降低40%,同時在質量方面也有所提高。

谷歌CEO Sundar Pichai(來源:CNBC)
皮查伊表示,這次Gemini的發布對于Bard來說是一個重要時刻,也是Gemini時代的開始。如果測試結果準確,新模型則可能已經使Bard成為像ChatGPT一樣優秀。“這顯然已經是一個相當令人印象深刻的壯舉了。”
不過,截至目前,谷歌搜索和廣告業務也未受GPT等大模型的影響。據Statcounter數據,截至2023年10月,必應搜索(Bing)在美國的市場份額略低于7%,較去年同期的7.4%有所下滑;同期谷歌以88.13%的份額繼續主導搜索引擎市場。2023年至今,搭載GPT技術的必應搜索的市場份額一直保持在7%以下。同時,財報顯示,2022財年,谷歌母公司Alphabet的總營收當中,谷歌搜索及其他收入為 1625 億美元,同比增長9%。而2023財年前三季度,Alphabet總營收達2210.84億美元,超過去年同期的2068億美元。
“迄今為止,我們已經在Gemini上取得了巨大進展。我們正努力進一步擴展其未來版本的各種功能,包括在規劃和記憶方面取得進展,以及通過增加上下文窗口來處理更多信息并提供更好的響應。”谷歌表示。
據The Verge報道,谷歌計劃明年推出由Gemini Ultra提供支持的“Bard Advanced”預覽版——谷歌史上最強大的Chat類產品,有望對標ChatGPT-4或5。
但皮查伊也坦言,雖然 AI 對人類的變革將比火、電力的誕生意義更大,但Gemini 1.0可能不會改變世界,而最好的情況是,Gemini可能會幫助谷歌在生成式 AI 軍備競賽中趕上OpenAI。
“這是 AI 發展過程中的一座重要里程碑,也標志著谷歌邁進新紀元的開始,我們將繼續快速創新,并以負責任的方式不斷提升我們模型的能力。”谷歌表示。
最強 AI 芯片MI300X,性能比英偉達H100提高60%,但不在中國銷售
AMD公司終于決定反擊英偉達了。

(圖片來源:AMD公司)
北京時間12月7日凌晨,在美國圣何塞舉辦的AMD Advancing AI 活動上,AMD CEO蘇姿豐(Lisa Su)宣布推出Instinct MI300X AI 加速芯片(APU)以及宣布MI300A芯片量產。
兩款產品均瞄準這一英偉達主導的市場。
其中,MI300X內存是英偉達H100產品的2.4倍,內存帶寬是H100的1.6倍,進一步提升了性能,有望挑戰英偉達在炙手可熱的 AI 加速芯片市場地位。
具體來說,AMD表示,MI300X新款芯片較英偉達的H100性能最多可以提升60%。在與H100(Llama 2 700億參數版本)的一對一比較中,MI300X性能提高了高達20%;在與H100(FlashAttention 2版本)的一對一比較中,MI300X性能提高20%;在與H100(Llama 2 70B版本)的8對8服務器比較中,MI300X性能提高40%;在與H100(Bloom 176B)的8對8服務器比較中,MI300X性能提高60%。
與此同時,在 AI 大模型訓練中,相比H100,MI300X在 BF16性能基準中提高3.4 倍,INT8精度性能提高6.8倍,1.3倍的FP8和FP16 TFLOPS,從而進一步提升了訓練性能。

蘇姿豐表示,新款MI300X芯片在訓練人工智能軟件的能力方面與H100相當,在推理方面,也即軟件投入實際使用后運行該軟件的過程,要比H100好得多。
針對 AI,AMD共有三大優勢,一是具備完整IP與廣泛的運算引擎產品組合,可支援從云端、邊緣至終端,要求最嚴苛的工作負載;二是該公司正擴展開源軟件能力,以降低進入與使用AI 完整潛力的門檻;第三是AMD正在深化AI合作伙伴的產業體系,讓云端服務供應商(CSP)、OEM與獨立軟體開發廠商(ISV)能享有其先驅性的創新技術。
目前,AMD、英偉達、英特爾三家在全力推進 AI 熱潮。其中,英偉達已公布2024年Hopper H200 GPU和Blackwell B100 GPU產品信息,英特爾則將在2024年推出Guadi 3和Falcon Shores GPU,預計未來幾年三家公司將持續進行競爭。
AMD稱,戴爾、惠普、聯想、Meta、微軟、甲骨文、Supermicro等公司均會采用MI300系列產品。
其中,微軟與AMD合作推出新的Azure ND MI300x v5虛擬機(VM) 系列,該系列針對 AI 工作負載進行了優化,并由MI300X提供支持;Meta公司將在數據中心采用AMD新推的MI300X芯片產品。甲骨文表示,公司將在云服務中采用AMD的新款芯片,預計將在2024年發布。
然而,當前AMD主要面臨三個問題:一是AMD產能有限,英偉達和英特爾等廠商都提前買走產能,且AMD推出了 MI300A、MI300X等多個系列產品,或將出現供不應求情況;二是明年3月英偉達將發布B100,H200也將銷售到市場,因此AMD獨享“最強AI芯片”稱號還有多久依然未知;三是軟件體系上,CUDA已經成為大模型訓練推理的最佳選擇,盡管AMD在ROCm軟件領域取得顯著進步,但相比英偉達CUDA生態ROCm仍很薄弱。
AMD方面回應:中國市場對AMD很重要,但今天沒有宣布專門針對中國市場的特別產品。
此前,市場預計AMD的MI300系列在2024年的出貨約為30~40萬顆,最大客戶為微軟、谷歌,若非受限臺積電CoWoS產能短缺及英偉達早已預訂逾四成產能,AMD出貨有望再上修出貨量。
“AMD并不認為自己需要擊敗英偉達才能再市場上取得好成績,”蘇姿豐今晨公開表示,“我們相信,到2027年,我們可以從超過 4000 億美元的 AI 芯片市場中分得一杯羹。”
MI300X消息發布后,AMD和英偉達的股價均不漲反跌。

截至美股12月6日收盤,英偉達股價下跌2.28%,AMD股價也下跌1.32%,報收116.82美元/股。年初至今,AMD股價上漲了82.47%,高于英特爾,但遠不及增長220%的英偉達股價。
AI 超越人類的時代真的到了?
蘇姿豐表示,AI 在很短的時間內不僅發展迅速,更是呈現出爆炸性增長,與互聯網的發明地位相當。但不同的是,AI 技術的采用速度將會更快。然而目前,我們仍處于 AI 新時代發展的非常早期階段。
AMD和谷歌這一夜的瘋狂成績告訴我們:AI 時代已經到來,人類必須要關注。僅過了一年多時間,市場發生巨大的轉變和翻盤,任何事情都有可能發生。
隨著2023年進入最后一個月,關于大模型的“王座之爭”更激烈了。
一年前,蘇姿豐認為,2023年的AI加速器市場為300億美元。到2027年,全球數據中心AI加速器的潛在市場規模(TAM)將達到1500億美元,這意味著期間的年復合增長率(CAGR)約為50%。
但現在,蘇姿豐直接給出更高的預期,2023年,AI加速器潛在市場規模將達到450億美元,未來幾年的CAGR將高達70%,到2027年,推動整個市場增加到4000億美元的規模。

當谷歌產品超越GPT-4、AMD產品超越英偉達H100,人類所發明的 AI 成果正改變世界,人類迎來了巨變前夜。
2014年,英國物理學家斯蒂芬·霍金(Stephen Hawking)曾發出過嚴厲的警告,“人工智能的全面發展可能意味著人類的終結。”
如今,AI 時代終于來臨,機器可能很快取代人類。從醫療保健到汽車行業,AI 技術應用于各行各業,深切改變每個人的生活。未來,我們將會看得到更多 AI 創新技術,也可預見到研發的激增,和更加前沿的技術較量。
“現在,(AI)并不比我們聰明。但我認為,他們(AI)可能很快就會超越人類,”AI先驅、圖靈獎得主杰弗里·欣頓(Geoffrey Hinton)稱。
(本文首發鈦媒體App,作者|林志佳)