這一周，全世界都興奮麻了

源源不斷 2023-03-20 發布于寧夏

展開全文

大模型的技術能力，和它影響世界的能力，都在光速進化。

作者 | Founder Park

真是瘋狂的一周。

GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言，一顆顆 AI 大模型領域的重磅炸彈，扎堆在這周引爆。

GPT 開啟了大模型的多模態應用，微軟說讓工具回歸工具，Midjourney 解決了 AI 作畫的手指問題，學術界與開源勢力也不甘落后，中國互聯網公司總算有了第一個大模型產品......

像創世紀一樣，日新月異。

我們從沒有像今天這樣，好奇兩個月后的世界會變得如何。

但我們首先要做的，是記住這不尋常的一周。

注：封面圖片由 DreamStudio 生成，prompt：god。產品發布時間以北京時間為準。

周一

暴風雨前的平靜。

圖片由 DreamStudio 生成

周二

低門檻：斯坦福大學發布 Alpaca7B

成本降到超低，性能匹敵 GPT-3.5

斯坦福大學推出了由 Meta 的 LLaMA 7B 微調而來的全新模型 Alpaca。僅用 52k 數據，性能約等于 GPT-3.5。關鍵是訓練成本奇低，不到 600 美元，評估效果與 GPT-3.5 相當。

這意味著人們可以以更低的成本獲得與 GPT-3.5 相當的性能。

低門檻：清華發布 ChatGLM-6B

消費級顯卡就能部署，準確度接近 GPT-3 175B (davinci)

下面是 ChatGLM 的自我介紹：

由清華技術成果轉化的公司智譜 AI 開源了 GLM 系列模型的新成員——中英雙語對話模型 ChatGLM-6B，支持在單張消費級顯卡上進行推理使用。雖然依然會有和 ChatGPT 一樣的事實錯誤、胡說八道的問題，但作為開源模型，ChatGLM-6B 可以在消費級顯卡上部署使用。

周三

OpenAI：GPT-4 來了！

人類歷史上最慌的一天

我們之前的文章里有更詳細的信息：GPT-4 發布后的 20 個小時

一個可能不太恰當的類比，在擁有了多模態能力后，GPT-4 的發布可能就是大模型產業的 iPhone 4 時刻。

能夠與人類正常對話，又能夠看懂圖片，輸出和推理能力更強大，你應該擔心的不是會不會被取代，而是如何更快學會使用它。

高素質：Anthropic 發布 Claude

在適當的時候，學會沉默

由前 OpenAI 研究副總裁 Dario Amodei 創立，谷歌投資的人工智能公司 Anthropic 宣布聊天機器人 Claude 開放公測。它具有 ChatGPT 的對話推理能力，同時又可以像 New Bing 一樣調整 AI 的語氣、個性和行為。

Anthropic 聲稱 Claude 不太容易產生有害的輸出，因為它使用的是「以人為本」的語言建模方法，并根據語言的「深層結構」來構建模型。當被問及超出其知識領域的話題時，Claude 會推遲回答，降低產生虛假信息的風險。

Google：PaLM API 開放以及更多

AI 屆汪峰：明明周三是我先來的

谷歌在 3 月 14 日晚間開放了其大語言模型 API——PaLM API。開發人員可以通過 API 訪問谷歌的基礎模型，并可以使用開箱即用的模板，在幾分鐘或幾小時內啟動生成式應用程序的創建。谷歌還推出了 MakerSuite 工具和 Generative AI App Builder 平臺等人工智能企業工具。

PaLM API 的另一應用場景是 Gmail 和 Google Docs。用戶只需鍵入您想要寫的主題，即可立即生成草稿。MakerSuite 工具是簡化開發人員在模型流程制作、迭代等領域的工具。MakerSuite 可以簡化此工作流程，讓用戶將能夠根據 prompt 進行迭代，使用合成數據擴充數據集，并輕松調整自定義模型。當你準備好編程時，MakerSuite 允許將 prompt 導出為你最喜歡的語言和框架（如 Python 和 Node.js）的代碼。

然而，同一天更晚的時間，OpenAI 推出了多模態的 GPT4，引起了科技圈轟動。

Google 一度是互聯網公司在 AI 領域的半壁江山，但在這瘋狂的一周里，它的發布卻沒有引起預期中的關注（推特互動數與 OpenAI 相差 20 倍）。

周四

訓練速度：Pytorch 2.0 正式版發布

一行代碼，訓練模型 2 倍速！

PyTorch 是一個開源的 Python 機器學習庫，用于構建和訓練深度學習模型，比如各類 GPT 預訓練語言模型，目前 TensorFlow、PyTorch 是國際兩大主流深度學習框架，不少產品都在利用 PyTorch 培訓大模型，比如 Salesforce。

2.0 相比 1.0 編譯時間縮短 43%，簡單來說，人類制造 AI 大模型的速度更快了。

圖像生成：Midjourney V5 發布

AI 畫不好手指？那是上周的事。

這是最新發布的 Midjourney V5 生產的作品。大概用到的提示詞是：一位在越南街頭市場賣河粉的婦女的街頭風格照片, 日落, 使用 fujifilm --ar 16:9 --v 5 拍攝。

注意看，一直被詬病的「AI 不會畫手指」的問題，被解決了。

不是每個人都能成為攝影家，但未來每個人都能利用 AI 生成這樣一張高質量的圖片。

大規模應用：Microsoft 365 Copilot

48 歲的巨頭靠 AI 再次走上巔峰！

微軟王炸發布 Microsoft 365 Copilot，一夜之間在中外互聯網上刷屏。

Copilot 應用了最新的 GPT-4 技術，能夠幫助用戶在 Word、Excel、PowerPoint、Outlook 和 Teams 等軟件中進行寫作、編輯、總結、創作、演示文稿等工作。

Copilot 在 Microsoft 365 界面中和其他應用程序并排出現在側邊欄，用戶可以通過聊天對話，讓 Copilot 幫助進行工作生產。微軟計劃將這些產品接入 GPT-4，以提高人工智能軟件的開發速度和質量。微軟正在與 20 位客戶一起測試 Microsoft 365 Copilot，并將在未來幾個月內擴展預覽版。此外，微軟正在開發在客戶數據上訓練這些模型，而不會泄露給其他客戶或落入不良行為者手中。

「Word，你是個成熟的軟件了，該學會自己碼字了。」

微軟：「在做... 不對，做好了。」

中文大模型：百度發布文心一言

沒見過這么緊張的 Robin

在文心一言發布會上，百度董事長李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。此外，百度智能云即將面向企業客戶開放文心一言 API 接口調用服務。

在股價和梗圖之外，有個事實是：

文心一言是目前 AI 商業化產品浪潮中唯一的中國互聯網大廠代表。

也許最著急的是 Robin。

周五

提示詞：Stable Diffusion Reimagine

人人都是 prompt 工程師的時代，還沒開始就結束了

在 Stability.AI 宣布收購圖片工具 Clipdrop 開發商的短短一周后，它發布了新工具 Stable Diffusion Reimagine。SDR 允許用戶無限制地生成單個圖像的多種變體。用戶只需將圖像上傳到算法中，就可以創建他們想要的盡可能多的變體，而不需要復雜的 prompt。這個工具基于 Stability.AI 創建的一種新算法。

最后，你當然會猜到，

這篇文章大部分是使用 AI 工具生成的，

可你又怎么會在意呢？