大模型的技術能力,和它影響世界的能力,都在光速進化。
真是瘋狂的一周。 GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言,一顆顆 AI 大模型領域的重磅炸彈,扎堆在這周引爆。 GPT 開啟了大模型的多模態應用,微軟說讓工具回歸工具,Midjourney 解決了 AI 作畫的手指問題,學術界與開源勢力也不甘落后,中國互聯網公司總算有了第一個大模型產品...... 像創世紀一樣,日新月異。 我們從沒有像今天這樣,好奇兩個月后的世界會變得如何。 但我們首先要做的,是記住這不尋常的一周。 注:封面圖片由 DreamStudio 生成,prompt:god。產品發布時間以北京時間為準。 周一 暴風雨前的平靜。 ![]() 圖片由 DreamStudio 生成 周二 低門檻:斯坦福大學發布 Alpaca7B 成本降到超低,性能匹敵 GPT-3.5 斯坦福大學推出了由 Meta 的 LLaMA 7B 微調而來的全新模型 Alpaca。僅用 52k 數據,性能約等于 GPT-3.5。關鍵是訓練成本奇低,不到 600 美元,評估效果與 GPT-3.5 相當。 這意味著人們可以以更低的成本獲得與 GPT-3.5 相當的性能。 低門檻:清華發布 ChatGLM-6B 消費級顯卡就能部署,準確度接近 GPT-3 175B (davinci) ![]() 下面是 ChatGLM 的自我介紹: 由清華技術成果轉化的公司智譜 AI 開源了 GLM 系列模型的新成員——中英雙語對話模型 ChatGLM-6B,支持在單張消費級顯卡上進行推理使用。雖然依然會有和 ChatGPT 一樣的事實錯誤、胡說八道的問題,但作為開源模型,ChatGLM-6B 可以在消費級顯卡上部署使用。 周三 OpenAI:GPT-4 來了! 人類歷史上最慌的一天 ![]() 我們之前的文章里有更詳細的信息:GPT-4 發布后的 20 個小時 一個可能不太恰當的類比,在擁有了多模態能力后,GPT-4 的發布可能就是大模型產業的 iPhone 4 時刻。 能夠與人類正常對話,又能夠看懂圖片,輸出和推理能力更強大,你應該擔心的不是會不會被取代,而是如何更快學會使用它。 高素質:Anthropic 發布 Claude 在適當的時候,學會沉默 由前 OpenAI 研究副總裁 Dario Amodei 創立,谷歌投資的人工智能公司 Anthropic 宣布聊天機器人 Claude 開放公測。它具有 ChatGPT 的對話推理能力,同時又可以像 New Bing 一樣調整 AI 的語氣、個性和行為。 Anthropic 聲稱 Claude 不太容易產生有害的輸出,因為它使用的是「以人為本」的語言建模方法,并根據語言的「深層結構」來構建模型。當被問及超出其知識領域的話題時,Claude 會推遲回答,降低產生虛假信息的風險。 Google:PaLM API 開放以及更多 AI 屆汪峰:明明周三是我先來的 ![]() 谷歌在 3 月 14 日晚間開放了其大語言模型 API——PaLM API。開發人員可以通過 API 訪問谷歌的基礎模型,并可以使用開箱即用的模板,在幾分鐘或幾小時內啟動生成式應用程序的創建。谷歌還推出了 MakerSuite 工具和 Generative AI App Builder 平臺等人工智能企業工具。 PaLM API 的另一應用場景是 Gmail 和 Google Docs。用戶只需鍵入您想要寫的主題,即可立即生成草稿。MakerSuite 工具是簡化開發人員在模型流程制作、迭代等領域的工具。MakerSuite 可以簡化此工作流程,讓用戶將能夠根據 prompt 進行迭代,使用合成數據擴充數據集,并輕松調整自定義模型。當你準備好編程時,MakerSuite 允許將 prompt 導出為你最喜歡的語言和框架(如 Python 和 Node.js)的代碼。 然而,同一天更晚的時間,OpenAI 推出了多模態的 GPT4,引起了科技圈轟動。 Google 一度是互聯網公司在 AI 領域的半壁江山,但在這瘋狂的一周里,它的發布卻沒有引起預期中的關注(推特互動數與 OpenAI 相差 20 倍)。 周四 訓練速度:Pytorch 2.0 正式版發布 一行代碼,訓練模型 2 倍速! PyTorch 是一個開源的 Python 機器學習庫,用于構建和訓練深度學習模型,比如各類 GPT 預訓練語言模型,目前 TensorFlow、PyTorch 是國際兩大主流深度學習框架,不少產品都在利用 PyTorch 培訓大模型,比如 Salesforce。 2.0 相比 1.0 編譯時間縮短 43%,簡單來說,人類制造 AI 大模型的速度更快了。 圖像生成:Midjourney V5 發布 AI 畫不好手指?那是上周的事。 ![]() 這是最新發布的 Midjourney V5 生產的作品。大概用到的提示詞是:一位在越南街頭市場賣河粉的婦女的街頭風格照片, 日落, 使用 fujifilm --ar 16:9 --v 5 拍攝。 注意看,一直被詬病的「AI 不會畫手指」的問題,被解決了。 不是每個人都能成為攝影家,但未來每個人都能利用 AI 生成這樣一張高質量的圖片。 大規模應用:Microsoft 365 Copilot 48 歲的巨頭靠 AI 再次走上巔峰! ![]() 微軟王炸發布 Microsoft 365 Copilot,一夜之間在中外互聯網上刷屏。 Copilot 應用了最新的 GPT-4 技術,能夠幫助用戶在 Word、Excel、PowerPoint、Outlook 和 Teams 等軟件中進行寫作、編輯、總結、創作、演示文稿等工作。 Copilot 在 Microsoft 365 界面中和其他應用程序并排出現在側邊欄,用戶可以通過聊天對話,讓 Copilot 幫助進行工作生產。微軟計劃將這些產品接入 GPT-4,以提高人工智能軟件的開發速度和質量。微軟正在與 20 位客戶一起測試 Microsoft 365 Copilot,并將在未來幾個月內擴展預覽版。此外,微軟正在開發在客戶數據上訓練這些模型,而不會泄露給其他客戶或落入不良行為者手中。 「Word,你是個成熟的軟件了,該學會自己碼字了。」 微軟:「在做... 不對,做好了。」 中文大模型:百度發布文心一言 沒見過這么緊張的 Robin ![]() 在文心一言發布會上,百度董事長李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。此外,百度智能云即將面向企業客戶開放文心一言 API 接口調用服務。 在股價和梗圖之外,有個事實是: 文心一言是目前 AI 商業化產品浪潮中唯一的中國互聯網大廠代表。 也許最著急的是 Robin。 周五 提示詞:Stable Diffusion Reimagine 人人都是 prompt 工程師的時代,還沒開始就結束了 ![]() 在 Stability.AI 宣布收購圖片工具 Clipdrop 開發商的短短一周后,它發布了新工具 Stable Diffusion Reimagine。SDR 允許用戶無限制地生成單個圖像的多種變體。用戶只需將圖像上傳到算法中,就可以創建他們想要的盡可能多的變體,而不需要復雜的 prompt。這個工具基于 Stability.AI 創建的一種新算法。 最后,你當然會猜到, 這篇文章大部分是使用 AI 工具生成的, 可你又怎么會在意呢? ![]() Is there anything else you would like to know? *頭圖來源:DreamStudio |
|