【原】超越GPT4的大模型來了！

小張學AI 2024-02-19 發布于山東

展開全文

多模態大模型時代可能真的要來了。

谷歌預告了自己的多模態大模型：Gemini，號稱是"Anything to Anything"，它可以接收任意形式的輸入（文字，語音，圖片，視頻......），然后按照你的要求給出任意形式的輸出。

例如：給它一個視頻，讓它生成一段代碼。

例如：給它一張圖，讓它給你生成一張【圖片+文字】

甚至，它可以進行多語言識別，即使另一種文字是五線譜！

很厲害，有木有！

從測試效果來看，Gemini是第一個在MMLU（大規模多任務語言理解，是測試人工智能模型的知識和問題解決能力的最流行的方法之一）上超越人類專家的模型，達到了90%

在與GPT4的較量中，無論是在問答、推理、數學還是編程方面，都要優于GPT4.

現在，Gemini有三種模型：

Gemini Ultra ：最大、功能最強的模型，適用于高度復雜的任務。
Gemini Pro ：最佳模型，適用于各種任務的擴展。
Gemini Nano ：用于設備任務的最高效模型。

看到沒，Gemini Nano可以運行在設備上，如果集成在手機上，智能汽車上，會是多么令人興奮的一件事情。有消息稱，Pixel 8 Pro 是首款運行 Gemini Nano 的智能手機，Gemini Nano 支持錄音機應用中的摘要等新功能，并從 WhatsApp 開始在 Gboard 的智能回復中推出，明年還將支持更多的消息應用。未來幾個月，Gemini 將應用于我們更多的產品和服務，如搜索、廣告、Chrome 瀏覽器和 Duet AI。

不得不說，這絕對是人工智能發展的一個里程碑，也是谷歌新時代的開始。

關于Gemini實際演示的視頻，可以去Google Gemini官網，或YouTube去觀看，看完你會感覺時代真的在變，人工智能時代真的來了。

最后，不管Gemini的能力究竟有沒有超過GPT4，它都足夠驚艷了。不得不說，國內眾多大模型廠商任重道遠。

參考：

1. https://deepmind.google/technologies/gemini/#introduction

贊賞

共11人贊賞

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自：小張學AI > 《待分類》

舉報/認領

0條評論

發表

請遵守用戶評論公約

類似文章 更多