【原】字節跳動新推出的AI機器人工具：“豆包”是什么？

百收網 2023-09-06 發布于云南

展開全文

字節全方位發力AI大模型，上半年是飛書妙記，今天是豆包，還有buboGPT更牛

字節的 GPT 算是徹底爆發了，首先是今天突然發布了聊天工具，名字叫豆包，不過豆包只是字節在大模型上放的一個小技能大招，我放到后面說，從紙面上看可比 OpenAI 的要厲害多了。咱先說豆包，它是全平臺支持的，包括網頁以及安卓和蘋果的 APP 網址，我放粉絲群了，直接打開下載就可以了。豆包用抖音號直接就能登錄，目前的消息是限量邀請，但是我兩個號都登進去了，都用上了，也沒跟我要什么邀請碼，可能是先到先得，也就是目前還有名額。我問了一下他用的是哪個大語言模型，是不是開源的？ LLAMA 還是ChatGLM？那他說是云雀，這個應該是字節自研的模型，豆包可以寫代碼，可以寫文案，可以和你聊天，但是不能輸出圖片，只支持中英文。我測試的是它不支持日語。豆包有意思的是每次他回復你自動播放語音，提高。

社交能力需要付出持續的努力和實踐。

當然你要不想聽的話，右上角這個小喇叭給他點了就可以了。那安裝好以后默認有 4 個對話，有豆包英語學習助手、全能寫作助手，還有超愛聊天的小寧。這我不知道和豆瓣有什么區別。相比于其他的 AI 聊天軟件，它不能預設， prompt 也沒有給你提供，應該是每次都讓你來寫騎手勢來定角色了，后續應該會更新這功能。那找了一篇文章來讓他分析一下。

7000 多字，輸入進去直接就不說話了。我字數少一點， 1000 字它就沒什么問題，那我再整個 3000 字的，它會告訴我超過字數限制。今天就是簡單測試一下該會的，它都差不多，包括我之前寫的這個哆啦 a 夢的邏輯問題測試，它都完成的不錯，它是能識別出什么是現實世界，什么是漫畫世界。

其實這個也不是字節的第一款產品了，前面有一個飛書妙記集成在飛書軟件里也是大語言模型的產品。我當時以為是字節要直接打辦公場景了，開個會自動寫個會議紀要啥的，直接提高辦公人的效率。沒想到突然又出現了純聊天的軟件，說明字節跳動已經全面加入了大模型的大亂斗當中。

而且真正的大招是這個叫 Google GPT 的，8月 17 號剛剛在預印本網站上上傳了論文，那 Git Hub 上也有 300 個星了。 Google GPT 除了常規的大語言模型支持的這些文字輸入以外，還支持圖片和聲音的多模態輸入。它能看出來泳池里有一只貓，談及它的青蛙，而且能看出這些圖片的笑點和含義。當然別急，基操物流這些功能都是 GPT 4 半年前在 PPT 上展示的大餅，現在還沒實現。

Google 這個更厲害的是它能做到細顆粒度、多模態的聯合理解。什么意思？就是其他的多模態的模型，要不然就只能聽，要不然就只能看。 Google 這個是它既能聽又能看同時來，而且分辨的很細致。比如說這個，他知道圖片里的人在騎自行車，狗在旁邊叫，比如說這個吹風機在響，它知道是這個女人在給貓吹風吹干。那你可想而知，以后監控裝上了這玩意兒，那可真不得了啊，上課的時候，教室前面攝像頭對著所有人的臉拍，誰學進去了，誰沒學進去？誰偷摸講話了，傳紙條都給你看得明明白白。

現在的 AI 工具幫你總結視頻網站的視頻，要不然就是抓取字幕，然后分析文字，要不然就是語音轉文字，然后分析文字。字節的這個多模態可真的是幫你看電影了。當然了，對算力的要求可能比現在要高得多得多。那這幾個月呢？ AI 其實比較冷清，國內外其實都沒有特別亮眼的產品，都沒超過 GPT 4。下半年蘋果應該還會有王炸。

but there is just one more thing。

不知道是什么東西，那下一波大模型的浪潮不知道是不是又要開始。

本文由：百收網絡公司編輯，喜歡點上面頭像關注，請勿轉載