字節全方位發力AI大模型,上半年是飛書妙記,今天是豆包,還有buboGPT更牛 字節的 GPT 算是徹底爆發了,首先是今天突然發布了聊天工具,名字叫豆包,不過豆包只是字節在大模型上放的一個小技能大招,我放到后面說,從紙面上看可比 OpenAI 的要厲害多了。咱先說豆包,它是全平臺支持的,包括網頁以及安卓和蘋果的 APP 網址,我放粉絲群了,直接打開下載就可以了。豆包用抖音號直接就能登錄,目前的消息是限量邀請,但是我兩個號都登進去了,都用上了,也沒跟我要什么邀請碼,可能是先到先得,也就是目前還有名額。我問了一下他用的是哪個大語言模型,是不是開源的? LLAMA 還是ChatGLM?那他說是云雀,這個應該是字節自研的模型,豆包可以寫代碼,可以寫文案,可以和你聊天,但是不能輸出圖片,只支持中英文。我測試的是它不支持日語。豆包有意思的是每次他回復你自動播放語音,提高。 社交能力需要付出持續的努力和實踐。 當然你要不想聽的話,右上角這個小喇叭給他點了就可以了。那安裝好以后默認有 4 個對話,有豆包英語學習助手、全能寫作助手,還有超愛聊天的小寧。這我不知道和豆瓣有什么區別。相比于其他的 AI 聊天軟件,它不能預設, prompt 也沒有給你提供,應該是每次都讓你來寫騎手勢來定角色了,后續應該會更新這功能。那找了一篇文章來讓他分析一下。 7000 多字,輸入進去直接就不說話了。我字數少一點, 1000 字它就沒什么問題,那我再整個 3000 字的,它會告訴我超過字數限制。今天就是簡單測試一下該會的,它都差不多,包括我之前寫的這個哆啦 a 夢的邏輯問題測試,它都完成的不錯,它是能識別出什么是現實世界,什么是漫畫世界。 其實這個也不是字節的第一款產品了,前面有一個飛書妙記集成在飛書軟件里也是大語言模型的產品。我當時以為是字節要直接打辦公場景了,開個會自動寫個會議紀要啥的,直接提高辦公人的效率。沒想到突然又出現了純聊天的軟件,說明字節跳動已經全面加入了大模型的大亂斗當中。 而且真正的大招是這個叫 Google GPT 的,8月 17 號剛剛在預印本網站上上傳了論文,那 Git Hub 上也有 300 個星了。 Google GPT 除了常規的大語言模型支持的這些文字輸入以外,還支持圖片和聲音的多模態輸入。它能看出來泳池里有一只貓,談及它的青蛙,而且能看出這些圖片的笑點和含義。當然別急,基操物流這些功能都是 GPT 4 半年前在 PPT 上展示的大餅,現在還沒實現。 Google 這個更厲害的是它能做到細顆粒度、多模態的聯合理解。什么意思?就是其他的多模態的模型,要不然就只能聽,要不然就只能看。 Google 這個是它既能聽又能看同時來,而且分辨的很細致。比如說這個,他知道圖片里的人在騎自行車,狗在旁邊叫,比如說這個吹風機在響,它知道是這個女人在給貓吹風吹干。那你可想而知,以后監控裝上了這玩意兒,那可真不得了啊,上課的時候,教室前面攝像頭對著所有人的臉拍,誰學進去了,誰沒學進去?誰偷摸講話了,傳紙條都給你看得明明白白。 現在的 AI 工具幫你總結視頻網站的視頻,要不然就是抓取字幕,然后分析文字,要不然就是語音轉文字,然后分析文字。字節的這個多模態可真的是幫你看電影了。當然了,對算力的要求可能比現在要高得多得多。那這幾個月呢? AI 其實比較冷清,國內外其實都沒有特別亮眼的產品,都沒超過 GPT 4。下半年蘋果應該還會有王炸。 but there is just one more thing。 不知道是什么東西,那下一波大模型的浪潮不知道是不是又要開始。 本文由:百收網絡公司編輯,喜歡點上面頭像關注,請勿轉載 |
|