作為一款上過2024年央視春晚的國民級內容社交平臺,小紅書在AI上的動作一直不大。與之有關的最新消息是,今年4月,小紅書內測了自研大模型“小地瓜”。 小紅書AI走到哪兒了?我對這個問題很好奇。要知道,小紅書擁有著國內僅次于微信的高質量內容生態。公眾號內容對元寶的加持顯而易見,小紅書又是否會給姍姍來遲的達芬奇帶來一些不同的體驗呢? / 01 / 生活經驗更具體,匹配度有待加強 “文藝復興時期最完美的代表”達·芬奇思想深邃、學識淵博,對什么都有興趣,他精通繪畫、建筑、發明、人體解剖等領域,小紅書的這位達芬奇同樣思維活躍、涉獵廣泛,它依靠小紅書的強大語料和知識庫來回答。 種種跡象表明,官方對待達芬奇非常謹慎。達芬奇(Davinci)早在去年7月就已經有了,當時只有少部分人被內測到了。在今(21)日之前,達芬奇都隱藏得很深,需要在名為“達芬奇”的用戶中尋找,現在你可以在檢索的置頂推薦里找到了。 ▲達芬奇入口前后區別 從功能上來看,達芬奇與“對家”知乎-知海圖等AI并沒有什么區別,依然是對話界面+各種智能體,并推送相關筆記提供延展閱讀,在安卓or蘋果上的使用效果基本沒差。 簡單測試了下,有一定實用價值,特別是攻略類的回答,獨一份的事無巨細。就“北京一日游”這樣的旅游攻略類問題,達芬奇的回答是不是還挺地道的?對比其他AI助手,具體又貼地氣。 ▲提問“暑假去北京旅游,幫我安排一天行程,一定要地道”,達芬奇/元寶/豆包作答 小紅書的筆記從購物/旅游/美食/學習/考試/求職攻略等,到使用體驗、硬核干貨、軟件教程、讀書筆記、職場心得,甚至到求醫問藥,應有盡有,所以達芬奇對于攻略類的問題算是手到擒來。 不過,引導問題做得不太仔細,“推薦約會餐廳”是推薦全國范圍的,“Citywalk路線”默認回答上海的位置。達芬奇也還不能識別提問者的IP地址,以此作為回答前提。 但如果是面對“茶百道的哪一款奶茶最好”這樣的產品細化問題,在一眾AI助手中,小紅書-達芬奇就沒有明顯優勢了,而抖音-豆包的回答看上去最為專業。 ▲提問“茶百道的哪一款奶茶最好”,達芬奇/豆包/Kimi作答 另外,達芬奇對“最好的***”等問題比較謹慎,引用筆記偏向于“端水”,無一例外是多個產品/店家的合集筆記,沒有單條贊助內容,似乎是為了避免明顯地引流。有時回答不會按照指令來,比如推薦靜音鍵盤時,達芬奇跟我嘮起了小紅書上討論度更高的靜音軸體類別。可能是因為達芬奇照搬了下方推薦筆記的文案,而沒有很好地理解提問的語義。 ▲提問“2024最好看的一部電影”、“最好用的一把靜音鍵盤”、“家用3D打印機可以買嗎”等問題 我又突發奇想,想考驗一下小達如何處理“人情世故”。我問“花西子眉筆貴嗎”,達芬奇的回答出現了明顯錯誤和偏向。花西子眉筆的淘寶價格是40~100元/支,但達芬奇回答是6.9元/支,這出入太大了,達芬奇還引用了冷門并答非所問的筆記。重新生成之后,才給出沒有錯誤的答案。 小紅書是花西子近年重點合作營銷的平臺,看來達芬奇對小紅書合作品牌是開了后門的,回答有偏向。達芬奇自述是“內容偏向正面”,也有可能是這方面原因。 ▲達芬奇對于“花西子眉筆貴嗎”的回答,引用筆記中的7.5元/支眉筆是花西子山寨品牌,某一篇提到所購眉筆“可能不是正品”;還有一篇沒有提到該眉筆的價格? 當然,我不能老是問達芬奇一些它本來就很擅長的領域,當我問“歷史上有沒有完美犯罪”時,達芬奇的回答就比較潦草、空泛,沒有舉例。對于“姜萍事件”的問題,達芬奇沒有簡述新聞并明晰觀點。而微信-元寶對于上面兩個問題的回答會系統很多,也有對“完美犯罪”進行多個舉例。 ▲提問“如何評價姜萍事件”,達芬奇和元寶分別作答 最最翻車的是,對于“給我一首**的德國詩歌”這樣小紅書上存在大量優質筆記的問題,我分別提問了優美/悲傷/快樂的風格,達芬奇給我的3個回答都是同一首詩?!達芬奇太偷懶了! ▲提問給“我一首優美/悲傷/快樂的德國詩歌” 總體來說,小紅書AI的最大優勢就在于它的經驗是具體的,這在眾多AI助手中是獨一份的,但回答匹配度不太穩定。 / 02 / 內容沉淀好≠AI助手好,模型能力待提高 AI大模型的競爭打到了互聯網的各個角落,與別家做AI不同,小紅書做AI一直是“淡淡的”。其實小紅書還是暗暗下功夫,其AI功能除了大模型“小地瓜”,以及這幾天新上線的達芬奇,還有AI寵物、群聊AI智能體、AI生圖,搜搜薯(AI搜索)。 擁有好的內容沉淀永遠是王道,它可以為社區內容平臺的AI帶來強大的語料庫和知識庫。小紅書的模式類似于騰訊元寶和知乎知海圖,充分在整合站內UGC(用戶生成內容)的基礎上,生成提煉答案。 遺憾的是,小紅書的好內容卻沒有能賦能給達芬奇。達芬奇有時回答能力比較差,似乎是只做了RAG(檢索增強生成)且做得不太好,沒有做Agent(智能體)。 很多人沒意識到的是,小紅書也已經是一個非常深入的搜索引擎,無論關鍵詞多爛都能匹配到正確的內容,但這依舊沒能在達芬奇身上得到體現。無論你關鍵詞描述的多精準,達芬奇時常找到不匹配的筆記。達芬奇自述是通過學習權重高的帖子生成回答,實際體驗時,低贊藏筆記也能進入推薦位。 此外,從目前來看,類似違禁詞替代詞、奇怪的縮寫……這樣的垃圾數據問題也是達芬奇需要擔心的。由于回答不準確,達芬奇的生成結果還不能直接被復制形成筆記,甚至進行二創。另外,由于小紅書的內容本身夾雜著許多軟廣,達芬奇的數據還可能面臨著被稀釋的問題,可能有更多商家為了筆記推薦位而在小紅書上打廣告。 / 03 / 結語:小紅書做AI,潛力很大 與其他大模型相比,達芬奇在小紅書原生用戶中更具優勢。而如何能結合AI賦能內容社區,而不會破壞社區本身現有的內容生態,是擺在小紅書面前的一道難題。 小紅書上的圖片和視頻內容,都可以作為很好的數據融入AI大模型。 目前,小紅書是以美圖和視頻為主的內容平臺,而達芬奇僅能識別筆記文案,對于攜帶大量信息的圖片和視頻內容還不能理解,沒有能開發完全圖片與視頻內容產品的潛力,可能是因為地瓜大模型還沒有加入OCR(光學字符識別)、ACR (自動內容識別)技術。 有了公眾號內容的加持,騰訊元寶成了很多用戶的心頭好。小紅書坐擁小紅書大量優質短筆記內容,我們也期待隨著地瓜大模型進一步升級,能帶來體驗更成熟的達芬奇。 |
|