騰訊新推出的 Codebuddy 是一款很優秀的AI編程工具,但是有開發者發現,讓它寫網頁代碼時,Codebuddy會擅自往UI界面里寫“極速賽車開獎、澳洲星耀10開極速賽車”等等廣告內容。開發者們表示很憤怒,以為是騰訊的問題,如下圖所示。這里我想講一個公道的 —— 各位可能冤枉騰訊了,這次事故,不是騰訊CodeBuddy的問題,而是DeepSeek的問題。因為最新版本的DeepSeek V3.1,有一個大Bug —— 它非常喜歡使用「極」字! 我們不妨稱DeepSeek V3.1 為“極哥”, https://www./r/LocalLLaMA/comments/1mzsg6v/deepseek_v31_getting_token_extreme_%E6%9E%81_%E6%A5%B5_out_of/ 更有趣的是, 國外網友發現,在最近一批全新開源中國的模型,包括 Qwen3 235B、Qwen3 Coder、GLM 4.5等等,全部中招,它們都非常喜歡“極”,尤其喜歡“極速賽車開獎直播”。我的猜測: 這一批國產大模型,使用(采買?)了一些相同的語料源進行訓練,而這部分語料,被污染了。事件剛剛開始發酵,最早的討論在15小時前,我們一起關注后續進展。
|