在國內(nèi)自主研發(fā)大模型的企業(yè)中 由清華大學(xué)計算機系知識工程實驗室 轉(zhuǎn)化而來的“智譜” 無疑是一抹亮眼的存在 其研發(fā)的大模型GLM-4 多項性能比肩大模型GPT-4 系列開源模型全球下載量超2000萬 是目前下載量和開源影響力 最高的國產(chǎn)大模型之一 從“實驗”走向“市場” “智譜”面向公眾上線 生成式視頻功能“清影” 具備視頻通話功能的軟件“清言” 將前沿的科學(xué)技術(shù)轉(zhuǎn)化成為 人人可用的AI助手 ![]() “智譜”公司的CEO 正是清華大學(xué)計算機系 1998級本科、2002級碩士校友 張鵬 讓我們一起走近 “報國清華人”系列報道 共同感受清華人在各行各業(yè) 服務(wù)國家和人民的拳拳報國志! 翻越技術(shù)的圍墻 “中國要有自己的預(yù)訓(xùn)練模型框架” 1998年 來自湖北的張鵬 考入清華大學(xué)計算機系 通過深度參與實驗室課題項目 他很快找到了自己的研究方向 “文本數(shù)據(jù)挖掘和語義分析” ![]() 爬山時的張鵬 在校期間 他先后發(fā)表10余篇頂會文章 設(shè)計了國內(nèi)首個 中英文平衡的跨語言知識圖譜系統(tǒng) 畢業(yè)后張鵬選擇加入 清華大學(xué)計算機系知識工程實驗室 繼續(xù)探索前沿科技 2006 年起 實驗室開始研究大數(shù)據(jù)挖掘與知識圖譜 孵化了 科技情報大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺 —— AMiner系統(tǒng) 隨著系統(tǒng)的不斷成熟 團隊開始考慮商業(yè)化 在2019年6月將AMiner單獨拆分出來 成立新公司“智譜” 2020年,Open AI發(fā)布 參數(shù)規(guī)模達1750億的GPT-3模型 吸引世界關(guān)注 在國外人工智能產(chǎn)品的沖擊下 “中國要有自己的預(yù)訓(xùn)練模型框架” 成為一種共識 ![]() 張鵬參加中國計算機大會 GPT、BERT、T5 都是西方科學(xué)家提出的底層技術(shù) 沿著已有路徑走無疑最省力 然而 “核心的技術(shù)是求不來也買不來的” 作為清華人 要為國家、民族和社會做點事情 想要掌握前沿領(lǐng)域的先進技術(shù) 有些圍墻必須越過 張鵬和團隊成員走上了 艱難但可靠的自主研發(fā)道路 在大語言模型(LLM)浪潮中 團隊驚喜地發(fā)現(xiàn) 自研的預(yù)訓(xùn)練框架——GLM 對人類輸入意圖以及一些常識 或者知識類信息理解能力 有著意想不到的表現(xiàn) 打破國外壟斷 實現(xiàn)“彎道超車”有了希望 團隊當即決定 投身到GLM預(yù)訓(xùn)練框架研發(fā)中 訓(xùn)練成本高、人力投入大、過程不穩(wěn)定 面對行業(yè)公認的難題 張鵬認為 “雖然局面復(fù)雜困難 但我們想做一些自己的事情” 通過不斷對算法優(yōu)化、量化 在保證精度和推理速度情況下 1300億參數(shù)規(guī)模的雙語預(yù)訓(xùn)練模型 GLM-130B 最終運行成本降低75% 同時 堅持自主研究 還帶來適配國產(chǎn)化硬件的優(yōu)勢 從源頭杜絕信息泄露的可能 為國內(nèi)信息安全上了一把“安全鎖” 2022年11月 斯坦福大學(xué)大模型中心 對全球30個主流大模型進行全方位評測 團隊研發(fā)的GLM-130B 作為亞洲唯一入選的大模型 在魯棒性、校準誤差和無偏性方面 取得了亮眼的成績 “在同等或更小規(guī)模上 我們能達到世界頂尖水平 甚至在某些指標上更為領(lǐng)先” 張鵬介紹 AI大模型飛入尋常百姓家 “我們的技術(shù)要去解決一些實際的問題” 在清華大學(xué)計算機系 “貫天、接地、通心、樹人”理念影響下 張鵬對“科技服務(wù)于人” 有著深刻理解 北京2022年冬奧會吸引著世界目光 冰上運動隨之走入千家萬戶 各種專業(yè)術(shù)語 和新聞主播200余字/分鐘的語速 總讓手語老師“手忙腳亂” 如何更好地滿足 聽障朋友了解比賽需求? 此刻 正是“大模型”在社會服務(wù)方面 發(fā)揮作用的關(guān)鍵時刻 ![]() 團隊研發(fā)的手語播報數(shù)字人 通過“大模型”理解音頻語義 利用語義蒸餾模型、手語翻譯模型 團隊將語音轉(zhuǎn)化為手語 結(jié)合肌肉綁定技術(shù)驅(qū)動實現(xiàn)面部采集 最后 出現(xiàn)在北京衛(wèi)視舞臺上的數(shù)字人 以流暢自然的手語翻譯 為千千萬萬聽障朋友 帶來高效、精準的實時解說 北京2022年冬奧會圓滿結(jié)束 “翻譯官”卻沒有“下班” 扎實的技術(shù)帶來長久效應(yīng) 團隊研發(fā)的手語播報數(shù)字人 至今活躍在電視臺、網(wǎng)絡(luò)平臺 景區(qū)與公共服務(wù)廳 持續(xù)為聽障朋友們提供無障礙服務(wù) 前進!邁向通用人工智能 “讓機器像人一樣思考” 科技的世界你追我趕 先進的技術(shù)迭代升級 2023年8月31日 基于ChatGLM研發(fā)的產(chǎn)品 “智譜清言”上線 為用戶實時提供 通用問答、虛擬對話、代碼生成 創(chuàng)意寫作等多方面服務(wù) 前沿科學(xué)技術(shù) 成為人人可用的AI助手 2024年1月16日 團隊發(fā)布新一代基座大模型GLM-4 與上一代相比 GLM-4有著更為亮眼的數(shù)據(jù) 性能全面提升60% 達到比肩GPT-4的水平 升級之后的大模型 能夠根據(jù)用戶意圖理解、規(guī)劃復(fù)雜指令 自主調(diào)用網(wǎng)頁瀏覽器 Code Interpreter代碼解釋器 文生圖CogView3模型等 工具完成復(fù)雜任務(wù) 單次處理的文本達300頁 ![]() ![]() “清影”生成的視頻動圖 2024年7月 “智譜”上線生成式視頻功能“清影” 僅需一段話,或一張圖 30秒就能自主生成 一段1440×960清晰度的高質(zhì)量視頻 “智譜清言”面向所有用戶開放 ![]() 視頻通話功能在辦公場景的應(yīng)用 2024年8月30日 “智譜清言”再次進行重大升級 上線了國內(nèi)首個 面向客戶端開放的視頻通話功能 用戶只需打開視頻通話界面 便能享受到 如同與AI“面對面”的交流體驗 智譜大模型實現(xiàn)了 從語言文字、圖片 再到視頻的模態(tài)跨越 面向人工智能國際先進水平的模型矩陣 初具規(guī)模 “讓機器像人一樣思考” 在技術(shù)進步中探索未來的無限可能 人工智能在解放生產(chǎn)力同時 也為科技創(chuàng)新留下了更多發(fā)展空間 從將清華實驗室研究成果轉(zhuǎn)化 到百億、千億模型發(fā)布 再到細分領(lǐng)域AICG模型 及產(chǎn)品矩陣搭建 腳踏實地 致力于產(chǎn)品研發(fā)升級 張鵬和團隊每一步都走得穩(wěn)扎穩(wěn)打 ![]() 張鵬 “未來,大模型能幫大家做很多事情” 在張鵬和團隊的夢想中 大模型之后 是實現(xiàn)通用人工智能的最終目標 圍墻之外的探索還在繼續(xù) 新的路徑將會通往何方? 通用人工智能的愿景何時能夠?qū)崿F(xiàn)? 清華人張鵬和智譜團隊 繼續(xù)步履不停 在一步步探索前進中尋找答案 更多報國清華人的成長故事 我們將繼續(xù)為你講述…… |
|