久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    百度文心一言:中文識別真能碾壓ChatGPT?

     雷科技 2023-03-17 發布于廣東

    來 源:雷科技互聯網組

    編 輯:冬日果醬

    排 版:LIN

    過去幾個月,ChatGPT 掀起的浪潮一刻也沒有停歇,包括國內大量公司和科技從業者在興奮于 ChatGPT 出現的同時,也在期待中國自己的 ChatGPT。在所有宣稱將要推出類 ChatGPT 產品或大語言模型的公司中,百度是最早官宣的一批,也是第一個選擇正式發布的公司。
    3 月 16 日,就在 GPT-4 重磅升級的兩天后,百度如期在北京總部正式發布了旗下大語言模型——文心一言。發布會現場,百度創始人兼李彥宏展示了文心一言在文學創作、商業文案、數理邏輯推算、中文理解和多模態生成五個方面的能力。

    圖/百度
    不過根據李彥宏的說法,由于生成式需要輸入較長的文本和時間,不適合在現場實機演示,故而選擇用錄屏形式展示文心一言的生成效果。坦白講,作為一場商業產品發布會,可以理解,畢竟一旦出錯將會極大影響外界的看法和股價,谷歌此前推出生成式 AI 聊天機器人 Bard 時就因為一個「答非所問」的錯誤:市值蒸發了上千億美元。
    但也要承認,錄屏的發布形式始終也讓這場產品發布會顯得有些空洞——誰也不知道錄屏背后會有多少次嘗試和人工痕跡,所以才有人調侃百度發布了 ChatPPT。反饋到股市上,文心一言不僅沒有抬升百度股價,甚至在發布后一度跌超 10%。
    李彥宏在發布會上也提到,文心一言并不完美,但市場有需求就必須要推出來。然而并沒有準備好的文心一言,是否選對發布時間和節奏,目前仍未可知。但盡管如此,還是能從這場發布會的內容中一窺文心一言的面貌,以及百度的野心與困境。

    文心一言距離 ChatGPT 有多遠?

    根據發布會上的視頻展示,文心一言面向大眾用戶的交互界面基本與 ChatGPT 類似,都以對話機器人形式回應用戶的文本輸入。

    圖/百度
    但文心一言并沒有像兩天前發布的 GPT-4 一樣支持對圖片信息的總結和分析——讀圖、識圖,甚至懂梗圖,OpenAI 就將去年的一張梗圖輸入并附上文字要求 GPT-4 解釋笑點,結果 GPT-4 準確地指出了「梗」是「將過時的巨大 VGA 接口插入現代的小巧智能手機的反差」。

    圖/OpenAI
    不同的是,文心一言支持了語音和視頻的輸出。「語音」支持只是通過 TTS 語音合成技術以四川話讀出文本內容,并不值得一提,但「視頻」生成的難度明顯更高。僅從錄屏展示來看,盡管模板痕跡明顯,但生成視頻(視頻素材+字幕)至少還是可堪一用。
    而具體文本理解和生成能力上,百度在第一個「文學創作」環節展示了文心一言的續寫《三體》的創意能力,比如續寫可以從哪些角度出發:

    圖/百度
    這些回答本身不存在對錯,但如果我們對比下 ChatGPT 的回答,一定程度上能發現文心一言的文本輸出更「泛泛而談」,ChatGPT 的輸出會更加具體:

    圖/ChatGPT
    此外,百度在「商業文案」環節展示了如何用文心一言起公司名,我們也以同樣的問題詢問了 ChatGPT:

    圖/百度

    圖/ChatGPT
    一個值得注意的問題是,如果不強調中文名,ChatGPT 會自然傾向使用英文名。
    就像我們在之前的文章中提到的,OpenAI 在訓練 GPT-3.5 和 GPT-4 大語言模型時的語料庫、基準測試和開發人員都是以英文為主,所以 ChatGPT 在英文的理解和生成能力勝過包括中文在內的其他語言。
    這也是百度的優勢所在。

    百度可能更懂中文

    盡管在整體能力上,很難期待百度一躍超過 ChatGPT 和 OpenAI,但百度文心一言相比 ChatGPT 在中文信息的可靠性上可能會有一定優勢。除了上面提到的語言傾向問題,ChatGPT 不論是 GPT-3.5 還是 GPT-4 版本,訓練用語料庫都截止于 2021 年 9 月,在涉及很多未知信息時容易編造內容,比如在介紹電視劇《三體》演員陣容時再次「胡編亂造」:

    圖/ChatGPT
    相較之下,百度文心一言和微軟 Bing Chat 都正確指出了具體的演員陣容,Bing Chat 還提醒了我們另一個 Netflix 版本的電視劇《三體》。
    發布會上,李彥宏表示,百度和文心一言更懂中文和中國市場,甚至單獨在五個環節中設置了「中文理解」的環節來展示。以百度官方演示的「洛陽紙貴」為例,ChatGPT 再次出現了「幻覺」,文心一言和 Bing Chat 基本指出了正確典故,但接下來只有文心一言正面回答了「當時洛陽的紙到底有多貴」:

    圖/百度
    當然,考慮百度選定的問題以及錄屏的形式,還很難就此斷定「文心一言在中文上比 ChatGPT(GPT-3.5)更強」,但可以肯定的是,「中文」的優勢一定是百度乃至未來中國類 ChatGPT 產品發力的重中之重。
    而同時百度也展示了自身在行業應用上的優勢。李彥宏引用百度在人工智能上的四層架構——(AI)芯片層、(深度學習)框架層、模型層、應用層時談到,百度的多層架構協同效應將推動 AI 實現更快的迭代速度,以及在應用上也會有更高的效率和成本。
    文心一言主要分為兩部分,一部分是面向普通用戶,通過嵌入百度搜索,用戶可以直接與文心一言大語言模型交互,預計類似微軟的 Bing 搜索和 Chat 的形式;另一部分面向企業客戶,提供上述提到的四層人工智能全棧能力,從底層的云計算能力到深度學習框架,再到大模型和應用。

    圖/百度
    但最終百度還是在用戶側證明文心一言的表現實力,否則從合作伙伴到客戶到頭來只會放棄百度。

    百度必須擁抱 ChatGPT

    我們高估了 ChatGPT 的意義嗎?比爾·蓋茨將其比作互聯網的誕生,微軟 CEO 納德拉說它堪比工業革命,英偉達 CEO 黃仁勛稱其為 AI 的「iPhone 時刻」。
    我相信,但好像也無法篤定未來一定屬于類似 ChatGPT 的產品,不過可以肯定的是,ChatGPT 將改變搜索引擎的產品形態和業務模式。在這一點上,去年廣告收入(包括搜索廣告收入)占比分別為 60%和 77%的百度、谷歌都一樣,必須面對 ChatGPT 帶來的沖擊和變革。
    另一方面,百度和谷歌在很早就率先擁抱了 AI 技術,并在長達十年的時間跨度上重金投入研發。百度在 2022 年將全年核心收入的 22.4%,即 214.16 億元投入了核心研發,而據歐盟委員會發布的報告,谷歌在 2022 年更是投入了 279 億歐元研發經費,居全球第一。
    但在 ChatGPT 之前,龐大的研發積累始終沒有找到合適的商業化出口,頗有些「英雄無用武之地」。
    ChatGPT 帶來的突破確實帶來了出口,或者說風口。當用戶、開發者和企業客戶都在擁抱 ChatGPT,百度不可能放棄,就像李彥宏說的,文心一言沒有準備好卻還是要發,是因為有市場需求。
    題圖來自百度

      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: A级大胆欧美人体大胆666| 国产精品无码久久综合网| 12裸体自慰免费观看网站| 国产精品久久久久7777| 翘臀少妇被扒开屁股日出水爆乳| 国产综合色产在线视频欧美| 一本一道色欲综合网中文字幕| 精品中文人妻在线不卡| 久久99精品久久久久久齐齐| 国产中文字幕精品视频| 鲁丝一区二区三区免费| 草草浮力影院| 日本中文字幕亚洲乱码| 国产亚洲一二三区精品| 亚洲欧美成人一区二区在线电影| 在线中文字幕国产一区| 人人妻人人澡人人爽人人精品电影| 国产精品久久露脸蜜臀| 久久久亚洲AV波多野结衣| 午夜福利精品国产二区| 成人免费一区二区三区| 成人网站网址导航| 亚洲AV永久无码精品三区在线| 国产迷姦播放在线观看| 中文字幕乱码一区二区免费| 国内自拍视频一区二区三区| 国产一区二区不卡自拍| 亚洲乱码在线卡一卡二卡新区| 狠狠爱五月丁香亚洲综| 国产午夜影视大全免费观看| 无码AV无码天堂资源网影音先锋| 在线 欧美 中文 亚洲 精品| 亚洲AV无码乱码在线观看牲色| 亚洲精品色无码AV试看| 日韩有码中文字幕国产| 99国产成人综合久久精品| 伊人色综合久久天天小片| 国产成AV人片久青草影院| 99亚洲男女激情在线观看| 日本公与熄乱理在线播放| 中文字字幕在线乱码视频|