久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    DeepSeek-V3.1 發(fā)布,邁向 Agent 時(shí)代的第一步

     積沙成塔0u3svg 2025-08-21 發(fā)布于天津

    今天,我們正式發(fā)布 DeepSeek-V3.1。本次升級(jí)包含以下主要變化:

    • 混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;

    • 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案;

    • 更強(qiáng)的 Agent 能力:通過(guò) Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。

      官方 App 與網(wǎng)頁(yè)端模型已同步升級(jí)為 DeepSeek-V3.1。用戶可以通過(guò)“深度思考”按鈕,實(shí)現(xiàn)思考模式與非思考模式的自由切換。

      DeepSeek API 也已同步升級(jí),deepseek-chat 對(duì)應(yīng)非思考模式deepseek-reasoner 對(duì)應(yīng)思考模式且上下文均已擴(kuò)展為 128K。同時(shí),API Beta 接口支持了 strict 模式的 Function Calling,以確保輸出的 Function 滿足 schema 定義。(詳見(jiàn)官方文檔:https://api-docs./zh-cn/guides/function_calling

      另外,我們?cè)黾恿藢?duì) Anthropic API 格式的支持,讓大家可以輕松將 DeepSeek-V3.1 的能力接入 Claude Code 框架。(詳見(jiàn)官方文檔:https://api-docs./zh-cn/guides/anthropic_api

      工具調(diào)用/智能體支持增強(qiáng)

      編程智能體

      圖片

      表 1:編程智能體測(cè)評(píng)(SWE 使用內(nèi)部框架測(cè)評(píng),相比開(kāi)源框架 OpenHands 所需輪數(shù)更少;Terminal Bench 使用官方 Terminus 1 framework

      在代碼修復(fù)測(cè)評(píng) SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測(cè)試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。

      搜索智能體

      圖片

      表 2:搜索智能體測(cè)評(píng)(測(cè)試結(jié)果調(diào)用商用搜索引擎 API+網(wǎng)頁(yè)過(guò)濾+128K context window;R1-0528 使用內(nèi)部 workflow 模式測(cè)試;HLE 測(cè)試同時(shí)使用 python 與 search 工具)

      DeepSeek-V3.1 在多項(xiàng)搜索評(píng)測(cè)指標(biāo)上取得了較大提升。在需要多步推理的復(fù)雜搜索測(cè)試(browsecomp)與多學(xué)科專家級(jí)難題測(cè)試(HLE)上,DeepSeek-V3.1 性能已大幅領(lǐng)先 R1-0528。

      思考效率提升

      我們的測(cè)試結(jié)果顯示,經(jīng)過(guò)思維鏈壓縮訓(xùn)練后,V3.1-Think 在輸出 token 數(shù)減少 20%-50% 的情況下,各項(xiàng)任務(wù)的平均表現(xiàn)與 R1-0528 持平。

      圖片

      在各項(xiàng)評(píng)測(cè)指標(biāo)得分基本持平的情況下(AIME 2025: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 與 V3.1-Think 的 token 消耗量對(duì)比圖

      同時(shí),V3.1 在非思考模式下的輸出長(zhǎng)度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能夠在輸出長(zhǎng)度明顯減少的情況下保持相同的模型性能。

      API & 模型開(kāi)源

      模型開(kāi)源

      V3.1的 Base 模型在 V3 的基礎(chǔ)上重新做了外擴(kuò)訓(xùn)練,一共增加訓(xùn)練了 840B tokens。Base 模型與后訓(xùn)練模型均已在 Huggingface 與魔搭開(kāi)源。

      Base 模型:

      • Hugging Face:

        https:///deepseek-ai/DeepSeek-V3.1-Base

      • 魔搭:

        https:///models/deepseek-ai/DeepSeek-V3.1-Base

      后訓(xùn)練模型:

      • Hugging Face: 

        https:///deepseek-ai/DeepSeek-V3.1

      • 魔搭:

        https:///models/deepseek-ai/DeepSeek-V3.1

      需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。另外,V3.1 對(duì)分詞器及 chat template 進(jìn)行了較大調(diào)整,與 DeepSeek-V3 存在明顯差異。建議有部署需求的用戶仔細(xì)閱讀新版說(shuō)明文檔。

      價(jià)格調(diào)整

      我們將于北京時(shí)間 2025 年 9 月 6 日凌晨,對(duì) DeepSeek 開(kāi)放平臺(tái) API 接口調(diào)用價(jià)格進(jìn)行如下調(diào)整:

        • 執(zhí)行新版價(jià)格表(如下圖所示,詳見(jiàn)定價(jià)頁(yè)面);

        圖片

        在 9 月 6 日前,所有 API 服務(wù)仍按原價(jià)格政策計(jì)費(fèi),您可繼續(xù)享受當(dāng)前優(yōu)惠。

        同時(shí),為更好地滿足用戶的調(diào)用需求,我們已進(jìn)一步擴(kuò)容 API 服務(wù)資源,歡迎使用!

          本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
          轉(zhuǎn)藏 分享 獻(xiàn)花(0

          0條評(píng)論

          發(fā)表

          請(qǐng)遵守用戶 評(píng)論公約

          類似文章 更多

          主站蜘蛛池模板: 人妻综合专区第一页| 亚洲精品无码永久在线观看你懂的| 久久丫精品国产亚洲AV| 99热精国产这里只有精品| 偷炮少妇宾馆半推半就激情| 亚洲精品国产免费av| 国产福利深夜在线观看| 邻居少妇张开腿让我爽了一夜| 无码高潮爽到爆的喷水视频| 777米奇色狠狠俺去啦| 欧美亚洲一区二区三区| 伊人久久大香线蕉AV网禁呦| 色综合AV综合无码综合网站| 丁香五月婷激情综合第九色| 亚洲精品爆乳一区二区H| 成人又黄又爽又色的视频| 红杏亚洲影院一区二区三区| 国产成AV人片久青草影院| 亚洲国产成人精品女人久久久| 国产睡熟迷奷系列网站| 无码高潮爽到爆的喷水视频 | 成人午夜福利视频镇东影视| 国产在线午夜不卡精品影院| 鲁鲁网亚洲站内射污| 疯狂做受XXXX高潮国产| 欧美人和黑人牲交网站上线| 无码人妻丝袜在线视频红杏| 欧美日韩精品一区二区三区高清视频| 性动态图AV无码专区| 在线高清免费不卡全码| 亚洲AV无码一区二区三区在线播放 | 不卡国产一区二区三区| 人人爽人人片人人片AV| 国内少妇偷人精品免费| www久久只有这里有精品| 鲁丝一区二区三区免费| 国产成人8X人网站视频| 凹凸在线无码免费视频| 亚洲AV综合色区无码一区| 97精品亚成在人线免视频| 一区二区不卡国产精品|