DeepSeek今日(8月21日)宣布,正式發(fā)布DeepSeek-V3.1。
本次升級(jí)包含以下主要變化:
混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案;
更強(qiáng)的 Agent 能力:通過 Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
目前,官方App與網(wǎng)頁(yè)端模型已同步升級(jí)為DeepSeek-V3.1。用戶可以通過“深度思考”按鈕,實(shí)現(xiàn)思考模式與非思考模式的自由切換。
DeepSeek API也已同步升級(jí),deepseek-chat對(duì)應(yīng)非思考模式,deepseek-reasoner對(duì)應(yīng)思考模式,且上下文均已擴(kuò)展為128K。同時(shí),API Beta接口支持strict模式的Function Calling,以確保輸出的Function滿足schema定義。
DeepSeek表示,DeepSeek-V3.1在多項(xiàng)搜索評(píng)測(cè)指標(biāo)上取得了較大提升。在需要多步推理的復(fù)雜搜索測(cè)試(browsecomp)與多學(xué)科專家級(jí)難題測(cè)試(HLE)上,DeepSeek-V3.1性能已大幅領(lǐng)先R1-0528。
需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。另外,V3.1對(duì)分詞器及chat template進(jìn)行了較大調(diào)整,與DeepSeek-V3存在明顯差異。
盤面上,DeepSeek概念股每日互動(dòng)尾盤直線拉升。
綜合自:DeepSeek、行情
校對(duì):冉燕青