热久久免费精品视频,午夜激情福利,国产精品午夜免费福利视频,99热在线精品免费播放6,免费无码一级成年片,超碰在线播放黄片,亚洲视频欧洲视频日本视频

【中原計算機】人工智能專題:后R1時代,DeepSeek發(fā)展的三大階段

焦點2025-11-30 21:47:46741

報告正文

DeepSeek在年初發(fā)布了R1以后,中原展受到了各界普遍關(guān)注。計算機人后續(xù)來看,工智DeepSeek并沒有如期發(fā)布更先進(jìn)的題后模型R2,而是代D大階段在進(jìn)行更多小版本的更新?lián)Q代。結(jié)合每個階段的中原展發(fā)展重點,我們將其劃分為3個主要的計算機人發(fā)展階段。

1. 階段一:性能提升

DeepSeek在3月推出的工智V3-0324和5月推出的R1-0528,還是題后以基礎(chǔ)模型DeepSeek-V3-Base為基座,通過后訓(xùn)練實現(xiàn)了模型能力的代D大階段提升,彌補了和頭部模型之間的中原展差距。

2. 階段二:實現(xiàn)混合推理架構(gòu)、計算機人Agent能力提升、工智與國產(chǎn)芯片協(xié)同優(yōu)化

從8月以后,題后DeepSeek也順應(yīng)了海外混合推理架構(gòu)和Agent能力提升的代D大階段大趨勢,推出了V3.1和V3.1-Terminus。這次升級中,DeepSeek的基座模型DeepSeek-V3.1-Base在DeepSeek-V3-Base基礎(chǔ)上做了大規(guī)模外擴訓(xùn)練,Agent能力有了較大提升,思考效率也有提升。

8月21日,Deep在發(fā)布V3.1的同時,也宣布了在國產(chǎn)芯片適配方面的新進(jìn)展。V3.1采用UE8M0 FP8縮放格式訓(xùn)練,為對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。

此前,國內(nèi)芯片企業(yè)僅有較少支持了FP8數(shù)據(jù)格式,多數(shù)芯片僅能支持FP16格式。FP8雖然可以提升計算速度和降低存儲需求,但是由于計算精度不高,容易損失數(shù)據(jù)信息,所以V3以前的大模型訓(xùn)練中多會選用BF16或FP32/TF32精度進(jìn)行數(shù)據(jù)計算和存儲。DeepSeek是首個在開源超大規(guī)模大模型中成功落地FP8混合精度訓(xùn)練的公司,推動了FP8技術(shù)的規(guī)?;瘧?yīng)用,也極大地提升了市場對H20等支持FP8格式芯片的需求。

UE8M0 FP8是對FP8格式的深度優(yōu)化。該格式僅表示非負(fù)數(shù)(U代表Unisigned,無符號),尾數(shù)位為0(M0,尾數(shù)位為0),8個比特全部用來表示指數(shù)(E8,指數(shù)位占8位),Scale通過對數(shù)據(jù)進(jìn)行分塊縮放,保持其能夠在FP8表示的范圍內(nèi)。UE8M0 FP8作為FP8格式的變體,通過減少數(shù)據(jù)存儲和傳輸?shù)膿p耗,能最大限度利用硬件計算能力,彌補國產(chǎn)芯片在HBM等高速內(nèi)存帶寬方面的不足,從而實現(xiàn)國產(chǎn)大模型和國產(chǎn)芯片協(xié)同設(shè)計的優(yōu)化,對于國產(chǎn)化芯片的應(yīng)用起到積極的推動作用。

3. 階段三:提效降價,國產(chǎn)適配加速

9月發(fā)布的V3.2-Exp,基于V3.1-Terminus構(gòu)建,引入了新的注意力機制DSA,在保持模型性能的穩(wěn)定的同時,在訓(xùn)練推理效率方面有了較大的提升,帶來了模型較大幅度的降價。

對比R1來看,V3.2-Exp的輸入緩存命中時價格為R1的20%(0.2元/百萬Tokens),輸入緩存未命中時價格為R1的50%(2元/百萬Tokens),輸出價格為R1的19%(3元/百萬Tokens),降幅最為明顯。

考慮到當(dāng)前大模型之間能力差距在縮小,成本的下降意味著模型具有更好的性價比和可推廣性,也將促進(jìn)應(yīng)用端實現(xiàn)更多功能的落地。

在國產(chǎn)適配方面進(jìn)度明顯加快。在V3.2-Exp發(fā)布的當(dāng)天,國產(chǎn)芯片華為昇騰和寒武紀(jì)同步宣布完成對V3.2-Exp的零日適配。這是繼V3.1采用UE8M0 FP8實現(xiàn)國產(chǎn)大模型和芯片協(xié)同設(shè)計的優(yōu)化以后,國產(chǎn)AI產(chǎn)業(yè)從“單點突破”邁向“系統(tǒng)協(xié)同”的又一個標(biāo)志性事件。

同時值得注意的是DeepSeek還同時開源TileLang和CUDA兩個版本的算子。TileLang是一種采用類Python語法的領(lǐng)域?qū)S谜Z言(DSL),于2025年1月由北大計算機學(xué)院楊智團隊開源,旨在實現(xiàn)硬件調(diào)度與開發(fā)者算法邏輯的解耦,從而降低GPU編程的技術(shù)門檻,同時通過分層設(shè)計來實現(xiàn)不同技術(shù)背景開發(fā)者,從簡單上手到深度優(yōu)化的不同需求。由于TileLang可以實現(xiàn)對不同硬件平臺的支撐,極大地改善了國產(chǎn)卡目前所面對的CUDA帶來的生態(tài)壁壘問題。

DeepSeek選用TileLang這個新興AI編程語言,再次體現(xiàn)了其強大的創(chuàng)新精神,同時為國產(chǎn)大模型軟硬件生態(tài)建立起到了極大的推動作用。

4. 風(fēng)險提示

國際形勢變化。

證券分析師承諾:

本報告署名分析師具有中國證券業(yè)協(xié)會授予的證券分析師執(zhí)業(yè)資格,本人任職符合監(jiān)管機構(gòu)相關(guān)合規(guī)要求。本人基于認(rèn)真審慎的職業(yè)態(tài)度、專業(yè)嚴(yán)謹(jǐn)?shù)难芯糠椒ㄅc分析邏輯,獨立、客觀的制作本報告。本報告準(zhǔn)確的反映了本人的研究觀點,本人對報告內(nèi)容和觀點負(fù)責(zé),保證報告信息來源合法合規(guī)。

重要聲明:

本文地址:http://m.818618.com/html/47b19199761.html
版權(quán)聲明

本文僅代表作者觀點,不代表本站立場。
本文系作者授權(quán)發(fā)表,未經(jīng)許可,不得轉(zhuǎn)載。

全站熱門

周日足彩傷停:皇馬門神出戰(zhàn)成疑 狼堡傷情嚴(yán)重

嘉環(huán)科技股份有限公司關(guān)于公司銀行募集資金賬戶部分資金被凍結(jié)的公告

難撕關(guān)聯(lián)標(biāo)簽 視涯科技沖擊科創(chuàng)板

西安奕斯偉材料科技股份有限公司首次公開發(fā)行股票科創(chuàng)板上市公告書提示性公告

樂弈場第16屆月賽如期而至 張弘弢榮獲雙冠王

世界衛(wèi)生組織:進(jìn)入加沙的物資遠(yuǎn)遠(yuǎn)不夠

以軍襲擊黎巴嫩東部和北部 致2人死亡

金誠信礦業(yè)管理股份有限公司關(guān)于“金誠轉(zhuǎn)債”可能滿足贖回條件的提示性公告

友情鏈接