悶聲干大事!DeepSeek悄然發(fā)布V3新版本。
沒(méi)有發(fā)布會(huì),沒(méi)有媒體宣傳,3月24日晚間,DeepSeek就這樣“悄悄地”將其最新版V3-0324模型
根據(jù)社區(qū)測(cè)試和分析,此次更新雖然不是全新一代模型,僅屬于“小版本升級(jí)”,但其編程能力已達(dá)到與Claude 3.7 Sonnet相當(dāng)?shù)乃剑谀承y(cè)試場(chǎng)景中甚至表現(xiàn)更佳。
有網(wǎng)友表示,新版V3較上一代來(lái)說(shuō),相當(dāng)于Sonnet 3.6之于Sonnet 3.5的飛躍。
還有網(wǎng)友指出,新版V3模型的編碼能力完全超預(yù)期,堪稱目前最強(qiáng)大的免費(fèi)AI模型。
展開(kāi)全文
負(fù)載均衡策略:更高效的Moe架構(gòu)
為解決傳統(tǒng)MoE模型中的負(fù)載不均衡問(wèn)題,DeepSeek團(tuán)隊(duì)引入了創(chuàng)新性的“偏差項(xiàng)”機(jī)制,旨在幫助V3在訓(xùn)練過(guò)程中有效平衡專家負(fù)載,提升模型性能。
此外,V3還采用了節(jié)點(diǎn)受限的路由機(jī)制,以減少跨節(jié)點(diǎn)通信開(kāi)銷,提高訓(xùn)練效率,這對(duì)于大規(guī)模分布式訓(xùn)練至關(guān)重要。
這些技術(shù)創(chuàng)新使得新版V3在推理速度上實(shí)現(xiàn)了顯著提升,使V3能在保持高效計(jì)算的同時(shí),擴(kuò)展到更多節(jié)點(diǎn)和專家。
編程能力再進(jìn)化:一個(gè)提示詞生成完整前端頁(yè)面
根據(jù)國(guó)外開(kāi)源評(píng)測(cè)平臺(tái)kcores-llm-arena的最新測(cè)試數(shù)據(jù),V3-0324的代碼能力達(dá)到了328.3分,超過(guò)了普通版的Claude 3.7 Sonnet(322.3分),接近思維鏈版本的334.8分。
這一成績(jī)意味著,新版V3已成為目前編程能力最強(qiáng)的開(kāi)源模型之一。
實(shí)際測(cè)試中,用戶用一個(gè)簡(jiǎn)單的提示詞就讓V3-0324生成了整個(gè)登錄頁(yè)面。
還有用戶直觀地指出,只是點(diǎn)了兩次“continue”,看看生成的代碼量有多恐怖!
再加上不限時(shí)、完全免費(fèi)的“殺手锏”,可以說(shuō)在前端開(kāi)發(fā)層面,新版V3已經(jīng)打敗了OpenAI的o1-pro和GPT-4.5。
新版V3的審美也很在線,用戶用,新版V3的設(shè)計(jì)明顯比上一版要好看得多。
根據(jù)prompt:“寫(xiě)一個(gè)精美的落地頁(yè),內(nèi)容是deepseek v3發(fā)布”,這是上一版V3生成的網(wǎng)頁(yè):
新版V3的落地頁(yè)則是這樣:
開(kāi)源協(xié)議升級(jí):商業(yè)應(yīng)用門檻大幅降低
不僅技術(shù)能力提升,DeepSeek還將V3-0324的開(kāi)源許可與R1一樣更新為MIT開(kāi)源許可,這意味著新版V3有著比初代V3更寬松的開(kāi)源使用條件。
公開(kāi)資料顯示,MIT許可以商業(yè)友好著稱,使用該許可的項(xiàng)目可以與商業(yè)和專有軟件自由集成。
這一變化對(duì)希望在商業(yè)項(xiàng)目中應(yīng)用高性能AI模型的開(kāi)發(fā)者和公司來(lái)說(shuō),可能是本次更新最具戰(zhàn)略意義的改變。它進(jìn)一步降低了AI技術(shù)的使用門檻,加速了技術(shù)普惠進(jìn)程。
開(kāi)源浪潮涌動(dòng),商業(yè)模型“瑟瑟發(fā)抖”
DeepSeek V3-0324的出現(xiàn)表明,開(kāi)源AI模型正在以驚人的速度追趕甚至在某些方面超越頂級(jí)閉源商業(yè)模型。這種趨勢(shì)正在給OpenAI、Anthropic等商業(yè)AI公司帶來(lái)前所未有的壓力。
正如海外用戶所評(píng)論的:“很高興看到這些開(kāi)源模型繼續(xù)給大公司施壓,促使它們以更低的成本構(gòu)建更好的模型。”
隨著DeepSeek這樣的開(kāi)源模型不斷提升性能并放寬使用條件,AI技術(shù)的民主化和普惠化進(jìn)程正在加速,一個(gè)更加開(kāi)放、創(chuàng)新的AI生態(tài)系統(tǒng)正在形成。
網(wǎng)友不禁感嘆:DeepSeek簡(jiǎn)直讓科技普惠成為現(xiàn)實(shí)!
還有網(wǎng)友大膽猜測(cè):新版V3來(lái)了,R2還會(huì)遠(yuǎn)嗎?
評(píng)論