星期四, 11 12 月

被禁還是買 DeepSeek 傳用輝達 Blackwell 打造新模型、最快農曆年前推出

The Information引述知情人士報導,中國大陸人工智慧(AI)新創DeepSeek,正使用數千顆美國禁止輸往大陸的輝達Blackwell晶片,打造下一款大型模型。這些最新的輝達晶片,將助DeepSeek在國內和全球的AI競賽中保持競爭力。

根據報導,DeepSeek已透過一套複雜的走私流程,取得這些先進晶片,部分員工希望能在明年2月的農曆春節前推出下一代模型。不過,知情人士表示,DeepSeek創辦人梁文峰比較重視效能,因此沒有硬性規定新模型的截止日期。

這套走私流程包含先將晶片運往獲准購買這些晶片國家的資料中心,再拆解含有這些晶片的伺服器,並將設備拆解後進口至大陸。DeepSeek可向一家或多家大陸資料中心公司取得這些晶片。

報導指出,DeepSeek今年1月憑藉其R1深度推理模型一舉成名後,至今都只對現有模型進行小幅升級,尚未推出過全新模型。一個可能原因是該公司採用一種名為「稀疏注意力」(sparse attention)的方法,這種方法只使用一部份的模型來回答問題,而非整個模型,可降低推理成本,但也提高了模型開發的挑戰性。

不過,Blackwell晶片特別適用於這種技巧,因為此晶片包含的專門設計硬體可加速稀疏運算,運算速度比傳統方法快兩倍。

$(document).ready(function () {nstockStoryStockInfo();});

發表回復

您的郵箱地址不會被公開。 必填項已用 * 標註