近日有臺(tái)媒報(bào)道,特斯拉為了擴(kuò)編超算Dojo的算力規(guī)模,可能會(huì)加深與臺(tái)積電的合作。
Dojo的核心是一顆特斯拉自研的芯片D1,其基于臺(tái)積電7nm制程和先進(jìn)封裝技術(shù)打造。今年D1在臺(tái)積電的投片量約為5000片12吋晶圓,業(yè)界預(yù)測(cè),這一數(shù)字到明年有望增至1萬(wàn)片。
當(dāng)算力成為數(shù)字經(jīng)濟(jì)時(shí)代的重要生產(chǎn)力,無(wú)論是搶購(gòu)GPU還是爭(zhēng)奪代工產(chǎn)能,似乎都再正常不過。而令人好奇的是,Dojo究竟會(huì)給特斯拉帶來怎樣的協(xié)同效應(yīng)?
2021年AI Day上,特斯拉正式發(fā)布了自己的超級(jí)計(jì)算機(jī)Dojo。Dojo的發(fā)音源自日語(yǔ),意為“道館”。通俗點(diǎn)講,基于自動(dòng)駕駛及其他AI項(xiàng)目的視頻數(shù)據(jù),Dojo可以提供大規(guī)模的機(jī)器學(xué)習(xí)能力,從而訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
要知道,特斯拉之前的超算采用的是英偉達(dá)GPU。馬斯克曾解釋說,如果英偉達(dá)能夠提供足夠的GPU,特斯拉可能就不需要Dojo了。英偉達(dá)分給特斯拉的訂單顯然不夠。
但從另外一個(gè)角度看,這也許正是馬斯克的“禮貌性借口”。Dojo項(xiàng)目負(fù)責(zé)人最初是這樣介紹的,馬斯克想要一臺(tái)超快的訓(xùn)練計(jì)算機(jī)來訓(xùn)練 Autopilot。所以Dojo誕生了。
又或許也像艾薩克森《埃隆·馬斯克傳》中所寫的,“他對(duì)成本的關(guān)注,以及他天生的控制欲,讓他產(chǎn)生了這樣一種想法:盡量多在公司內(nèi)部制造零部件,而不是從供應(yīng)商那里購(gòu)買。”
如果能用更低的成本,換取相當(dāng)?shù)男阅芎透叩耐评硇?,那為什么不自研呢?因而有觀點(diǎn)認(rèn)為,Dojo 存在的意義之一,便是為了FSD能夠?qū)崿F(xiàn)更好的安全性和自動(dòng)駕駛能力。
按照時(shí)間表,特斯拉Dojo在今年7月開啟量產(chǎn)。最近一段時(shí)間,馬斯克也在不斷“劇透”FSD的相關(guān)成果,更加引得市場(chǎng)關(guān)注。
根據(jù)特斯拉2021年公布的數(shù)據(jù),每臺(tái)Dojo超級(jí)計(jì)算機(jī)集成了120個(gè)訓(xùn)練單元,內(nèi)置 3000顆 D1芯片,擁有超過100萬(wàn)個(gè)訓(xùn)練節(jié)點(diǎn),算力則高達(dá)1.09EFLOP(每秒千萬(wàn)億次浮點(diǎn)運(yùn)算)。
而英偉達(dá)測(cè)算過,在4096顆 A100 GPU互聯(lián)的情況下,訓(xùn)練10000 億參數(shù)的神經(jīng)網(wǎng)絡(luò)模型大約需要 3~4 周時(shí)間;而在4096顆 H100互聯(lián)的情況下,時(shí)間大約需要1周。
眼下,AI大模型已經(jīng)進(jìn)入“萬(wàn)億參數(shù)量”時(shí)代,對(duì)訓(xùn)練芯片的算力和數(shù)量的需求不斷增長(zhǎng)。包括全球互聯(lián)網(wǎng)巨頭積極采購(gòu)GPU芯片,特斯拉欲加大D1投片量,都是最好的證明。
另外對(duì)于馬斯克來說,除了特斯拉,X(原 Twitter)內(nèi)部也啟動(dòng)了新的AI項(xiàng)目,著手開發(fā)大語(yǔ)言模型,所以除了秘密采購(gòu)GPU外,保證D1的產(chǎn)能也至為關(guān)鍵。
不過,我們也看到出現(xiàn)了一種新的質(zhì)疑聲:特斯拉Dojo初步投產(chǎn),臺(tái)積電是否能滿足其需求?
首先從產(chǎn)能配額來看,去年年底,有消息稱,臺(tái)積電因遭客戶砍單,7nm制程的產(chǎn)能利用率跌至50%以下。來到今年,受惠于AI大模型迅速興起,高性能計(jì)算(HPC)需求尤其旺盛,使得臺(tái)積電7nm產(chǎn)能利用率不斷回升。據(jù)悉現(xiàn)已恢復(fù)至7~8成,但尚未滿載。
結(jié)合中國(guó)臺(tái)灣地區(qū)產(chǎn)業(yè)鏈的消息,臺(tái)積電早于計(jì)劃將7nm制程的月產(chǎn)能提升到了13萬(wàn)片,年底計(jì)劃提升到14萬(wàn)片晶圓。換句話說,特斯拉的1萬(wàn)片晶圓至少現(xiàn)在來看是可以滿足的。
除了采用臺(tái)積電7nm制程,特斯拉Dojo的D1芯片也用上了InFO等級(jí)系統(tǒng)單晶圓(System-on-Wafer,SoW)技術(shù),能將HPC芯片在不使用PCB和基板的情況下,與散熱模塊整合在一個(gè)封裝中,從而加速生產(chǎn)流程。
從臺(tái)積電披露的信息來看,該封裝技術(shù)的優(yōu)點(diǎn)包括但不限于,電氣性能方面的高帶寬密度和低PDN阻抗,以及更好的計(jì)算性能和電源效率。這是臺(tái)積電在2020年推出的,也是其專為超算AI芯片選擇的技術(shù)路線。
盡管特斯拉尚未公布D1大規(guī)模應(yīng)用的進(jìn)展,但日前摩根士丹利在報(bào)告中指出,超算Dojo可能會(huì)推動(dòng)特斯拉robotaxi和軟件服務(wù)的普及,從而帶動(dòng)其市值提升近6000億美元。受該報(bào)告影響,特斯拉股價(jià)應(yīng)聲大漲10.6%。
截至發(fā)稿前,特斯拉市值達(dá)8597.93億美元。接下來,特斯拉是會(huì)帶來更多驚喜,還是會(huì)慢慢擠牙膏,尚需觀察。