劃重點
據(jù)稱字節(jié)跳動正在自研兩款A(yù)I芯片,分別用于模型訓(xùn)練和推理。
字節(jié)跳動計劃與臺積電合作,于2026年前實現(xiàn)兩款自研芯片量產(chǎn)。
字節(jié)跳動計劃采購數(shù)十萬顆自研芯片,預(yù)計比從英偉達(dá)采購節(jié)省數(shù)十億美元。
騰訊科技訊 9月16日消息,據(jù)國外媒體報道,據(jù)知情人士透露,TikTok母公司字節(jié)跳動正加快自研人工智能芯片的步伐,意在提升在中國人工智能聊天機(jī)器人市場中的競爭優(yōu)勢。
兩位知情人士證實,字節(jié)跳動計劃與芯片制造巨頭臺積電合作,力爭在2026年前實現(xiàn)兩款自研半導(dǎo)體芯片的量產(chǎn)。這一舉措可能會減少字節(jié)跳動在開發(fā)和運行人工智能模型過程中對昂貴的英偉達(dá)芯片的依賴。
對于字節(jié)跳動來說,降低芯片成本至關(guān)重要。與其他中國大型科技公司及眾多初創(chuàng)企業(yè)一樣,字節(jié)跳動已經(jīng)推出了自家大語言模型,供內(nèi)部使用和對外銷售。然而,市場競爭異常激烈,導(dǎo)致包括阿里巴巴和百度在內(nèi)的中國科技巨頭紛紛將其模型使用價格大幅下調(diào),降幅高達(dá)97%。
字節(jié)跳動去年發(fā)布了其首款人工智能聊天機(jī)器人“豆包”,該機(jī)器人提供了類似于OpenAI ChatGPT的文本和圖像生成功能。今年,字節(jié)跳動又推出了一批低成本的大語言模型,其中部分產(chǎn)品的定價比OpenAI的同類產(chǎn)品低了高達(dá)99%。
與此同時,字節(jié)跳動在開發(fā)生成式人工智能模型方面的費用也在不斷上升。據(jù)知情人士透露,今年,該公司已訂購了超過20萬顆英偉達(dá)H20芯片,這款芯片是美國出口管制下允許出售給中國的最先進(jìn)英偉達(dá)芯片。該訂單的總金額超過20億美元,目前字節(jié)跳動仍在等待英偉達(dá)交付全部訂單。
不過,字節(jié)跳動正計劃從臺積電訂購數(shù)十萬顆自家設(shè)計的訓(xùn)練和推理芯片。預(yù)計這些內(nèi)部設(shè)計的芯片成本將比從英偉達(dá)購買芯片節(jié)省數(shù)十億美元。然而,這些芯片目前仍處于設(shè)計階段,因此字節(jié)跳動的計劃可能會有所調(diào)整。
字節(jié)跳動和臺積電均未對此事作出回應(yīng)。
字節(jié)跳動的芯片研發(fā)工作遵循了谷歌、亞馬遜和微軟等公司近年來的做法,即在開發(fā)和運行人工智能模型方面減少對英偉達(dá)芯片的依賴。這些公司中的一些還為使用其云計算服務(wù)的客戶提供了自家設(shè)計的芯片,作為對英偉達(dá)芯片的替代品。
與此同時,阿里巴巴和百度也在多年來致力于開發(fā)內(nèi)部人工智能芯片。例如,百度正在為其生成式人工智能產(chǎn)品開發(fā)一款新的芯片——昆侖芯3代。知情人士透露,該芯片已經(jīng)進(jìn)入設(shè)計的最后階段,臺積電即將開始生產(chǎn)。這一項目此前尚未被報道過。
推理 VS 訓(xùn)練
字節(jié)跳動正在開發(fā)兩款芯片,其中一款旨在加速構(gòu)建人工智能模型所需的大量數(shù)據(jù)計算,這種芯片被稱為訓(xùn)練芯片;另一款則用于加速基于模型的預(yù)測和決策過程,稱為推理芯片。
字節(jié)跳動多年來一直專注于推理芯片的研發(fā),而此次將首次嘗試設(shè)計訓(xùn)練芯片,這種芯片的設(shè)計難度更大,成本也更高。
知情人士表示,字節(jié)跳動涉及的芯片符合美國的出口限制,這些限制涉及對中國公司銷售使用美國設(shè)備制造的芯片。這一合規(guī)性要求是字節(jié)跳動與臺積電合作的前提。然而,由于美國政府可能每年更新這些限制,未來這些芯片仍可能面臨合規(guī)風(fēng)險。
此外,字節(jié)跳動計劃于2026年推出的芯片設(shè)計采用了名為5納米的先進(jìn)制造工藝,這一工藝僅比臺積電當(dāng)前最前沿的技術(shù)落后一代。5納米工藝是中國芯片制造商難以復(fù)制的技術(shù),也是英偉達(dá)今年3月宣布的即將推出的旗艦AI芯片Blackwell所使用的工藝。
H20芯片的性能大約是英偉達(dá)H100芯片的四分之一,后者在2022年發(fā)布時是英偉達(dá)最先進(jìn)的芯片。盡管H100已上市兩年,但由于中國企業(yè)面臨美國去年10月宣布的出口管制,該芯片的需求仍然旺盛。
由于單顆H20的計算性能低于美國云服務(wù)提供商使用的更常見的英偉達(dá)芯片,中國公司需要購買更多的H20芯片來組成具有相同計算能力的集群,這增加了他們的成本。雖然美國對單顆芯片的性能有出口限制,但集群系統(tǒng)不受此限制。集群將多顆芯片連接成一個系統(tǒng),以實現(xiàn)更高效的數(shù)據(jù)計算。
一位了解字節(jié)跳動芯片開發(fā)情況的知情人士表示,中國芯片工程師可以通過其他方式提升芯片性能,例如加快集群中每個芯片之間的連接速度,或在訪問高帶寬計算機(jī)內(nèi)存時提高性能。這些方法并不受美國制裁的限制。
例如,字節(jié)跳動希望其自家設(shè)計的芯片能夠驅(qū)動集群,以大致相同的成本實現(xiàn)單顆H100芯片四倍的計算性能。H100芯片的價格最高可達(dá)3萬美元。
路透社早些時候報道了字節(jié)跳動人工智能芯片工作的一些細(xì)節(jié),包括其制造工藝和與臺積電的合作關(guān)系。然而,關(guān)于正在研發(fā)的芯片數(shù)量、用途、訂單規(guī)模和生產(chǎn)時間表的詳細(xì)信息,此前尚未公開。(編譯/金鹿)
發(fā)表評論
2024-09-18 00:38:12
2024-09-18 00:38:12
2024-09-18 00:38:12
2024-09-18 00:38:12
2024-09-18 00:38:12