【澳門特馬最正確免費資料】
【1995澳門論壇6肖6碼綜合查詢】
【天空彩免費資料公開資料公開】
【2024澳門正版資料大全接密新澳門正版】
【香港期期中資料論壇必中】
【澳門詩象】
【87654品特軒香港之家介紹】
【管家婆六肖期期中獎開獎記錄】
【澳門掛牌正版掛牌完整掛牌2】
【155755金牛網(wǎng)站香港香港王中王】
【澳門開獎結(jié)果+開獎直播2024】
【2024香港資料大全正版資料】
【新澳彩開獎結(jié)果】
【2024年澳門開獎結(jié)果查詢】
【香港馬會開狀結(jié)果免費資料】
【澳門管家婆一肖一碼179】
【新澳2024大全正版免費資料】
【香港最準最新免費資料】
【澳門四不像圖片大全】
【二四六期期正版資料下載】
【澳門六開彩開獎網(wǎng)站每天一期冫】
【澳門通天論壇會員推薦】
【藍月亮正版資料澳門王中王】
【77778888管字婆必開一肖】
【2024年7777788888管家婆一肖一碼六合】

作者 前臺積電建廠專家 Leslie Wu(公眾號:梓豪談芯)

編輯 蘇揚

頻繁炸場的英偉達,沒能守住3萬億美元的市值。

北京時間6月19日,英偉達市值達到3.335萬億美元,一舉超過了微軟和蘋果成為全球第一。在經(jīng)歷這一高光時刻之后,英偉達的市值開始走下坡路,截至8月2日收盤,英偉達的市值縮水26%。

在此之前,已經(jīng)有分析師呼吁投資者“踩剎車”。每日經(jīng)濟新聞援引投行DA Davidson分析師Gil Luria的觀點,稱英偉達業(yè)績創(chuàng)紀錄達到260億美元,源于頂級客戶對其GPU產(chǎn)品的支出,他認為這種趨勢未來將會動搖,并且英偉達的股價在18個月內(nèi)將出現(xiàn)兩位數(shù)的跌幅。

在Gil Luria這樣的分析師看來,頂級客戶們已有“二心”,而英偉達自身的“失誤”,也給了客戶變心和對手截胡的窗口期,一切都要從Blackwell架構芯片的負面?zhèn)髀務f起,包括CoWoS良率低、B100 SKU被放棄、B200出貨延遲及重新流片等關鍵議題

從臺積電內(nèi)部獲悉的情況來看,英偉達Blackwell芯片重新流片的消息確有其事,但主要涉及B100系列基礎芯片,問題出在底層Standard cell(標準單元)——是預先設計好的標準特定功能、尺寸電路模塊,如果把芯片設計理解為搭積木,標準單元就是積木的最小單位——在高壓環(huán)境下會出現(xiàn)工況異常,目前問題都已經(jīng)發(fā)現(xiàn),需要重開掩膜版。

不過,整體晶圓制造Wafer-in到Wafer-out的時間沒辦法縮短,好在2024年只有小批量出貨,本身就不是Blackwell服務器的出貨時間,今年年底前擴大產(chǎn)能把小批量出貨的進度追回來,從我個人的從業(yè)經(jīng)驗來看,這對于臺積電來說不算難事。

01 替延遲出貨背鍋的良率

B100被放棄、B200延遲出貨重新流片屬于對Blackwell芯片“跳票事故”的片面理解,這與英偉達復雜的命名有關。

Blackwell系列芯片包含B100和B102兩個基礎芯片,包括B200\GB200在內(nèi)的這些SKU,都是采用基于B100系列的Chiplet方案,B200A則是基于B102打造。

為了方便理解,給大家整理了一個表格,可以對照看B102和B100這個基礎芯片,以及對應的服務器SKU,針對不同應用的服務器,還可以組合出更多款式,例如HGX B200A / HGX B200/ NVL36/72甚至是NVL8或GB210A的氣冷版本。

Blackwell芯片的命名及各種SKU讓外界理解混亂,可以理解,但“CoWoS良率只有66%,一片晶圓只能切10顆Good die”這種說法則脫離了常識。

我們可以從晶圓制造的前段和后段分別簡要說說“良率”這個概念。

前段的GPU Die,和蘋果、高通以及AMD一樣,英偉達這次采用的是N4P工藝,已經(jīng)非常成熟,所以良率根本不用擔心。

后段封裝,尤其是CoWoS的“oS”部分,不僅包含了GPU die,也還有HBM內(nèi)存,而且8顆HBM本身成本就很高,如果GPU die故障,整個封裝就成了廢片,所以良率低于80%都不可能排產(chǎn),不然成本會無限放大,毛利無法保障,如果是66%的水平,根本不會排產(chǎn)。

在制造環(huán)節(jié)良率異常這種風險應對上,作為Fabless廠,不管是英偉達,還是蘋果,都不可能全部將產(chǎn)品押注在新方案上,如果新方案有問題,整代產(chǎn)品就可能報廢,這個風險太大,所以在下單時一定會有備選方案同時開案。換句話說,即便CoWoS-L的良率真出了問題,也不會影響B(tài)lackwell芯片的出貨。

我舉個例子,蘋果明年的A18芯片想采用臺積電全新的2nm工藝,一定會同時開N3P工藝的方案,以確?!百崯o一失”,英偉達自然也會如此。

根據(jù)我們拿到的數(shù)據(jù),Blackwell采用CoWoS-L封裝,目前的良率大概在90%左右且還在爬升當中,這一點也和業(yè)內(nèi)對CoWoS研究最透徹的野村團隊保持一致。另外,年初臺積電對CoWoS-L良率的預期是95%,相比H200、H100這些產(chǎn)品采用CoWoS-S封裝的99%的良率,90%自然是表現(xiàn)不佳,但對于新工藝來說,勉強可以接受。

所以說,CoWoS-L目前的良率確實不如預期,但將前段的GPU die因為標準單元的問題,需重新設計掩膜,導致Blackwell芯片無法順利生產(chǎn),間接導致后段的CoWoS-L產(chǎn)能出現(xiàn)停擺的現(xiàn)象,總結(jié)為CoWoS-L良率存在重大異常,來反推Backwell芯片不能順利出貨,有違事實,也有悖于行業(yè)常識。

實際上,在這次B100系列基礎芯片重新流片的問題之前,英偉達就已經(jīng)出于CoWoS-L良率不及95%的問題進行了調(diào)整,在采用B102基礎芯片的B200A上,更換為CoWoS-S封裝,原計劃是分擔CoWoS-L的產(chǎn)能壓力,確保2025年有更多Blackwell芯片的產(chǎn)出,現(xiàn)在這種調(diào)整,也能夠幫助英偉達解決因為GPU die設計問題導致的進度延后問題,并且也能幫助拉高2025年Blackwell芯片的總體出貨量。

02 誰在掐著英偉達的“脖子”

過去有很多討論,說英偉達卡著算力的脖子,但是英偉達自己的“脖子”卻被更上游的HBM內(nèi)存這些企業(yè)卡著。

應該這樣說,目前HBM、液冷QCD快接頭模塊供應都比較緊張,但供應緊張并不會延遲出貨,頂多是導致出貨量減少,而且現(xiàn)階段這些緊缺的零部件的工藝還是有保障的,比如三星,目前已經(jīng)確定加入英偉達的HBM供應商體系當中。

真正會影響B(tài)lackwell芯片發(fā)貨的,是后續(xù)各種服務器產(chǎn)品化的節(jié)點。

從產(chǎn)業(yè)鏈的消息來看,目前進入生產(chǎn)階段的不止芯片,還有板卡組件、交換設備、機架、制冷方案等等。

而從8卡機柜擴容到72卡機柜,需要考慮包括網(wǎng)絡帶寬收斂、以及各種并行策略(模型數(shù)據(jù)切分、分段計算、拷貝和重組)在整個機柜中的最佳工況等等諸多問題。此外,由于托盤變得更多,密度更高更緊湊,內(nèi)部布線數(shù)量、高速交換、散熱這些復雜的問題,都意味著機架也要重新設計,目前也應該都在測試當中。

由于NVL36/72服務器都是全新的技術方案,所有子系統(tǒng)與集成是否完善也是風險點之一,外界的關注點過去都集中在性能上,實際上整個系統(tǒng)的高成熟度與可靠度,也是考量這代產(chǎn)品好壞的依據(jù)。

對于采用水冷散熱的GB200系列,還要考慮漏液的問題,主要涉及三個部件:水冷板、分歧管、CDU液冷分配單元以及QCD快接頭,其中快接頭最容易發(fā)生漏液,所以漏液也是服務器廠家最頭疼的問題,它的質(zhì)量最為關鍵,直接牽涉到責任的歸屬劃分。一般情況下,如果出現(xiàn)漏液,英偉達會向客戶先行賠付,然后再向鴻海、廣達這類系統(tǒng)廠進行索賠,一臺AI服務器機架動輒數(shù)百萬美元,漏液賠償可能會讓一家小企業(yè)直接破產(chǎn)

從我們拿到的消息來看,目前英偉達與鴻海、廣達這些系統(tǒng)廠還在進行水冷散熱的測試,還沒有大量導入。

前面說的,不管是芯片廠、系統(tǒng)廠還是散熱廠,面對動輒數(shù)百萬美元的賠償,沒有哪一家廠商愿意輕易承擔這種風險,都需要實際導入后,有了“小白鼠”后才能大規(guī)模落地。

03 英偉達會“翻車”嗎?

文章開頭我們提到,英偉達的市值已經(jīng)自歷史高點的3.3萬多億美元,下跌到現(xiàn)在的2.6萬億美元,跌幅超過26%,而在一季報發(fā)布的時候,英偉達自信的預期二季度營收280億美元,誤差在±2%的區(qū)間內(nèi)。

現(xiàn)在,由于GPU die的設計問題,CoWoS封裝良率不及95%的預期,各種服務器技術方案還沒定案,都會影響B(tài)lackwell芯片的順利出貨,那么這些問題是否會更進一步,將英偉達踢出2萬億市值的榜單?

可以這樣說,短期內(nèi)不會有太大的問題,關鍵就在于,Blackwell芯片第三季度本身就是小批量排產(chǎn),第四季度才會上量,而且這只是臺積電的排產(chǎn)節(jié)奏,完成GPU die的生產(chǎn)之后,接下來是后段CoWoS,再接著就是Bumping廠,最后到工業(yè)富聯(lián)、緯創(chuàng)這些系統(tǒng)廠做組裝,進而完成服務器出貨和業(yè)績落地。

一句話說,服務器出貨才對英偉達的營收有影響,而不是臺積電的芯片出貨。

按照現(xiàn)在的節(jié)奏,服務器的大批量交付最快也要到2025年的第一季度,換句話說,英偉達明年第一季度才會在Blackwell芯片上實現(xiàn)較大的業(yè)務增量。也就是說,這款芯片,到明年才會為英偉達貢獻大量的營收,這也是原來市場就有的合理預期,并不會反映在第二季度、甚至是第三季度的業(yè)績上。

對英偉達來說,在三季度發(fā)現(xiàn)設計上的問題,并且拿出解決方案,然后在臺積電跑個Super hot run(超級急件)對應的時間還是第四季度的中后期,大概在11月-12月,本身這部分產(chǎn)能就已經(jīng)預定完成,3個月基本可以繼續(xù)排產(chǎn),且臺積電不論N4P還是CoWoS - S/L,產(chǎn)能都比現(xiàn)在充足 , 把稼動率拉到120%,來應對因為設計缺陷導致原本第三季度要小批量出貨的芯片延遲出貨的問題 , 基本上沒有太大困難 , 也就是說,以年度來計算 , 今年Blackwell出貨雖然會少,但不會少很多。

對英偉達和整個產(chǎn)業(yè)鏈下游來說,芯片問題目前已暴露,服務器的各個子系統(tǒng)也必須同時進行各種實際環(huán)境的的測試。比較樂觀的地方在于,目前生產(chǎn)出的芯片 , 只在特定高壓環(huán)境會有問題 ,這些芯片是可以交給鴻海等服務器系統(tǒng)廠家去做各種調(diào)適與測試,也就是服務器各子系統(tǒng)跟原本一樣,還是有半年時間拿到芯片去模擬各種環(huán)境的測試 ,最終大量的出貨時間點會落在2025年的2-3月份 。

從目前的情況看,第二季度在H200泄洪式出貨的背景下,業(yè)績大概率還是符合指引并超預期,而且本身2023年的營收主力是H200系列,前面提到,今年Blackwell芯片小批量出貨的規(guī)模會比原計劃有所減少,大概在2萬片晶圓(CoWoS-L從41K減少到不足20K),換算成英偉達業(yè)績預估在80-95億美元左右,但采取H系列增量銷售以及B系列回片后沖刺產(chǎn)能的緊急應對措施,這次業(yè)績損失大概會落在 50 億美元左右,這些可能會反映在第四季度財報當中,對股價的沖擊必定是有的,畢竟是產(chǎn)品翻車。

比起B(yǎng)lackwell芯片“翻車”這個事情本身,更值得思考和重視的一個問題在于,英偉達每年都會推出新的SKU,需要許多創(chuàng)新技術,這個節(jié)奏非常之快,如果沒有足夠的時間去優(yōu)化并提高可靠性,未來幾年在某一款產(chǎn)品上徹底翻車這個可能性也是有的,這是我們需要重新審視的英偉達的發(fā)展邏輯,也是競爭對手們苦苦等待的機會。

從更宏觀的角度來,看盡管這兩年英偉達的增長邏輯沒有問題,但更長期的發(fā)展則是風險不斷加大。這種風險不僅僅表現(xiàn)為每一代瘋狂激進的技術更迭,還有應用端以及后續(xù)需求問題,簡單說就是大家耳熟能詳?shù)摹癆I泡沫” ,又或者是否會出現(xiàn)新技術的強力竟爭者,比如新的芯片技術或者掌握大模型的上游企業(yè)開始自研。

這兩天確實看到很多報道,關于中美巨頭們都紛紛下場自研,插播一個消息供參考,OpenAI的自研芯片項目,已經(jīng)和臺積電談的差不多了。