一. GB300液冷方案升級
英偉達將於3月17日-21日在加州聖何塞舉行2025GTC大會,預計將展示GB300、CPO交換機、NVL288等最新產品。
由於GB300性能、能耗和對電壓需求更高,因此液冷散熱方案有所升級:
GB300採用獨立冷板設計,每個GPU單獨配備,取代GB200的大面積冷板方案,冷管線更密集,UQD接頭用量增長。
二. 液冷機櫃通用架構
GPU熱量首先傳遞到冷板,通過Manifold傳遞到機架外側,最後通過CDU將熱量轉移至室外側。
(1)CDU(冷卻分配單元):連接液冷室內外側,將冷卻液輸送到機櫃,把換熱後的冷卻液送回室外側,實現系統循環。
(2)Manifold(分流器):連接CDU與冷板,負責將冷卻液分流到各個GPU,以確保散熱均衡性。
(3)UQD(接頭):進出液連接器,用於連接管路與冷板、manifold與機架,具備無洩漏、高流量、熱插拔等性能。
三. GB200液冷方案概覽
(1)UQD數量
架構:GPU上方是冷板,通過UQD和液冷管放置在一個computer tray。
每個compute tray包含兩個大冷板,每塊大冷板需要2對UQD,共計4對;trav通過Manifold向外連接時,還需2對。
故一個GB200 compute tray總計需要6對UQD。
(2)UQD供應商
GB200採用了CPC、Staubli產品。
四. GB300與GB200方案比較
GB300主要變化集中在冷板的設計上,其他組件如manifold、CDU等均沿用原有設計。
另外,目前switchtray大部分採用氣冷,僅主晶片使用水冷;未來可能會全面轉向水冷,包括前端transceiver連接器。
這種轉變將導致製造工藝複雜度增加,並推高成本。
五. GB300液冷方案
(1)UQD數量變化
GB300採用了獨立液冷板設計,每個晶片配備單獨的一進一出液冷板,一個compute tray包含6個晶片,共12對快接頭;加上manifold接口,總數為14對。(GB200為6對)
(2)UQD型號變化
UQD03相較於GB200中的型號,尺寸縮小至原來的三分之一,供應商也有所更換。
原因:為了適應板卡插槽數量增加導致面積受限的問題。
(3)UQD供應商
初期量產階段參與者包括:AVC、Cooler Master、立敏達。
冷板及快接頭模塊均以Cooler Master為主導,其樣品已通過初步驗證,可以量產出樣;AVC、立敏達處於第一階段驗證中。
限會員,要發表迴響,請先登入


