AI芯片“功耗懸崖”:大模型催生的冷卻技術革命
2025/5/7 16:45:58 標簽:中國傳動網
AI芯片的功耗和發熱量直接影響著企業的成本、風險以及芯片的穩定性和壽命。如果芯片因過熱或短路而頻繁出現問題,那么AI的訓練和推理效果及效率也會受到嚴重影響。
冷卻技術革命,顯得十分急需。
AI芯片的功耗危機
統計數據顯示,2015年全球數據量約為10EB(艾字節),預計到2025年將飆升至175ZB(澤字節),而到2035年,則可能達到驚人的2432ZB。然而,邊緣AI的發展面臨兩大挑戰。首先,需要在性能、功耗和成本之間取得平衡。在提升算力的同時,如何在不將功耗和成本推向合理限度的情況下獲得最佳效果,尤其是在電池供電的低功耗設備中?其次,構建強大的生態系統至關重要。如同CPU和GPU的發展一樣,一個涵蓋工具鏈、語言、兼容性和易開發性的統一生態系統,對于推動AI技術的普及和規模化應用至關重要。
ChatGPT 和類似的 AI 機器人用來生成類人對話的大型語言模型 (LLM) 只是眾多依賴“并行計算”的新型 AI 應用之一。“并行計算”指的是由芯片網絡同時執行多項計算或處理的海量計算工作。
人工智能基礎設施的核心是GPU(圖形處理單元),它擅長處理人工智能所需的專業高性能并行計算工作。與個人電腦中使用的 CPU(中央處理器)相比,這種強大的處理能力也會導致更高的能量輸入,從而產生更多的熱量輸出。
高端GPU 的功率密度約為 CPU 的四倍。這給數據中心規劃帶來了新的重大問題,因為最初計算的電源現在僅為運行現代 AI 數據中心所需電源的 25%。即使是亞馬遜、微軟和 Alphabet 用于云計算的尖端超大規模數據中心,也仍然是由 CPU 驅動的。舉例來說,Nvidia 目前提供的 A100 AI 芯片每塊芯片的恒定功耗約為 400W,而其最新微芯片 H100 的功耗幾乎是 A100 的兩倍,達到 700W,與微波爐的功耗相似。如果一個擁有平均一百萬臺服務器的超大規模數據中心用這些類型的 GPU 替換其當前的 CPU 服務器,則所需的功率將增加 4-5 倍(1500MW),相當于一座核電站!
功率密度的提升意味著這些芯片產生的熱量也會顯著增加。因此,冷卻系統也必須更加強大。如此規模的電力和冷卻變革將要求未來人工智能驅動的數據中心進行全新的設計。這將導致底層芯片和數據中心基礎設施出現巨大的供需失衡。考慮到數據中心建設所需的時間,業內專家預測,我們正處于數據中心十年現代化升級的初期階段,旨在使其更加智能化。
臺積電3DVC技術
臺積電的3DVC(3D Vapor Chamber,三維均熱板)技術是一種針對高性能計算(HPC)和AI芯片的先進散熱解決方案,旨在解決先進制程(如3nm/2nm)芯片因集成度提升導致的功耗和發熱密度激增問題。
傳統均熱板是二維平面結構,而臺積電的3DVC通過立體化設計,在芯片封裝內部直接集成多層微流體通道,利用 相變傳熱(液體蒸發-冷凝循環)快速導出熱量。
三維毛細結構:內部采用多孔金屬泡沫或微柱陣列,增強工質(如水/氨)的毛細回流能力。
近結散熱(Near-Junction Cooling):直接與芯片的硅中介層(Silicon Interposer)或3D堆疊結構(如SoIC)接觸,縮短熱傳導路徑。
3D-VC散熱器熱管屬于一維線性的傳熱器件,常規VC均熱板因為存在蒸發段以及冷凝段,根據設計位置的不同,散熱路徑上會存在多種分布可能,這使得常規VC均熱板成為了二維傳熱器件,但其散熱路徑依舊局限在同一個平面內。與一維熱傳導的熱管、二維熱傳導的VC均熱板相比,3D-VC散熱器的熱傳導路徑是三維的,立體結構的,非平面的。3D-VC散熱器利用VC、熱管相結合使得內部腔體連通,通過毛細結構實現工質回流,完成導熱。連通的內部腔體加上焊接翅片組成了整個散熱模組,使得該散熱模組實現了水平以及垂直等多維度的散熱。
熱管、VC、3DVC對比圖多維度的散熱路徑使得3D-VC散熱器在應對高功耗設備熱量的時候可以接觸更多的發熱源提供更多的散熱路徑。傳統散熱模組中熱管與VC均溫板屬于分離式設計,由于熱阻值隨導熱距離的增加而增加,散熱效果也就不甚理想。3D-VC散熱器通過將熱管延伸至VC均熱板本體中,VC均溫板的真空腔體與熱管連通后,內部工質連接,3D-VC 散熱器與熱源直接接觸,垂直的熱管設計也提高了傳熱的速度。
3DVC可嵌入臺積電的 CoWoS 2.5D/3D封裝中,為CPU/GPU/HBM提供一體化散熱。臺積電在IEEE國際電子器件會議(IEDM)上展示3DVC原型,可將3nm芯片結溫降低15°C以上。計劃與CoWoS-L封裝技術同步應用于AMD、NVIDIA的下一代產品。
冷卻方案差異
液冷是高功率下唯一可行的解決方案。
通過一定體積的液體流動傳遞熱量的效率遠高于通過相同體積的空氣傳遞熱量——水的效率約為空氣的3,600倍。這使得通過芯片散熱器進行液冷成為一種高效的方法。當芯片面積每平方厘米的散熱量超過約50瓦時,通常需要采用液冷。鑒于GB200的面積約為9平方厘米,任何超過450瓦的散熱量都表明需要泵送液冷。在“直接芯片”冷卻中,液體通過熱界面連接到芯片散熱器的冷板通道流動。當液體在此過程中不蒸發時,稱為“單相”操作,其中介質(通常是水)被泵送通過風扇冷卻的熱交換器。Flex 旗下公司 JetCool 提供直接芯片液體冷卻模塊,該模塊使用小型流體噴射陣列,精確瞄準處理器上的熱點,從而在芯片或設備級別提升高功率電子冷卻性能。
熱量可以轉移到第二個液體回路,該回路可以為建筑物提供熱水,并可能為當地消費者提供熱水。兩相操作通過使液體(通常是氟碳化合物)在吸收熱量時蒸發,然后在熱交換器處重新凝結,從而提供更好的傳熱效果。這種方法可以顯著提升性能。然而,仍然需要系統風扇來冷卻其他組件,盡管某些組件(例如DC/DC 轉換器)可以使用其自身的基板集成到液體冷卻回路中。這符合“垂直供電”的概念,其中 DC/DC 轉換器直接位于處理器下方,以最大限度地減少壓降。直接芯片方法的實際限制是芯片與冷卻板之間界面的熱阻。精確的表面平整度和高性能焊膏是必要的,但在數千瓦級功率下,溫差仍然是一個問題。
這一限制似乎即將限制散熱,進而影響性能。可以考慮采用浸入式冷卻技術。將整個服務器置于一個開放式的介電流體槽中,介電流體通過儲液器繞環路泵送至熱交換器。同樣,為了獲得最佳性能,可以采用兩相運行。
除了浸入式冷卻技術,IBM使用的是嵌入式微通道相變冷卻技術。IBM 將介電液直接泵入任意級別芯片堆疊的約 100μm 的微觀間隙中,通過介電液從液相沸騰到氣相來帶走芯片的熱量。他們對用此改造后的 IBM Power 7+ 芯片進行測試,結果表明結溫降低了 25℃。
為了實現嵌入式冷卻,IBM 拆掉了處理器的封裝蓋子以暴露出裸片,對裸片進行了深度反應離子蝕刻(DRIE),在其背面構建了 120μm 深的冷卻通道結構,并將一個玻璃片粘合到被蝕刻的芯片上以形成微通道的頂壁,用粘合劑將冷卻劑入口、出口黃銅歧管粘合到玻璃歧管芯片和有機基材上。冷卻劑進入模塊并通過 24 個入口,在相應的 24 個徑向擴展通道中分配流量。
英偉達:硬件級冷卻集成(NVLinkC2C技術)
Blackwell的發布,標志著AI硬件領域邁入了一個新紀元,其強大性能將為AI公司提供前所未有的計算支持,助力訓練出更復雜、更精準的模型,基于 Blackwell 的 AI 算力將以名為 DGX GB200 的完整服務器形態提供給用戶,結合了 36 顆 NVIDIA Grace CPU 和 72 塊 Blackwell GPU,而這些超級芯片通過第五代 NVLink 連接成一臺超級計算機提高整體計算性能。為了更好地支持GB200超級芯片的應用,英偉達推出了全新的計算集群DGX GB200 SuperPod,這一超級計算集群采用了新型高效液冷機架規模架構,能夠在FP4精度下提供驚人的算力和內存容量。通過DGX GB200 SuperPod,英偉達將為各行各業提供強大的AI計算能力,助力AI工業革命的發展,再次展現了其在AI領域的領先地位和創新能力。
具體來講,NVLINK 是一種專門設計用于連接 NVIDIA GPU 的高速互聯技術。它允許 GPU 之間以點對點方式進行通信,繞過傳統的PCIe總線,實現了更高的帶寬和更低的延遲。NVLINK 可用于連接兩個或多個 GPU,以實現高速的數據傳輸和共享,為多 GPU 系統提供更高的性能和效率。
例如,GB200 NVL72有 18 個 1U 服務器,其提供的 FP8 性能為 720 petaflops,FP4 計算性能為 1440 petaflops,可處理多達 27 萬億個 AI LLM 參數模型。每臺服務器里帶有兩個 GB200 Grace Blackwell Superchip,這些計算節點帶有 1.7TB 的 HBM3E 內存、32TB/s 的內存帶寬,為應對功耗過于強大問題,NVIDIA選擇全部采用液冷 MGX 封裝,采取液冷機架級解決方案。
供稿:電子技術應用
本文鏈接:http://www.isshing.com/content.aspx?url=rew&id=6402
相關新聞
- 2025-11-28英特爾未來發展瞄準全球AI供應鏈核心
- 2025-11-26馬斯克喊話:特斯拉 AI 芯片目標年更模式,年產量要超其它芯片總和
- 2025-11-24伴芯科技重磅亮相!AI智能體重構EDA,邁向芯片自主設計閉環
- 2025-11-24酷賽智能AI手機直擊新興市場痛點
- 2025-11-24面向AI超級周期 諾基亞宣布重大戰略與組織架構調整
- 2025-11-21黃仁勛:駁斥AI泡沫論 對無法在華銷售AI芯片失望
- 2025-11-20誰是AI領域下一個敲鐘人?
成員中心
- 上海會通自動化科技發展有限公
- 中達電通股份有限公司
- 長春禹衡光學有限公司
- 睿工業
- 廣東美的智能科技有限公司
- 高創傳動科技開發(深圳)有限
- 南京埃斯頓自動化股份有限公司
- 哈爾濱工業大學
- 深圳市機械行業協會
- 廣東省自動化學會
- 廣東省機械工程學會
- 華南智能機器人創新研究院
- 深圳市機器人協會
- 富士康科技集團
- 深圳眾為興技術股份有限公司
- 南京誠達運動控制系統有限公司
- 常州精納電機有限公司
- 杭州之山智控技術有限公司
- 杭州中達電機有限公司
- 杭州日鼎控制技術有限公司
- 杭州米格電機有限公司
- 上海新時達電氣股份有限公司
- 上海登奇機電技術有限公司
- 上海三竹機電設備有限公司
- 深圳市艾而特工業自動化設備有
- 深圳市億維自動化技術有限公司
- 湖南科力爾電機股份有限公司
- 深圳市四方電氣技術有限公司
- 武漢邁信電氣技術有限公司
- 廣東省珠峰電氣股份有限公司
- 清能德創電氣技術(北京)有限公
- 畢孚自動化設備貿易(上海)有
- 富士電機(中國)有限公司
- 松下電器機電(上海)有限公司
- 路斯特運動控制技術(上海)有
- 西門子(中國)有限公司
- ABB(中國)有限公司
- 施耐德電氣(中國)投資有限公
- 丹佛斯(中國)投資有限公司
- 三菱電機自動化(上海)有限公
- 安川電機(中國)有限公司
- 歐姆龍自動化(中國)有限公司
- 山洋電氣(上海)貿易有限公司
- 柯馬(上海)工程有限公司
- 康耐視
- 埃莫運動控制技術(上海)有限
- 上海安浦鳴志自動化設備有限公
- 諾德(中國)傳動設備有限公司
- 利萊森瑪電機科技(福州)有限
- 易格斯(上海)拖鏈系統有限公
- ACS Motion Control(弘柏商貿(
- 蘇州鈞和伺服科技有限公司
- 北京研華興業電子科技有限公司
- 臺安科技(無錫)有限公司
- 海頓直線電機(常州)有限公司
- 杭州摩恩電機有限公司
- 梅勒電氣(武漢)有限公司
- 亞德諾半導體技術有限公司
- 上海摯驅電氣有限公司
- 上海鴻康電器有限公司
- 上海開通數控有限公司
- 上海翡葉動力科技有限公司
- 上海維宏電子科技股份有限公司
- 上海弈貓科技有限公司
- 和椿自動化(上海)有限公司
- 光洋電子(無錫)有限公司
- 圖爾克(天津)傳感器有限公司
- 堡盟電子(上海)有限公司
- 廣東西克智能科技有限公司
- 約翰內斯·海德漢博士(中國)
- 宜科(天津)電子有限公司
- 美國邦納工程國際有限公司
- 庫伯勒(北京)自動化設備貿易
- 奧托尼克斯電子(嘉興)有限公
- 皮爾磁工業自動化(上海)有限
- 易盼軟件(上海)有限公司
- 深圳市凱德電線電纜有限公司
- 恒科鑫(深圳)智能科技有限公
- 深圳市英威騰電氣股份有限公司
- 深圳威科達科技有限公司
- 深圳市微秒控制技術有限公司
- 深圳易能電氣技術股份有限公司
- 深圳市正運動技術有限公司
- 深圳市合信自動化技術有限公司
- 深圳市吉恒達科技有限公司
- 深圳銳特機電有限公司
- 深圳市顧美科技有限公司
- 深圳安納赫科技有限公司
- 深圳市金寶佳電氣有限公司
- 深圳市泰格運控科技有限公司
- 深圳市麥格米特驅動技術有限公
- 深圳市匯川技術股份有限公司
- 深圳市庫馬克新技術股份有限公
- 深圳市藍海華騰技術股份有限公
- 深圳市正弦電氣股份有限公司
- 深圳市艾威圖技術有限公司
- 無錫信捷電氣股份有限公司
- 臺州市格特電機有限公司
- 天津龍創恒盛實業有限公司
- 武漢華中數控股份有限公司
- 四川零點自動化系統有限公司
- 庸博(廈門)電氣技術有限公司
- 北京凱恩帝數控技術有限責任公
- 北京配天技術有限公司
- 歐瑞傳動電氣股份有限公司
- 航天科技集團公司第九研究院
- 西安微電機研究所
- 蘭州電機股份有限公司
- 太倉摩力伺服技術有限公司
- 泰志達(蘇州)自控科技有限公
- 無錫創正科技有限公司
- 寧波菲仕電機技術有限公司
- 杭州中科賽思伺服電機有限公司
- 世協電機股份有限公司
- 太倉摩訊伺服電機有限公司
- 浙江禾川科技股份有限公司
- 騰禾精密電機(昆山)有限公司
- 杭州納智電機有限公司
- 杭州德力西集團有限公司
- 嘉興德歐電氣技術有限公司
- 臥龍電氣集團股份有限公司
- 寧波海天驅動有限公司
- 德恩科電機(太倉)有限公司
- 常州展帆電機科技有限公司
- 固高科技(深圳)有限公司
- 廣東科動電氣技術有限公司
- 深圳市百盛傳動有限公司
- 廣州賽孚德電氣有限公司
- 廣州金升陽科技有限公司
- 廣東伊萊斯電機有限公司
- 珠海市臺金科技有限公司
- 東莞市卓藍自動化設備有限公司
- 東莞新友智能科技有限公司
- 成都思迪機電技術研究所
- 深圳市英威騰智能控制有限公司
- 深圳錦凌電子股份有限公司
- 深圳市雷賽智能控制股份有限公
- 深圳市雷賽控制技術有限公司
- 橫川機器人(深圳)有限公司
- 武漢久同智能科技有限公司
- 深圳市默貝克驅動技術有限公司
- 深圳眾城卓越科技有限公司
- 泉州市桑川電氣設備有限公司
- 江蘇本川智能電路科技股份有限
- 臺州市金維達電機有限公司
- 深圳市多維精密機電有限公司
- 上海尚通電子有限公司
- 配天機器人技術有限公司
- 瑞普安華高(無錫)電子科技有
- 深圳市青藍自動化科技有限公司
- 廣東科伺智能股份科技有限公司
- 東莞市成佳電線電纜有限公司
- 深圳市朗宇芯科技有限公司
- 深圳軟贏科技有限公司
- 常州市領華科技自動化有限公司
- 杭州眾川電機有限公司
- 江蘇智馬科技有限公司
- 海禾動力科技(天津)有限公司
- 杭州賽亞傳動設備有限公司
- 廣州富燁自動化科技有限公司
- 日立產機系統(中國)有限公司
- 魏德米勒電聯接(上海)有限公
- 東莞市安揚實業有限公司
- 沈陽新松半導體設備有限公司
- CC-Link協會
- 北京精準博達科技有限公司
- 深圳市山龍智控有限公司
- 蘇州偉創電氣設備技術有限公司
- 上海相石智能科技有限公司
- 上海米菱電子有限公司
- 深圳市智創電機有限公司
- 深圳市杰美康機電有限公司
- 東莞市亞當電子科技有限公司
- 武漢正源高理光學有限公司
- 珠海凱邦電機制造有限公司
- 上海精浦機電有限公司
- 江蘇略盛電子科技有限公司
- 深圳市研控自動化科技有限公司
- 上海微泓自動化設備有限公司
- 寧波中大力德智能傳動股份有限
- 成都超德創機電設備有限公司
- 深圳市合發齒輪機械有限公司
- 溫州漢橋科技有限公司
- 浙江工商職業技術學院智能制造
- 廣東派萊特智能系統有限公司
- 上海英威騰工業技術有限公司
- 寧波中控微電子有限公司
- 普愛納米位移技術(上海)有限
- 贛州誠正電機有限公司
- 三木普利(天津)有限公司上海
- 無錫新華光精機科技有限公司
- 廣東宏博電子機械有限公司
- 紐泰克斯電線(濰坊)有限公司
- 杭州微光電子股份有限公司
- 北京和利時電機技術有限公司
- 廣東七科電機科技有限公司
- 艾羅德克運動控制技術(上海)
- 大連普傳科技股份有限公司
- 托菲傳感技術(上海)股份有限
- 杭州中科伺爾沃電機技術有限公
- 蘇州輕工電機廠有限公司
- 國訊芯微(蘇州)科技有限公司
- 鋒樺傳動設備(上海)有限公司
- 科比傳動技術(上海)有限公司
- 泰科電子(上海)有限公司
- 廣東速美達自動化股份有限公司
- 安徽謹銘連接系統有限公司
- 沈機(上海)智能系統研發設計
- 寧波谷雷姆電子有限公司
- 深圳市人通智能科技有限公司
- 倫茨(上海)傳動系統有限公司
- 連云港杰瑞電子有限公司
- 歐德神思軟件系統(北京)有限
- 河源職業技術學院
- 上海凌華智能科技有限公司
- 浙江銳鷹傳感技術有限公司
- 廈門唯恩電氣有限公司
- 深圳市高川自動化技術有限公司
- 北一半導體科技(廣東)有限公
- 深圳市步科電氣有限公司
- 東莞市凱福電子科技有限公司
- 杭州海拓電子有限公司
- 樂星電氣(無錫)有限公司
- 上海奧深精浦科技有限公司
- 崧智智能科技有限公司
- 珠海運控電機有限公司
- 常州拓自達恰依納電線有限公司
- 浙江省諸暨市精益機電制造有限
- 深圳市多賀電氣有限公司
- 上海贏雙電機科技股份有限公司
- 日沖商業(昆山)有限公司
- 深圳市卓航自動化設備有限公司
- 蘇州市凌臣采集計算機有限公司
- 南京芯馳半導體科技有限公司
- 福建睿能科技股份有限公司
- 深圳市如本科技有限公司
- 常州市常華電機股份有限公司
- 寧波眾諾電子科技有限公司
- 聯誠科技集團股份有限公司
- 山東中科伺易智能技術有限公司
- 廣東奧普特科技股份有限公司
- 上海艾研機電控制系統有限公司
- 長廣溪智能制造(無錫)有限公司
- 句容市百歐電子有限公司
- 深圳市康士達科技有限公司
- 深圳舜昌自動化控制技術有限公
- 昕芙旎雅商貿(上海)有限公司
- 北京科迪通達科技有限公司
- 成都中天自動化控制技術有限公
- 深圳市恒昱控制技術有限公司
- 眾程技術(常州)有限公司
- 深圳市好上好信息科技股份有限
- 常州洛源智能科技有限公司
- 昆山艾尼維爾電子有限公司
- 深圳市迪維迅機電技術有限公司
- 尼得科控制技術公司
- 傳周半導體科技(上海)有限公
- 納博特南京科技有限公司
- 蘇州海特自動化設備有限公司
- 深圳市華成工業控制股份有限公
- 寧波招寶磁業有限公司
- 南京菲尼克斯電氣有限公司
- 長裕電纜科技(上海)有限公司
- 臺州鑫宇海智能科技股份有限公
- 寧波銀禧機械科技有限公司
- 江蘇睿芯源科技有限公司
- 威圖電子機械技術(上海)有限公
- 瑪格電子技術(武漢)有限公司
- 福爾哈貝傳動技術(太倉)有限公
- 武漢華大新型電機科技股份有限
- 永宏電機股份有限公司
- 浙江頂峰技術服務有限公司
- 上海先楫半導體科技有限公司
- 蘇州阿普奇物聯網科技有限公司
- 德纜(上海)電線電纜有限公司
- 廣東英瑞沃電氣科技有限公司
- 南京實點電子科技有限公司
- 廣州豐盈機電科技有限公司
- 深圳市百亨電子有限公司
- 蘇州德勝亨電纜科技有限公司
- 深圳三銘電氣有限公司
- 廣州市能智威電子有限公司
- 嘉興松州工業科技有限公司
- 蘇州途億通科技有限公司
- 上海數恩電氣科技有限公司
- 昆山深裕澤電子有限公司
- 廣東百能堡科技有限公司
- 深圳市嘉揚科技有限公司
- 寧波高勝電子有限公司
- 臺州百格拉機電有限公司
- 上海弓望電子科技有限公司
- 北京一擇自動化科技有限公司
- 昆山精越自動化科技有限公司
- 山東新北洋信息技術股份有限公
- 寧波容眾電氣有限公司
- 江西成穩科技股份有限公司
- 杭州微秦科技有限公司
- 蕪湖藦卡機器人科技有限公司



