芯片散熱產業鏈分析報告-第三代半導體產品介紹以及材料應用-晁元國際有限公司

晁元國際半導體股份有限公司

搜尋

第三代半導體材料可以推展無線充電

01

晶片散熱概覽

▌晶片散熱起源:電子設備發熱的本質是工作能量轉成熱能

電子設備發熱的本質原因就是工作能量轉化為熱能的過程。晶片作為電子設備的核心部件,其基本工作原理是將電信號轉化為各種功能信號,實現資料處理、存儲和傳輸等功能。而晶片在完成這些功能的過程中,會產生大量熱量,這是因為電子信號的傳輸會伴隨電阻、電容、電感等能量損耗,這些損耗會被轉化為熱能。

溫度過高會影響電子設備工作性能,甚至導致電子設備損壞。據《電子晶片散熱技術的研究現狀及發展前景》,如對於穩定持續工作的電子晶片,最高溫度不能超過85 ℃,溫度過高會導致晶片損壞。

散熱技術需要持續升級,來控制電子設備的運行溫度。晶片性能持續發展,這提升了晶片功耗,也對散熱技術提出了更高的要求。此外,AI大模型的訓練與推理需求,要求AI晶片的單卡算力提升,有望進一步打開先進散熱技術的成長空間。

▌散熱技術原理:電子設備發熱的本質是工作能量轉成熱能

散熱是為解決高性能計算設備中的熱管理問題而設計的, 它們通過直接在晶片或處理器表面移除熱量來優化設備 性能並延長使用壽命。隨著晶片功耗的提升,從一維熱管的線式均溫,到二維 VC的平面均溫,發展到三維的一體式均溫,即3D VC 技術路徑,最後發展到液冷技術。

▌晶片散熱革新:浸沒式散熱效果好,冷板式更為成熟

根據ODCC《冷板液冷伺服器設計白皮書》,綜合考量初始投資成本、可維護性、PUE 效果以及產業成熟度等因素,冷板式和單相浸沒式相較其他液冷技術更有優勢,是當前業界的主流解決方案。

02

主要散熱技術

▌熱管:高效傳熱器件,適用大功率和空間小場景

熱管,也稱為Heat Pipe,是一種高效的傳熱器件。它能夠通過內部工作流體 的相變過程,快速地將熱量從一端傳遞到另一端,其結構簡單,由密閉容器、 毛細結構、工作流體組成。熱管具有高導熱性能、溫度均勻與等溫性等特點。用於大功率晶片及散熱空 間小的產品,如筆記本、伺服器、遊戲機、VR/AR、通信設備等。

▌VC:相比熱管,具備更高的導熱效率與靈活性

VC均溫板,全稱為Vapor Chamber,即真空腔均熱板散熱技術,是一種比熱管更先進、更高效的導熱元件,尤其在處理高密度電子設備的熱管理問題時表現出色。相比熱管,VC的導熱效率與靈活度更強。銅的導熱係數為401W/m.k,熱管可以達到5000~8000 W/m‧k,而均熱板則可以達到20000~10000W/m‧k,甚至更高。熱管是一維導熱,受其形狀顯示。而均熱板形狀則不受限制,可以根據晶片的佈局,設計任意形狀,甚至可以相容處於不同高度的多個熱源的散熱。

▌機房空調:水冷空調相對風冷系統製冷效果好

風冷直膨式系統:是一種空調系統,主要用於中小型建築或單獨房間的製冷和制熱。製冷劑一般為氟里昂,單機製冷量10-120KW。水冷冷水系統:一種中央空調系統,通過使用水作為冷卻介質來傳遞熱量。這種系 統一般由冷水機組、冷卻塔、水泵和管道等組成,廣泛應用於大型建築。

▌液冷:冷板式與浸沒式液冷為主

伺服器液冷分為直接冷卻和間接冷卻,直接冷卻以浸沒式為主,間接冷卻以冷板式為主。冷板式液冷的冷卻液不與伺服器元器件直接接觸,而是通過冷板進行換熱,所以稱之為間接液冷。依據冷卻液在冷板中是否發生相變,分為單相冷板式液冷及兩相冷板式液冷。浸沒式液冷是將整個伺服器或其組件直接浸入液體冷卻劑中的冷卻方式。

▌冷板式液冷:需改造伺服器,滲透率逐漸提升

冷板式伺服器需要對伺服器進行管路、結構等改造:如浪潮資訊基於2U四節點高密計算 伺服器i24,新增多塊冷板與CPU、I/0、記憶體等發熱單元接觸,也設置多條管路在內與冷 板連通、在外連接機櫃級別的分歧管道,實現系統中95%左右熱量通過冷板接觸熱源由液 體直接帶走,剩餘5%左右熱量經由PSU電源後置的風液式換熱器裡面的冷卻水帶走。

冷板式液冷伺服器對原有伺服器結構進行改造,考慮到職責歸屬、組裝方式等因素,主要 玩家認為原有伺服器廠商;伺服器廠商採取採購冷板、管道等原材料,隨後自行組裝等方 式進行生產加工。冷板式液冷伺服器平均價格或高於風冷伺服器,隨著其滲透率提升, 伺服器廠商有望實現量價齊升與盈利水準的增長。

▌浸沒式液冷:液體浸泡伺服器整體,技術要求高

浸沒式液冷是將整個伺服器或其組件直接浸入液體冷卻劑中的冷卻方式。液 體完全包圍伺服器元件,從而更加高效地吸收和散發熱量。按照工程液體散熱 過程中是否發生相變,可以分為單相浸沒式液冷及兩相浸沒式液冷。浸沒式液冷伺服器對伺服器進行了外殼設計、主機板改造、散熱系統升級、密 封性等多重改造設計,對技術要求較高,主要由伺服器廠商進行生產。

03

市場空間

▌驅動1:晶片防護安全性,溫度控制有利於發揮晶片極致性能

晶片溫度過高會影響設備工作性能,甚至導致電子設備損壞。據《Cabont e ch Maga z ine》,當電子設備溫度過高時,工作性能會大幅度衰減,當晶片的工作溫度靠近70-80℃ 時,溫度每升高10℃,晶片的性能會降低約50%,有超過55%的電子設備失效形式都是溫度過高引起的。我們認為,隨著AI大模型發展、晶片性能提升,晶片功耗及運行溫度呈增長趨勢,或影響處理器等的工作效率。這對晶片級散熱等技術提出更高的要求,晶片級散熱有望打開成長空間、實現量價齊升。

▌驅動2:AI大模型發展+晶片性能增長,晶片功耗持續提升

伺服器中CPU、GPU晶片功耗占比較高。根據《資料中心伺服器功耗模型研究進展》,通用伺服器內CPU、記憶體、存儲等器件功耗占比為32%、14%、5%。AI伺服器具備“CPU+GPU”等異構結構,GPU高功耗帶動伺服器功耗提升,如英偉達H100GPU功耗高達700W,DGX H100伺服器最大功耗10.2kW,GPU功耗預計占伺服器總功耗的55%左右。晶片功耗持續提升:如Int e l的I c e Lake CPU功耗最高270W,2024年預期推出的Gr anit e Rapids CPU預期功耗預期更高。2024年英偉達推出的B200 GPU,功耗達到1000W。未來隨著晶片性能提升與AI大模型逐漸發展,推動CPU\GPU等晶片功耗不斷提升,帶來廣闊的先進散熱器件需求。

▌驅動 3:“雙碳”與東數西算等政策要求降低資料中心PUE

PUE = 資料中心總能耗/IT設備能耗。PUE是評價資料中心能源效率的核心指標,其數值越接近1,表示資料中心能效越高。空調系統在資料中心能耗占比僅次於IT設備,在無法升級IT系統時,降低空調系統能耗是重要環節。當空調系統能耗占比從38%下降到18%時,資料中心的PUE也從1.92下降到1.3.

“雙碳”與東數西算等政策要求降低資料中心PUE。據Uptime Institut e,截至2022年全球中大型資料中心平均PUE為1.55,根據《中國資料中心產業(寧夏)發展白皮書(2022年)》,2021年全國IDC平均PUE為1.49。“雙碳”和“東數西算”雙重政策下,全國新建大型、超大型資料中心平均PUE降到1.3以下,集群內PUE要求東部≤1.25、西部≤1.2,先進示範工程≤1.15。

根據CDCC與浪潮資訊,風冷方案資料中心PUE一般在1.4-1.5左右,而液冷資料中心PUE可降低至1.2以下,滿足相關的政策要求。我們認為,採用更加節能、效率較高的散熱技術是大勢所趨,液冷技術或將進一步打開成長空間。

▌晶片散熱市場:高端處理器出貨高增+功耗提升,驅動量價齊升

隨著AI晶片及AI伺服器的市場規模擴大,且晶片功耗增長提高散熱要求,我們認為晶片級散熱市場規模增速有望提升。AI晶片及AI伺服器市場快速增長,英偉達營收連續三季度同比翻倍增長。據Precedence,預期2026年全球AI晶片市場規模477億美元,2024-2026年CAGR為29.72%;FY2024 Q4,英偉達收入達221億美元,環比+22%、同比+265%,實現營收連續三季度同比翻倍增長。據S tati s ti c s,預期2026年全球A I伺服器出貨量達到2 36.9萬台,2024-2026年預期CAGR為25.50%。AI晶片功耗能力提升,散熱市場規模增速有望提升。2024年,英偉達發佈B200,採用N4P制程,封裝2080億電晶體,而H100電晶體為800億、採用N4制程,這帶來B200封裝密度提升、功耗達1000W,對散熱技術提出更高要求。

▌電信運營商:預期2 0 2 5年液冷或將達到50%滲透率

電信運營商或推動液冷技術逐步開展技術驗證、規模實驗。2023年,三大運營商聯合發佈液冷技術白皮書,提出“三年願景”:1)2023年:液冷產業開展技術驗證,充分驗證液冷技術性能,降低 PUE,儲備規劃、建設與維護等技術能力;2)2024年:開展規模測試,新建資料中心專案10%規模試點應用液冷技術,推進產業生態成熟。推進液冷機櫃與伺服器解耦,促進競爭,推進產業生態成熟,降低全生命週期成本;3)2025年:開展規模應用,50%以上資料中心專案應用液冷技術,共同推進形成標準統一、生態完善、成本最優、規模應用的高品質發展格局。