自1984年成立以來,Software Cradle 一直是計算流體力學(CFD)創新的前線。身為 Hexagon 的成員(於 2019 年併入 MSC Software),Cradle 提供業界領先的求解器:scFLOW,這是一款以非結構多面體網格設計的通用流體流動模擬工具;以及 scSTREAM,一款專為電子散熱與熱管理優化設計的快速笛卡爾網格求解器。
在追求效能與效率的過程中,Hexagon 推出了 scFAST,一款完全針對 GPU 優化的 CFD 求解器。專為 NVIDIA Hopper 與 NVIDIA Blackwell 架構設計,scFAST 在模擬速度與可擴充性方面有顯著的突破。
為什麼 GPU 優化如此重要?
傳統 CFD 求解器依賴於 CPU,但 GPU 提供了強大的平行運算能力,可大幅加速模擬過程。scFAST 建基於 scFLOW 的技術基礎,重新設計讓它完全在 GPU 上執行,消除了 CPU 的瓶頸並提升記憶體使用效能。
scFAST 的主要創新
GPU 駐留架構實現極速運算
scFAST 完全在 GPU 上執行,所有資料都保存在 GPU 記憶體中。這種設計消除了 CPU 與 GPU 之間頻繁的資料傳輸,顯著降低延遲並提升整體模擬速度。
採用 RM-MCGS 方法減少記憶體使用
scFAST 的一項突破是採用了減少記憶體需求的Reduced-Memory Multicolor Gauss-Seidel (RM-MCGS) 方法。RM-MCGS 利用 Fréchet 導數,避免儲存大型 Jacobian 矩陣,大幅降低記憶體消耗。這對 GPU 特別有利,因為 GPU 在運算密集型工作中表現優異,但相較於傳統 CPU 叢集,記憶體資源較為有限。
使用具便攜的 OpenMP 程式碼提升硬體適應性
scFAST 使用便攜的 OpenMP 程式碼設計,讓它能夠在多核心 CPU 與 GPU 上高效運行。這使其在不同硬體配置中具備靈活性與適應性,確保能無縫整合到現有的工作流程中。
利用 C++ 模板進行程式碼優化
使用 C++ 模板,scFAST 根據使用者的特定設定生成高度優化的程式碼路徑。這確保了不同模擬場景的效能最大化,提供無與倫比的效率。
性能與效率:450 倍的飛躍
結果一目了然。在一張 NVIDIA H100 GPU 卡上,scFAST 的效能比上一代求解器在 384 個 CPU 執行緒(四顆 AMD EPYC 7763 處理器)上運行快了 15%。這相當於整體性能提升 450 倍,讓工程師能夠在以往所需時間的一小部分內完成高精度模擬。

在單張 GPU 上處理大規模運算
scFAST 的革命性能力之一是能夠在單張 GPU 上處理大規模模擬。每張 GPU 可支援超過 5000 萬個元素,scFAST 讓單 GPU 模擬不再需要多節點的 CPU 叢集。這一突破對航空航太、汽車與能源等行業是很大的變革,因為這些領域很常見大規模 CFD 的運算。

未來展望:1000 倍性能提升與 AI 整合
Hexagon 設計與工程研發與創新副總裁 Subham Sett 表示:「我們很高興能夠為 CFD 用戶提供 scFAST 的早期版本。」今年稍晚,Hexagon 計劃進行更廣泛的發布,並確保完全支援 NVIDIA Blackwell 架構。
此外,Hexagon 正積極投資於更快速的網格生成技術、AI 驅動的降階模型,以及增強的 CAD 整合功能。隨著這些技術的進步,我們有信心提升 1000 倍的生產力,讓高性能 CFD 模擬變得比以往任何時候都更容易、更高效率而且精確。
Hexagon 與 Software Cradle 持續致力於推動 CFD 技術的發展,透過創新來應對複雜的工程模擬挑戰。scFAST 的推出不僅展示了 GPU 優化技術的潛力,也為需要高運算量的產業,像是航空航太、汽車、能源等帶來了全新的模擬可能性。
想了解更多關於Cradle CFD scFAST 求解器 歡迎聯繫我們!