Hewlett Packard Enterprise(HPE)在2024年的ISC High Performance大會上宣布與英特爾(Intel)合作,將HPE第二台百萬兆級超級電腦Aurora交付給美國能源部的阿貢國家實驗室。Aurora只利用87%系統資源便可以達到1.012Exaflops的運算能力,被超級電腦排行榜TOP500譽為全球第二快的超級電腦。Aurora不僅是HPE第二台百萬兆級系統,也是全球最大型、具備AI能力的系統。此外,Aurora僅使用系統89%便達到10.6Exaflops的運算能力,在HPL混合精度(MxP)基準測試中名列第一。
HPE資深副總裁暨HPC與AI基礎架構解決方案總經理Trish Damkroger表示,Aurora的強大運算力將有助於實現突破性的科學發現,並解決世界上最棘手的問題。此次HPE與美國能源部、阿貢國家實驗室和英特爾緊密合作,成功開發出具備巨大規模和運算能力的系統。
百萬兆級運算系統每秒可處理百萬兆次運算,這種規模的運算能力能幫助人類解決最複雜的問題。Aurora使用HPE Cray EX超級電腦所建造而成,專為支援百萬兆級的規模和運算等級而設計。此系統搭載了與乙太網路相容的開放式超級運算互連技術HPE Slingshot,成為這項技術在單一系統上最大規模的部署。此互連技術將Aurora的75,000個運算節點、2,400個儲存與服務網路端點以及5,600個交換器連接在一起,以提高效能並提供大規模的AI運算能力。透過在10,624台運算刀鋒(Blade)伺服器、21,248個Intel Xeon CPU Max系列處理器和63,744個Intel Data Center GPU Max系列之間進行高速網路連接,Aurora堪稱全球最大GPU叢集之一。
Aurora一開始便被設計為具備AI能力的系統,因此研究人員能夠在Aurora上使用生成式AI模型來加速科學探索的進程。研究人員已在Aurora上運行的AI研究包括,透過大腦映射更有效理解人類大腦中的800億個神經元、藉由深度學習加強研究高能粒子物理,以及使用機器學習技術加速藥物設計和發現等等。
Aurora百萬兆級超級電腦是HPE、英特爾、美國能源部和阿貢國家實驗室等政府單位與民營企業密切合作的成果。這些組織透過共同投資與開發,創造出推動科學發展所需的突破性工程技術。Aurora早期科學計畫(Aurora Early Science Program)的工作成果證明公私部門的合作對科學發展至關重要。在系統最佳化和壓力測試過程中,研究人員已成功在該系統上運行各種編程模型、語言和應用程式。
英特爾副總裁暨資料中心與AI解決方案總經理Ogi Brkic表示,Aurora超級電腦的目的是支援高效能運算(HPC)和AI領域的研究和科學社群。
Aurora在所有節點中僅使用了9,234個節點便達到百萬兆級的運算能力。Aurora是設置於阿貢領導運算設施(ALCF)的開放式科學系統,隸屬於美國能源部科學辦公室的用戶設施。