NVIDIA提升TPCx-BB運算表現 破大數據分析基準紀錄 - 產業動態 - 新電子科技雜誌 Micro-electronics


熱門關鍵字:電源模組 | SiC | 機器視覺 | GaN | 5G

訂閱電子報

立刻輸入Email,獲取最新的資訊:


收藏功能:
分享報新知:
其他功能:

NVIDIA提升TPCx-BB運算表現 破大數據分析基準紀錄

發布日期:2020/07/06 關鍵字:NVIDIACPUGPUTPCx-BB大數據分析

NVIDIA(輝達)剛向世人展現出一舉刷新舊紀錄的實力,將運行 TPCx-BB 這項大數據分析基準的效能表現提高近20倍。

NVIDIA 使用由 16 台 NVIDIA DGX A100 系統支援的 RAPIDS 開源資料科學軟體庫套件,僅花費 14.5 分鐘便完成了這項基準測試,而對比先前的紀錄,使用 CPU 系統花了 4.7 小時才完成測試。這 16 台 DGX A100 系統共有 128 個 NVIDIA A100 GPU,並且使用 NVIDIA Mellanox 網路技術。

在進行分析之際,實際結果的重要性不言而喻;而在實際環境中,組織使用人工智慧 (AI) 來取得深入的見解。TPCx-BB 基準測試在進行查詢時,是使用 SQL 和機器學習來處理結構化資料,以及使用自然語言處理和非結構化資料,反映出現代資料分析工作流程中的多樣性。

這些結果樹立出一個新的標準,而這個新標準的背後推手是透過 NVIDIA 的軟硬體商業生態體系所獲得。

在運行此一測試基準時,NVIDIA 在資料處理與機器學習方面用上了 RAPIDS、在水平擴展方面用上了 Dask,在超高速通訊方面則用上了 UCX 開源函式庫,並且全都在 DGX A100 上加速運行。

DGX A100 系統可以在單一軟體定義平台上,有效推動進行分析、AI 訓練與推論等作業。DGX A100 將 NVIDIA 最新的 Ampere 架構 NVIDIA A100 Tensor Core GPU 與 NVIDIA Mellanox 網路技術整合在一起,構成了一個易於擴展的一站式系統。

TPCx-BB 是一個用於企業的大數據基準,代表現實環境中的 ETL (擷取、轉換、載入) 與機器學習工作流程。該基準的三十個查詢項目包括庫存管理、價格分析、銷售分析、推薦系統、客戶區隔和觀點分析等大數據分析使用案例。

儘管分散式運算系統不斷穩定進步著,但在 CPU 上進行這類大數據分析工作仍會遇到瓶頸。在 DGX A100 上使用 RAPIDS 進行分析的結果,象徵著第一個在 GPU 上進行的非正式 TPCx-BB 基準,而這項測試基準過去只在 CPU 系統上運行。

在這項測試基準中,RAPIDS 軟體商業生態體系與 DGX A100 系統加快了運算、通訊、網路及儲存基礎架構的運行速度,而這種整合為大規模運行資料科學工作量奠定新的標竿。

在 SF10000 TPCx-BB 的規模方面,NVIDIA 的測試結果代表著分析 10TB 以上資料量的表現。

透過這麼大的資料量進行查詢,其複雜度會迅速拉長執行時間,進而增加資料中心於空間、伺服器設備、電力、冷卻和 IT 專業技術等方面的開銷。彈性的 DGX A100 架構可以協助資料中心因應這些難題。

NVIDIA 的硬體合作夥伴即將推出全新的 NVIDIA A100 Tensor Core GPU 系統,資料科學家就會有更多選擇,在 A100 GPU 突破性運算效能的協助下,加速處理各項繁重的分析工作。

許多合作夥伴與開源團體積極參與 RAPIDS TPCx-BB 基準 這項專案。

將一連串使用 RAPIDS DataFrame 函式庫、cuDF、RAPIDS 機器學習函式庫、cuML、CuPy、BlazingSQL 及 Dask 的 Python 腳本當成主要函式庫來進行TPCx-BB 查詢作業。在使用者定義的函數中使用 Numba 來執行自訂邏輯項目,在命名實體識別 (Named Entity Recognition) 則是使用 spaCy。

少了 RAPIDS 及更龐大的 PyData 商業生態體系,便無法達到這些成果。

欲瞭解更多關於 RAPIDS 測試基準的結果,請參閱 RAPIDS Blog。更多關於 RAPIDS 的資訊,請瀏覽 rapids.ai。

研討會專區
主題式電子報
熱門文章