Google為了進一步強化機器學習能力,已秘密自行研發專用的張量處理器(Tensor Processing Unit, TPU)達數年之久。Google在2016年的Google I/O大會上首次對發表這款晶片,並指出這款專為機器學習設計的客製化晶片,在性能/功耗比方面遙遙領先現有解決方案七年,相當於三個摩爾定律(Moore’s Law)週期。
Google執行長Sundar Pichai表示,專為機器學習應用設計的TPU,在性能/功耗比方面,比目前市場上的GPU、FPGA等產品明顯高出一大截,是該公司在發展機器學習上的祕密武器。日前擊敗人類圍棋高手的AlphaGo,就是在內建TPU的電腦上運作。
Google傑出硬體工程師Norm Jouppi在Google官方部落格中揭露更多細節資訊。他表示,對Google而言,機器學習是許多應用服務的基礎,例如街景、Inbox的智慧回信功能及語音搜尋。但Google深知,優秀的軟體在優秀的硬體上執行,成果將更加耀眼,因此Google在數年前便開始秘密研發自有的機器學習應用加速器,而TPU就是該計畫的成果。
TPU是一款客製化的特定應用積體電路(ASIC),專為機器學習,特別是TensorFlow系統所設計。TensorFlow是Google推出的開放原始碼機器學習系統。該款晶片已經在Google自家的資料中心中使用超過一年,根據累積的實測結果顯示,其性能/功耗比大約比一般商用解決方案領先七年,相當於三個摩爾定律週期。
由於是專為機器學習設計,該晶片對運算精準度的需求較為寬容,因此在執行運算時可以使用較少電晶體資源。故相較於一般解決方案,Google可以在自行開發的晶片上執行更多次運算,或使用更複雜的機器學習模型。TPU採用客製化的主機板,透過硬碟插槽整合在資料中心的機架上。
值得一提的是,Google拿到第一片測試晶片後,僅花了22天就把該晶片安裝到自家的資料中心,執行各種應用程式。這顯示Google的晶片設計團隊已具有相當可觀的技術實力。
對於機器學習領域,Google的目標是要維持其產業領先地位,並將創新成果帶給客戶。透過將TPU整合到自家的基礎建設中,Google將可為機器學習開發者帶來更強的應用加速效能。