如同網路的出現顛覆了人際互動的模式,隨著網路數據變得更加普遍,數據所代表的角色不再只是事件、影音、測量結果的記錄或流水帳。反之,有效運用的數據能更增添生活的便利性,讓消費者在導航、理財、購物或管理日常活動時更有效率,而數據所帶來的價值和資訊也更將朝貨幣形式發展。現今,所講求的不再只是儲存資料,而是該如何擷取、保存及加以轉換來挖掘出數據中所蘊含的各種可能性。
即時決策需求增 快數據應用趁勢崛起
數據在演進方向上的變化,也產生了需要分析大量且不同資料的大數據應用,即透過運算及演算法找出其中的趨勢、模式與關聯性;而這些情報與資訊能產生新的連結點,進而推動更精準的預測及決策,並改善商業、科學或營運結果。
不過,除了過往資訊的大數據分析之外,現今的數據應用還必須能夠在訊息發生的同時立即分析。
因此,一種和大數據同時出現,稱為快數據(Fast Data)的應用則應運而生。不同於大數據,快數據會運用大數據的演算法提供即時的決策與結果,在擷取到數據的當下立即處理或轉換成有價值的資訊。
換句話說,大數據所提供的洞察力,是根據「已發生的現象」去預測「可能會發生的情境」,即預測性分析;而快數據所提供的洞察力則是來自即時的狀況。因此對於極需即時分析、解答並採取行動的「智慧型」機器,像是環境監測器、安全監視系統、證券交易系統等設備來說,快數據是不可或缺的。
在這場大數據革命發生的同時,現今大多數的資料中心都是使用通用型(General-purpose)處理器為基礎,來管理與控制這些龐大數據集。隨著大數據應用持續演進,像是人工智慧、機器學習和分析技術等應用的出現,以及來自於行動裝置、監控系統和智慧型機器的數據,這些作為快速數據應用程序的分析數據更加劇了專用化(Purpose-built)運算結構和功能的需求。
通用運算漸感吃重 專用化處理器興起
部份產業的處理器技術已逐漸的從通用型中央處理器(CPU)轉向專用化處理器,如繪圖處理器(GPU)、現場可程式邏輯閘陣列(FPGA)、特定應用IC(ASIC)等以解決特定領域需求。雖說一般通用型電腦運算可加以改良與優化,以支援基本大數據與快數據應用,但不可否認的是,現今需求早已遠遠超越一般通用處理器運算能力所能提供的範圍。因此產業不該只著重於其運算能力,設計的整體架構才更是其核心。
當談到一般的運算,通常所有焦點都圍繞著CPU而非數據。CPU決定多少記憶體或輸入/輸出可用、提供分母平均數後的最低資源分配額。相對之下,快數據應用、機器學習或基因組學(Genomics)環境所能得到的資源效能比例最佳化之可能性相當低。這不代表著通用型運算是不好的,因為它仍可支援多種應用,但須重新思考或糾正的,正是這種「通用運算可以解決所有問題」的觀念,半導體商必須開始考慮採用專用化處理。
大數據/快數據應用增專用化處理商機湧現
隨著各種密集性數據承載的湧現,全新商機也隨之出現,無論是以儲存為主的架構(支援大數據應用)或以記憶體為主的架構(支援快數據應用),都對專用化處理出現一系列新需求。由於大數據對於儲存有以千兆位元組(Petabyte)計的龐大需求,它的處理需求可能也會有所不同。舉例而言,資料分析在執行工作時只需要適度的處理與運算能力,但在機器學習的環境下,就必須持續進行巨量的專用化處理才能教育機器,而這時處理功能的需求就大不相同。
相反地,快數據應用必須能馬上存取及處理對應的數據以滿足安全偵測(錄影監視)、事件關聯性(分析不同事件之間的關係)和區塊鏈(透過密碼保護記錄區塊的安全)等應用的需求(圖1)。這種狀況下除了專用化處理,龐大記憶體也扮演著關鍵角色,因為相較於透過深層輸入/輸出來進行操作,大容量的主記憶體更能即時輸送數據進行處理,解決原先無法解決的問題。
而現今根深蒂固的觀念:「把CPU視為萬用靈丹,讓它主宰有多少記憶體、輸入/輸出可用,以及決定能運用資源的多寡。」其實會更阻撓相關需求的發展。
開發創新應用 邊緣運算成關鍵
對某些應用來說,是否能夠支援在「邊緣(edge)」,亦即數據所在的裝置或系統,進行資料運算並蒐集數據以獲取即時情報,也至關重要。許多創意的新應用都是為此設計開發,從即時擷取的內容當中找出具有價值的數據。
以目前運算技術的進展而言,目前產業現已取得一定的進展,能夠在物聯網(IoT)和工業物聯網(IIoT)設備和系統中實現這些新的應用概念。例如,RISC-V開放指令集架構(ISA)便扮演了重要的角色。
RISC-V滿足大數據/快數據工作承載
RISC-V是一種指令集架構,能透過開源標準協作推動處理器創新。它為軟硬體在處理器架構方面的開放性與延伸性,提供了全新層次的自由空間,更為全新世代的運算設計及創新預先鋪路。相較之下,有些商用晶片廠商則會針對自家的專用原始碼及專利收取使用授權費。
另外,RISC-V採用開放的模組化手法,適合當作數據中心運算架構的基礎。作為作業系統處理器,它能支援資源的獨立擴張,藉此打造專用化架構。它的模組式設計還能提升處理器效率,讓它們可以支援遠端移動系統。隨著大數據與快數據應用開始帶來更多極端的工作承載,未來將會需要專用化架構來彌補現有通用型架構的極限(圖2)。
無論是大數據應用、支援人工智慧、機器學習與分析技術等的儲存式架構,或是支援快數據、各種邊緣與即時性應用的記憶體架構,RISC-V都具備必要的能力、基礎、生態系統與開放程度。同時,RISC-V提供了16到128位元的獨立擴充能力,模組設計適合嵌入式應用與企業應用;更可同時跨界大數據與快數據應用,且無論在儲存式架構或記憶體架構下,都能支援各種不同的功能和數據處理,從數據中提供價值,有助於推動處理器設計從以CPU為主,邁向以數據為中心的模式。
記憶體供應商認為RISC-V將開啟大量商機,其不僅可以延伸數據中心架構、納入新的指令,還能於資料所在處進行處理,而不必傳送至資料中心,免除不必要的數據傳送。換言之,透過RISC-V,大數據和快數據環境開發專用型處理器的大門已經打開,為設備上擷取的數據增加價值。