AI語音服務越來越多樣化,例如化身家庭管家、私人主播,或營養管理師角色,為消費者提供即時又便利的服務,其背後AI演算法的運算能力更是不斷強化,進一步刺激專用型語音DSP的需求。
Cadence亞太區IP銷售總監陳會馨表示,AI語音辨識需求急速攀升,帶動IP相關產品的詢問度與訂單快速增加,同時也造成應用處理器(AP)設計產生改變,催生專用型語音DSP設計當道。
事實上,早期智慧音箱發展起飛時,內部大多採用Arm為基礎的CPU架構,但從2016年開始,許多晶片商為了滿足智慧語音識別處理所需的效能,開始研發專用的語音處理晶片,也開始導入語音DSP在其中。追根究柢,導致晶片設計改變,主要原因在於「運算能力需求的增加」。
眾所皆知,在智慧語音識別過程中,首先須要對進來的語音做前處理,此處理過程包含多麥克風陣列、遠場、波束增強、噪音消除等功能,這些技術對於在地端的運算能力有龐大要求,促使語音DSP技術於近兩年發展快速。換言之,過去可能是單一通道處理技術,如濾波的技術,演變至今,有許多神經網路技術也開始導入其中。
陳會馨指出,現有許多噪音辨識乃是透過人工智慧學習演算法,對原始資料進行分類,進而瞭解資料內部結構,該技術稱之為非監督式學習(Unsupervised Learning Network)。這種演算法的引進,對於晶片硬體的運算能力要求將會比過去AP晶片的要求高出許多,若採用舊有AP晶片技術,將難以滿足此類型技術的運算能力需求。
陳會馨分析,過去AP設計大多並未導入DSP設計,僅採用Arm基礎的CPU架構。雖然仍有部分廠商採用通用型DSP進行訊號處理,但相較於一顆專為語音辨識量身打造的語音DSP,後者能採取較低的工作頻率,完成AI語音所需的工作運算能力與技術規格要求,對於語音處理的效能也將相對提升。基於此,專用型語音DSP設計,無疑開啟另一波殺手級AI語音應用的關鍵推手。