購併常常能激盪出更好的產品。2015年7月中旬樓氏電子(Knowles Corporation)購併語音解決方案供應商Audience後,後者為樓氏帶來三種重要技術,讓樓氏可以推出更完整的降噪處理方案,分別是波束成型(Beam-forming, BF)、盲源訊號分離(Blind-source Separation, BSS)以及機器學習(Machine Learning)。
樓氏電子智慧音效部門軟體產品管理副總裁姜正耀表示,該公司購併Audience後,利用Audience在軟體上的優勢,可提供客戶一站式的解決方案。 |
樓氏電子智慧音效部門軟體產品管理副總裁姜正耀表示,波束成型模式是利用兩個麥克風,由其中之一負責收音,另一個麥克風則負責抑制外部多餘的噪音;盲源訊號分離則使用多顆麥克風,無論該訊號是否有用,都全部將其收錄至裝置中再一併處理訊號。機器學習則是將上述的兩項技術結合,提供許多不同的音訊樣本給人工智慧練習,以辨別哪一些音訊是雜訊。
為了讓機器學習更有效率,須事先分類這些訊息是否有用。整併了Audience之後,該公司的技術可以將環境中的聲音全部整合處理,辨別哪一些訊號是需要的、哪一些音訊可以匹配在一起,而後再將這些訊號做波束成型處理。
無論是波束成型、盲源訊號分離還是機器學習,都需要多麥克風解決方案。姜正耀說明,因為單一個麥克風無法讓裝置做出很好的語音處理;以目前的高端智慧型手機為例,大部分都擁有三個以上的麥克風,甚至有些行動裝置內建了五個麥克風。
姜正耀強調,以目前裝置的應用方式而言,多麥克風絕對是未來趨勢。兩個麥克風的應用,在較為安靜的場所比較合適;但若是多了車聲、小孩哭聲、風噪等因素,會造成收音品質較差,而三個或是多個麥克風的解決方案,則可以將不必要的雜音聲壓制住,雖然無法完全消除,但是表現已算可圈可點。
多麥克風的應用廣泛,以智慧型手機為例,每個使用者持裝置通話時的姿勢不盡相同,有些人可能倒過來拿,也有人躺在床上通話,若是使用多麥克風的解決方案,通話品質也能提升;再者,多麥克風在嘈雜的錄製環境中也可以輕鬆辨別音源是左還是右聲道進入,以目前最流行的VR裝置來說,利用多麥克風的解決方案,更可讓使用者在使用裝置時,更有身歷其境的體驗。