新電子雜誌 » 熱門新聞 » NVIDIA利用AI強化機器合成語音擬真感

NVIDIA利用AI強化機器合成語音擬真感

作者：廖專崇

2021 年 09 月 13 日

過去自動電話語音和 GPS 導航系統都只能發出生硬的機器合成聲音，人工智慧(AI)可以協助讓智慧型手機和智慧音箱中的虛擬助理呈現逼真的語調。不過，AI合成的聲音和人們在日常對話及媒體中聽到的真實人聲之間，還是差了一點，原因在於人們說話時帶有複雜的節奏、音調和音色，這是很難以 AI 仿真出來的。有鑑於此，NVIDIA的研究人員正在打造高品質、可控制的語音合成模型與工具，它們能捕捉人類口語中的豐富細節，又不會聽起來人工感很重。

這些模型有助銀行和零售商的自動語音客服，也能讓電玩遊戲或書籍中的人物更為生動，並即時為數位分身加上合成語音。NVIDIA內部的創意團隊甚至運用這項技術，為一支介紹AI的系列影片製作出富有表現力的旁白內容。

表達性語言合成只是 NVIDIA Research 團隊在對話式 AI 的其中一項研究，此領域還包括自然語言處理、自動語音辨識、關鍵字偵測、音訊增強等。這項研究成果的部分內容已透過NVIDIA NeMo工具套件成為開放原始碼，可以在NGC容器及其它軟體中心取得，並經最佳化調整，能在NVIDIA GPU上高效執行。

另外，NVIDIA的研究人員與創意專家將對話式AI導入該公司的《I AM AI》系列影片中，實際運用語音合成模型，介紹重塑各產業發展的全球AI創新者。過去的語音合成模型對於合成聲音的節奏和音調控制能力有限，因此和真人旁白的影片相比，嘗試以AI製作影片旁白無法激起觀眾的情感。

隨著NVIDIA的文字轉語音研究團隊發展出更強大、控制能力更強的語音合成模型，透過RAD-TTS，使用個人說話的聲音來訓練文字轉語音模型，可以將任何文字提示變成說話者的聲音。聲音轉換是它的另一項功能，例如畫面上是A在說話(甚至是唱歌)，觀眾們聽到的卻是B的聲音。設計RAD-TTS介面的靈感來源是將人的聲音當成一種樂器，使用者便能夠逐幀微調合成聲音的音調、持續時間和能量。

影片製作人可以使用這個介面，錄製自己讀出影片腳本的聲音，接著用 AI 模型將說話內容變成女性旁白者的聲音。製作人可以再運用這個基本的旁白內容，像配音員一樣指導AI並進行調整，讓合成出來的語音強調特定字眼、修改旁白節奏，以更貼切地表達影片的調性。

該AI模型不只能用在配音上：文字轉語音的功能還能用在遊戲、協助聲音機能或語言機能障礙者，或幫助使用者用自己的聲音翻譯不同語言；甚至還能重現著名歌手的表演，不僅可以配合歌曲旋律，還能配合人聲背後所表達的情感。

標籤

近期研討會 More

2025-04-22 【實體活動】4月22日Edge AI 技術開發暨應用交流大會

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

從自動化走向自主化 AI代理進軍製造現場

聯電新加坡廠擴建落成 強化全球多元生產基地布局

美超微AI產品線升級 支援最新款NVIDIA GPU

NVIDIA GTC大會開跑 雲端/邊緣AI新品同步發表

晶片功耗進入千瓦級世代 超流體散熱勢在必行

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

新技術/新應用層出不窮 顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進 成運董事長吳定發：智慧綠色公共運輸趨勢不變

GAI賦能製程再進化 機器人自主運行前景可期

5G/WiFi無痕匯流 重塑企業無線網路

數位棋局新布局：韓國遊戲產業的AI突破與創新

從2D FET到2D CFET 製程微縮帶動2D材料需求(1)

從2D FET到2D CFET 製程微縮帶動2D材料需求(2)

低精度高性能：NVIDIA FP4格式如何加速AI應用新時代

特斯拉機器人的三重戰略：技術突破、供應鏈整合與市場開拓

SEMI：2025年全球晶圓廠設備投資可望達1100億美元

量子技術突破不斷 產業進入高速成長期

CounterPoint：2025年GenAI智慧手機普及率將超越三成

全球晶圓代工產業2024年第四季營收年增26%

固態電池加速商業化 歐美廠商預計2026年量產首代產品

貿澤電子供貨安森美Acuros CQD短波紅外線相機

安立知於OFC 2025展示全光網路通訊品質驗證技術

元太/友達合資成立電子紙模組生產線 預計2025年投產

Molex推出VersaBeam EBO光纖互連解決方案 提升資料中心部署效率

是德科技推出AI資料中心建構工具 提升AI訓練效能模擬能力

NVIDIA利用AI強化機器合成語音擬真感

Xilinx AI轉型拉攏資料中心 劍指Intel、NVIDIA

NVIDIA攜手VMware力推AI Enterprise 軟體套件

NVIDIA/佛羅里達大學合作打造教學用AI超級電腦

NVIDIA推出BlueField DPU系列產品

元宇宙商機近在眼前 NVIDIA智慧模擬再進化

美超微AI產品線升級 支援最新款NVIDIA GPU

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

【成功案例分享】即刻下載！ROHM使用Siemens Tanner提供一流的dual MOSFET元件

【熱門白皮書】快來下載！類比混合訊號驗證方法論

合聖總經理伍茂仁：矽光子需求大爆發 光通產業擴產潮到來

Silicon Labs亞太區暨日本業務副總裁王祿銘：2025物聯網/邊緣AI深度結合創新局

ams OSRAM Rest of Asia技術行銷總監李定翰：光與AI融合深化感測技術/應用

Qorvo資深產品行銷經理陳慶鴻：高整合/低電壓射頻前端再進化

以研發實力為根基 搭配國際策略合作 WAFERLOCK維夫拉克 插旗服務型機器人市場

數位棋局新布局：韓國遊戲產業的AI突破與創新

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

貿澤電子供貨安森美Acuros CQD短波紅外線相機

安立知於OFC 2025展示全光網路通訊品質驗證技術

元太/友達合資成立電子紙模組生產線 預計2025年投產

數位棋局新布局：韓國遊戲產業的AI突破與創新

政府補貼引領電動巴士智慧化 產業永續發展還需完善配套

新技術/新應用層出不窮 顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進 成運董事長吳定發：智慧綠色公共運輸趨勢不變

從2D FET到2D CFET 製程微縮帶動2D材料需求(1)

從自動化走向自主化　AI代理進軍製造現場

聯電新加坡廠擴建落成　強化全球多元生產基地布局

美超微AI產品線升級　支援最新款NVIDIA GPU

NVIDIA GTC大會開跑　雲端/邊緣AI新品同步發表

晶片功耗進入千瓦級世代　超流體散熱勢在必行

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

新技術/新應用層出不窮　顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進　成運董事長吳定發：智慧綠色公共運輸趨勢不變

GAI賦能製程再進化　機器人自主運行前景可期

5G/WiFi無痕匯流重塑企業無線網路

從2D FET到2D CFET　製程微縮帶動2D材料需求(1)

從2D FET到2D CFET　製程微縮帶動2D材料需求(2)

量子技術突破不斷　產業進入高速成長期

固態電池加速商業化　歐美廠商預計2026年量產首代產品

元太/友達合資成立電子紙模組生產線　預計2025年投產

Molex推出VersaBeam EBO光纖互連解決方案　提升資料中心部署效率

是德科技推出AI資料中心建構工具　提升AI訓練效能模擬能力

Xilinx AI轉型拉攏資料中心　劍指Intel、NVIDIA

元宇宙商機近在眼前　NVIDIA智慧模擬再進化

美超微AI產品線升級　支援最新款NVIDIA GPU

合聖總經理伍茂仁：矽光子需求大爆發　光通產業擴產潮到來

以研發實力為根基　搭配國際策略合作　WAFERLOCK維夫拉克插旗服務型機器人市場

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

元太/友達合資成立電子紙模組生產線　預計2025年投產

政府補貼引領電動巴士智慧化　產業永續發展還需完善配套

新技術/新應用層出不窮　顯示驅動IC機會眾多

大客車電氣化/智慧化同步推進　成運董事長吳定發：智慧綠色公共運輸趨勢不變

從2D FET到2D CFET　製程微縮帶動2D材料需求(1)