(原標題:谷歌DeepMind AI語音功能接近人類水平) 谷歌的人工智能部門DeepMind之前幫助AlphaGo擊敗圍棋大師。現在DeepMind透露,它已經研發了新款AI,這款被稱為WaveNet的AI,是一種深層神經網絡,可以通過對人類語音進行實時采樣形成原始音頻波形,從而最終創造一些機器所能達到的,最接近于真人的語音。 英語用戶和普通話用戶測試發現,WaveNet性能已經比現有的文本到語音系統更好,但仍然缺乏讓用戶認為是真人講話的說服力。WaveNet,采用真人語音輸入,但學習和模仿這些人的講話,WaveNet可以捕捉不同用戶的聲音,并且模擬他們的身份和說話語調。 同樣令人印象深刻的是,WaveNet甚至可以模擬人類說話時候嘴部氣流產生的雜音,以及模擬語調,情感和口音。不過現在距離谷歌正式推出WaveNet還有很長的道路要走。 |
|