亞馬遜Alexa語(yǔ)音助理的“播音腔”是怎樣煉成的?
網(wǎng)友解答: 即日起,美區(qū) Alexa 將能夠以更加自然的方式去閱讀新聞。通過(guò)有選擇性地強(qiáng)調(diào)句子中的某些單詞,升級(jí)后的 Alexa 將擁有媲美新聞播報(bào)員的朗讀技能。去年 11 月,亞馬遜首
即日起,美區(qū) Alexa 將能夠以更加自然的方式去閱讀新聞。通過(guò)有選擇性地強(qiáng)調(diào)句子中的某些單詞,升級(jí)后的 Alexa 將擁有媲美新聞播報(bào)員的朗讀技能。
去年 11 月,亞馬遜首次宣布了 Alexa 智能助理的新聲音,聲稱用戶可通過(guò)語(yǔ)音命令,來(lái)查詢媒體的新聞時(shí)訊。
【“Hey,Alexa!What's the latest news?”(Amelia Holowaty Krales / The Verge)】
據(jù)悉,亞馬遜借助機(jī)器學(xué)習(xí)技術(shù),分析來(lái)自現(xiàn)實(shí)生活中新聞?lì)l道的音頻片段,然后為它創(chuàng)建了具有辨識(shí)度的播報(bào)員模式,為客戶帶來(lái)了全新的聲音(播音腔)。
換言之,在傳統(tǒng)的‘文本到語(yǔ)音’(Text to Speech)技術(shù)之上,亞馬遜給出了‘神經(jīng)文本到語(yǔ)音’(Neural TTS)的新方案。
這意味著,Alexa 知道自己應(yīng)該強(qiáng)調(diào)哪些音節(jié)、以及跳過(guò)哪些部分,而不像之前那樣發(fā)出‘平平無(wú)奇’的聲音。
有趣的是,除了播音腔,Alexa 還能夠在拉取維基百科的頁(yè)面內(nèi)容時(shí),呈現(xiàn)不同的風(fēng)格。
此前,亞馬遜曾嘗試過(guò)不同的 Alexa 語(yǔ)音,比如‘輕聲細(xì)語(yǔ)’模式。但基于機(jī)器學(xué)習(xí)的新方法,有助于快速訓(xùn)練出不同的講述風(fēng)格。
亞馬遜聲稱,其只耗費(fèi)了幾個(gè)小時(shí)的時(shí)間,就能讓 Alexa 像新聞播音員那樣講話。在未來(lái),該公司還有望為 Alexa 用戶帶來(lái)更大的驚喜。