人工智能語(yǔ)音現(xiàn)狀 人工智能技術(shù)和智能語(yǔ)音技術(shù)的區(qū)別有哪些?
人工智能技術(shù)和智能語(yǔ)音技術(shù)的區(qū)別有哪些?智能語(yǔ)音技術(shù)是人工智能領(lǐng)域落下時(shí)運(yùn)用最好的技術(shù)之一,是普通人外界人工智能的有用窗口。智能語(yǔ)音僅是語(yǔ)義推測(cè),相對(duì)很簡(jiǎn)單。人工智能真包含智能語(yǔ)音,應(yīng)用領(lǐng)域總體應(yīng)用廣
人工智能技術(shù)和智能語(yǔ)音技術(shù)的區(qū)別有哪些?
智能語(yǔ)音技術(shù)是人工智能領(lǐng)域落下時(shí)運(yùn)用最好的技術(shù)之一,是普通人外界人工智能的有用窗口。
智能語(yǔ)音僅是語(yǔ)義推測(cè),相對(duì)很簡(jiǎn)單。人工智能真包含智能語(yǔ)音,應(yīng)用領(lǐng)域總體應(yīng)用廣泛,某個(gè)特定領(lǐng)域也更難開(kāi)發(fā)。
人工智能涵蓋面的內(nèi)容很多,智能語(yǔ)音一類AI領(lǐng)域的一個(gè)子領(lǐng)域,是可以如果說(shuō)他們兩者是乾坤二卦和被包含的關(guān)系
如何解決人工智能的智能語(yǔ)音問(wèn)題?
因?yàn)闋可娴降降膯?wèn)題都很多,我盡量以更通俗語(yǔ)言來(lái)具體解釋。
智能語(yǔ)音真包含幾個(gè)層面:1語(yǔ)音合成;2語(yǔ)音識(shí)別;3語(yǔ)義識(shí)別。
1語(yǔ)音合成
日常生活中更多的見(jiàn)于導(dǎo)航軟件、聽(tīng)書(shū)軟件、銀行系統(tǒng)智能語(yǔ)音機(jī)器人、上門推銷等,將文字是從語(yǔ)音展示出不出來(lái)。和語(yǔ)音識(shí)別比起,語(yǔ)音合成的技術(shù)相對(duì)于說(shuō)來(lái)要完全成熟那些,并已又開(kāi)始大規(guī)模行動(dòng)商用中。
語(yǔ)音合成技術(shù)的最的問(wèn)題在2個(gè)方面:
1)文本不規(guī)整、詞的切分、語(yǔ)法分析和語(yǔ)義分析。
舉個(gè)例子,“我是人”,這句話真包含“我”,“是”,“人”三個(gè)詞或詞組,主、謂、賓關(guān)系清晰,只不過(guò)就現(xiàn)有技術(shù)水平來(lái)說(shuō),還需進(jìn)一步增強(qiáng),聽(tīng)書(shū)軟件中,我們經(jīng)常聽(tīng)了的是勻速運(yùn)動(dòng)大聲朗讀,還沒(méi)有太很明顯的斷句和詞組切分。
2)缺少情感。
更多的是照念式朗讀文章,情緒變化不肯定,很順耳都很生硬。在有所不同的語(yǔ)境下,語(yǔ)言和文字代表意思已經(jīng)差別,倒致音量、音色、減弱長(zhǎng)短等也有了完全不同。
相對(duì)而言,語(yǔ)音識(shí)別成熟度比語(yǔ)音識(shí)別、語(yǔ)義識(shí)別更好,推廣和商業(yè)化運(yùn)作程度比較比較好,可是一定程度上還必然不足以,但隨著語(yǔ)法分析、語(yǔ)義分析技術(shù)的提升,這樣,語(yǔ)音合成效果也將是越來(lái)越棒。
2語(yǔ)音識(shí)別
一句話概括,按照識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)變化為或則的文本或命令的技術(shù)。
目前市場(chǎng)通常集中行業(yè),比如說(shuō)公安、司法(檢查院、法院)、邊檢等,較常見(jiàn)于會(huì)議、刑訊、庭審、問(wèn)過(guò)等。同語(yǔ)義理解、語(yǔ)義識(shí)別比較好來(lái)說(shuō),難度介乎二者之間。
語(yǔ)音交互比較多的產(chǎn)品主要有:
1)短語(yǔ)音,主要常見(jiàn)于個(gè)人通信,簡(jiǎn)短精悍交流等場(chǎng)合。
2)長(zhǎng)語(yǔ)音,要注意多見(jiàn)于會(huì)議記錄等。
3)實(shí)時(shí)語(yǔ)音,要注意作用于在旁邊能接收音頻數(shù)據(jù),在旁邊需要提供錄音轉(zhuǎn)寫結(jié)果,都能夠動(dòng)態(tài)實(shí)時(shí)某些和依靠文字信息。
語(yǔ)音識(shí)別難點(diǎn)取決于人幾個(gè)方面:
1)識(shí)別準(zhǔn)確率。據(jù)分析,電視臺(tái)/廣播電臺(tái)的播音員語(yǔ)音識(shí)別率換算下來(lái)約80-85%(當(dāng)然,某些情況下也可能達(dá)到90,這里講的是你算算水平),更別提一般普通人了。
2)環(huán)境造成負(fù)面影響。諸如車輛、工地、空調(diào)、會(huì)議噪聲等,會(huì)對(duì)語(yǔ)音識(shí)別有都很大的影響。
3)口音差異。各省各地的方言差異較小,必須充足的訓(xùn)練集來(lái)訓(xùn)練。
4)互聯(lián)網(wǎng)時(shí)代,新的詞語(yǔ)層出不窮,需要定期更新詞庫(kù)。
5)音調(diào)、音量、音色、聲音持續(xù)等,也會(huì)對(duì)最終造成很大的影響。
總的說(shuō)來(lái),語(yǔ)音識(shí)別效果也可以逐漸優(yōu)化軟件,行業(yè)應(yīng)用中,最好就是變動(dòng)到最佳狀態(tài)。
3語(yǔ)義識(shí)別
舉個(gè)通俗的例子來(lái)那說(shuō)明“語(yǔ)音識(shí)別”與“語(yǔ)義分析”在人工智能技術(shù)層次上的不同:用戶對(duì)著電視機(jī)說(shuō)一部具體看的電影或者電視劇的全名,電視機(jī)會(huì)對(duì)用戶語(yǔ)音通過(guò)識(shí)別,不自動(dòng)收索片名、可以播放,這那是“語(yǔ)音識(shí)別”可是,如果用戶對(duì)電視機(jī)說(shuō)“一部愛(ài)情片”、“正熱播的動(dòng)作片”、“導(dǎo)演的電影”、“好萊塢大片”等模糊不堪語(yǔ)句,電視機(jī)依據(jù)什么用戶的性別、愛(ài)好、平時(shí)的點(diǎn)播傾向等特征來(lái)進(jìn)行智能的分析,并參與精準(zhǔn)的推薦,這是“語(yǔ)義分析”,在智商上比“語(yǔ)音識(shí)別”高了好幾個(gè)層次,領(lǐng)先對(duì)手一大步。
最常見(jiàn)的如智慧家居、車載語(yǔ)音、可穿戴設(shè)備、VR、機(jī)器人等。
語(yǔ)義識(shí)別難點(diǎn)本質(zhì)幾個(gè)方面:
1)詞序的變化,主謂關(guān)系的顛倒或省略。例如港臺(tái)片中的“我走先”,能夠語(yǔ)法中是沒(méi)有此說(shuō)法,但是這個(gè)叫法現(xiàn)在大家都懂,不過(guò)機(jī)器一點(diǎn)不懂。
2)語(yǔ)境的影響。
舉個(gè)生活中的一個(gè)例子,女朋友給男朋友打個(gè)
女:我在電影院門口等你,晚上7五點(diǎn)半我沒(méi)有到的話,你等下;
女:我在電影院門口等到你,晚上7點(diǎn)鐘你是沒(méi)有到的話,你等下;
很確實(shí),語(yǔ)境稍有變化,導(dǎo)致的語(yǔ)義幾乎有所不同。
我認(rèn)為,語(yǔ)義識(shí)別最難,目前市面上可是有部分產(chǎn)品試用,但還達(dá)將近如此大規(guī)模正式商用的水平。況且另外一個(gè)話題-聲紋識(shí)別,要注意運(yùn)用在公安、司法領(lǐng)域,應(yīng)用于取證和預(yù)警等,在今天談些的范圍內(nèi)。以后有機(jī)會(huì)再聊。
大家有疑問(wèn),也可以私聊我交流探討。