tensorflow框架 在電腦上如何進(jìn)行語(yǔ)音識(shí)別?
在電腦上如何進(jìn)行語(yǔ)音識(shí)別?有幾種方法:使用電腦的功能,使用第三方軟件,使用第三方網(wǎng)站。無(wú)論是windows、MAC還是Linux的某些發(fā)行版,它們都有自己的語(yǔ)音識(shí)別工具。但這些工具的性能一般,精度不高
在電腦上如何進(jìn)行語(yǔ)音識(shí)別?
有幾種方法:使用電腦的功能,使用第三方軟件,使用第三方網(wǎng)站。
無(wú)論是windows、MAC還是Linux的某些發(fā)行版,它們都有自己的語(yǔ)音識(shí)別工具。但這些工具的性能一般,精度不高。它可以在控制面板、系統(tǒng)設(shè)置和其他菜單中找到。
使用第三方軟件進(jìn)行語(yǔ)音識(shí)別比較普遍,效果更好。科大訊飛、搜狗等輸入法廠商提供語(yǔ)音輸入功能,通過(guò)連接遠(yuǎn)程服務(wù)器,可以直接將語(yǔ)音內(nèi)容轉(zhuǎn)換成文本。準(zhǔn)確度優(yōu)于系統(tǒng)的識(shí)別工具。值得一提的是,科大訊飛輸入法是中文語(yǔ)音識(shí)別的最佳產(chǎn)品。
Internet工具更側(cè)重于將整個(gè)音頻轉(zhuǎn)換為文本。借助于服務(wù)器的計(jì)算速度和龐大的語(yǔ)料庫(kù)和算法,這些工具通??梢蕴峁┍葐我徽Z(yǔ)音輸入更好的結(jié)果。
Google的autosub可以將音頻轉(zhuǎn)換為文本,支持90多種語(yǔ)言,速度非???。
科大訊飛聽(tīng)并支持普通話和多種方言。它有120分鐘的免費(fèi)使用時(shí)間,超過(guò)了付款要求。
IBM的Watson speech to text采用Watson人工智能系統(tǒng),支持的文件不超過(guò)100m。