語(yǔ)音識(shí)別的技術(shù)原理是什么?
發(fā)布日期:2022-01-26
點(diǎn)擊次數(shù):2341
語(yǔ)音識(shí)別的本質(zhì)是一種基于語(yǔ)音特征參數(shù)的模式識(shí)別,即通過(guò)學(xué)習(xí),系統(tǒng)能夠把輸入的語(yǔ)音按一定模式進(jìn)行分類,進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。目前,模式匹配原理已經(jīng)被應(yīng)用于大多數(shù)語(yǔ)音識(shí)別系統(tǒng)中。
一般的模式識(shí)別包括預(yù)處理,特征提取,模式匹配等基本模塊。首先對(duì)輸入語(yǔ)音進(jìn)行預(yù)處理,其中預(yù)處理包括分幀,加窗,預(yù)加重等。其次是特征提取,因此選擇合適的特征參數(shù)尤為重要。常用的特征參數(shù)包括:基音周期,共振峰,短時(shí)平均能量或幅度,線性預(yù)測(cè)系數(shù)(LPC),感知加權(quán)預(yù)測(cè)系數(shù)(PLP),短時(shí)平均過(guò)零率,線性預(yù)測(cè)倒譜系數(shù)(LPCC),自相關(guān)函數(shù),梅爾倒譜系數(shù)(MFCC),小波變換系數(shù),經(jīng)驗(yàn)?zāi)B(tài)分解系數(shù)(EMD),伽馬通濾波器系數(shù)(GFCC)等。在進(jìn)行實(shí)際識(shí)別時(shí),要對(duì)測(cè)試語(yǔ)音按訓(xùn)練過(guò)程產(chǎn)生模板,最后根據(jù)失真判決準(zhǔn)則進(jìn)行識(shí)別。常用的失真判決準(zhǔn)則有歐式距離,協(xié)方差矩陣與貝葉斯距離等。
免責(zé)聲明: 本文章轉(zhuǎn)自其它平臺(tái),并不代表本站觀點(diǎn)及立場(chǎng)。若有侵權(quán)或異議,請(qǐng)聯(lián)系我們刪除。謝謝! |