百度大腦發(fā)布智能語音交互新技術(shù) 語音識(shí)別性能提升30%
百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),消除學(xué)科間壁壘,直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,錯(cuò)誤率降低超過30%。