首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電信技術 > 數據通信 > 基于稀疏DBN和雙向LSTM的視覺語音識別算法 【正文】
摘要:唇部視覺信息作為語音識別的輔助信息一直受到廣泛關注,為更好的提取唇部視覺信息,提出一種基于稀疏深度信念網絡(Deep Belief Network,DBN)和雙向長短期記憶網絡(Bidirectional Long Short-Term Memory,BiLSTM)的視覺語音識別算法。該算法通過在DBN的目標函數后引入混合的范數和范數來實現DBN的稀疏表示,以此稀疏DBN對唇部視覺信息進行稀疏瓶頸特征的提取,再將提取的瓶頸特征送入BiLSTM進行特征的學習分類。實驗表明,該算法能有效的識別唇部視覺信息。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社