首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電子信息科學綜合 > 計算機技術與發展 > 多主題下基于LSTM語義關聯的長文本過濾研究 【正文】
摘要:現如今互聯網上出現了很多評論性文章,這些文章字符數多,且包含較多與主題無關的信息,會影響后續的文本分析任務的性能。因此,針對傳統的解決方案不能夠對多主題長文本進行建模,以及現有的神經網絡無法從相對較長的時間步長中捕獲語義關聯等問題,文中提出了一種結合單層神經網絡和分層長短記憶網絡的深度網絡模型,并在長文本過濾任務中進行應用。該模型通過詞語層LSTM網絡獲得句子內部詞語之間的關系并得到具有語義的句向量,然后將句向量輸入主題依賴度計算模型和句子層LSTM網絡模型,進而得到句子與各主題類別的依賴度以及待過濾句子與其他句子之間的關聯。最后,在從馬蜂窩獲取的游記數據集上進行的實驗表明,該模型相比SVM、樸素貝葉斯、LSTM、Bi-LSTM等效果更好。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社