首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電子信息科學(xué)綜合 > 計(jì)算機(jī)研究與發(fā)展 > 一種基于概率主題模型的惡意代碼特征提取方法 【正文】
摘要:在當(dāng)前復(fù)雜網(wǎng)絡(luò)環(huán)境下,惡意代碼通過各種方式快速傳播,入侵用戶終端設(shè)備或網(wǎng)絡(luò)設(shè)備、非法竊取用戶隱私數(shù)據(jù),對(duì)網(wǎng)絡(luò)和互聯(lián)網(wǎng)用戶造成了嚴(yán)重的安全威脅.傳統(tǒng)檢測(cè)方法難以檢測(cè)未知惡意代碼,而惡意代碼變體的多樣性和龐大數(shù)量也對(duì)未知惡意代碼檢測(cè)構(gòu)成了巨大挑戰(zhàn).提出了一種無監(jiān)督的惡意代碼識(shí)別方法,通過分析反匯編PE文件給出匯編指令標(biāo)準(zhǔn)化規(guī)則,結(jié)合潛在狄立克雷分布(latent Dirichlet allocation,LDA)獲得匯編指令中潛在的“文檔主題”、“主題詞”的分布.再以“主題分布”構(gòu)造惡意樣本特征,產(chǎn)生一個(gè)全新的惡意代碼檢測(cè)框架.結(jié)合“困惑度”和變化的步長給出了最優(yōu)“主題”數(shù)目的快速評(píng)價(jià)和自動(dòng)確定方法,解決了LDA模型中主題數(shù)目需要預(yù)先指定的問題.同時(shí)解析了“文檔主題”、“主題詞”聚集結(jié)果的語義可解釋性,說明了該方法獲得的樣本特征具有潛在的語義.實(shí)驗(yàn)結(jié)果表明:與其他方法相比該方法具有相當(dāng)?shù)幕蚋玫膼阂獯a鑒別能力,同時(shí)能夠準(zhǔn)確地識(shí)別惡意代碼的新變體.
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
一對(duì)一咨詢服務(wù)、簡(jiǎn)單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >