2024/9/9 14:46

基于深度學(xué)習(xí)的DGA惡意域名檢測

郵電設(shè)計技術(shù) 周婧瑩，黎宇，曾楚軒

本文版權(quán)為《郵電設(shè)計技術(shù)》所有，如需轉(zhuǎn)載請聯(lián)系《郵電設(shè)計技術(shù)》編輯部

摘要：攻擊者常使用域名生成算法（DGA）生成大量的隨機域名來傳輸惡意軟件控制指令，而傳統(tǒng)DGA檢測方法存在計算量大、檢測精確度低等問題，采用機器學(xué)習(xí)和深度學(xué)習(xí)的方法可極大緩解上述問題。首先從域名的基本特征、語言特征和統(tǒng)計特征3個方面對DGA域名和正常域名進行特征提取，在特征集上采用機器學(xué)習(xí)算法進行模型訓(xùn)練；同時，采用長短期記憶（LSTM）網(wǎng)絡(luò)以域名字符串的嵌入向量作為輸入，提取域名的深度特征進行域名檢測。通過查準(zhǔn)率、召回率、F1-score、ROC曲線、AUC值等評測指標(biāo)對模型訓(xùn)練結(jié)果進行對比，獲得較優(yōu)的DGA域名檢測模型。

關(guān)鍵詞：域名生成算法；機器學(xué)習(xí)；深度學(xué)習(xí)；域名檢測

doi：10.12045/j.issn.1007-3043.2024.08.003

引言

大多數(shù)僵尸網(wǎng)］依賴集中C&C服務(wù)器，一旦C&C域名被識別拆除，僵尸主機將失去對整個僵尸網(wǎng)絡(luò)的控制。因此，攻擊者常會利用域名生成算法（DGA）生成大量隨機域名為惡意程序和命令控制服務(wù)器建立通信，以提升C&C服務(wù)器逃避檢測的能力。傳統(tǒng)的DGA檢測方法，如黑名單過濾法和逆向惡意樣本DGA算法，存在檢測準(zhǔn)確率不高、實際應(yīng)用中難以實現(xiàn)等問題。因此，采用機器學(xué)習(xí)方法對DNS域名服務(wù)器數(shù)據(jù)進行分析和檢測已成為當(dāng)前的研究熱點。該方法主要基于域名服務(wù)器流量或域名語言統(tǒng)計特征進行機器學(xué)習(xí)完成DGA域名的標(biāo)識和分類。但設(shè)計人工特征是一個非常耗時的工作，且需隨著域名生成算法的更新而不斷更新。因此，深度學(xué)習(xí)算法開始被應(yīng)用于自動檢測DGA域名，例如以域名字符串的嵌入向量為輸入的動態(tài)卷積算法模型能顯著提高檢測準(zhǔn)確率，但是這類模型通過捷徑學(xué)習(xí)進行特征提取，在對抗樣本下十分脆弱。

針對上述問題，某省聯(lián)通分別采用了機器學(xué)習(xí)和深度學(xué)習(xí)的方法來檢測分析DGA域名，通過對比試驗，選出較優(yōu)的方法應(yīng)用于日常威脅檢測工作中。在機器學(xué)習(xí)方面，通過從域名的基本特征、語言特征和統(tǒng)計特征3個方面形成的數(shù)據(jù)集進行訓(xùn)練；在深度學(xué)習(xí)方面，采用長短期記憶（LSTM）網(wǎng)絡(luò)，以域名字符串的嵌入向量作為輸入，提取域名的深度特征并進行域名檢測。通過兩者的對比分析，某省聯(lián)通找到適合DGA域名自動檢測的分類模型。

點擊查看全文（PDF）>

給作者點贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

服務(wù)器網(wǎng)絡(luò)

基于深度學(xué)習(xí)的多特征融合人臉鑒偽模型
郵電設(shè)計技術(shù) 李錚，鄭濤，張小梅9-9
異常檢測在網(wǎng)絡(luò)安全防護中的應(yīng)用研究
郵電設(shè)計技術(shù) 劉洋，翟銳，鞏坤9-9
基于深度學(xué)習(xí)與開集識別技術(shù)的對抗式DDoS攻擊檢測技術(shù)
郵電設(shè)計技術(shù) 吳志祥，劉莉丹，高博9-9
基于KNIME工作流機器學(xué)習(xí)預(yù)測室分天線外打故障
郵電設(shè)計技術(shù) 李國博7-29