C114通信網(wǎng)  |  通信人家園

專題
2024/9/9 14:46

基于深度學(xué)習(xí)的DGA惡意域名檢測

郵電設(shè)計技術(shù)  周婧瑩,黎 宇,曾楚軒

本文版權(quán)為《郵電設(shè)計技術(shù)》所有,如需轉(zhuǎn)載請聯(lián)系《郵電設(shè)計技術(shù)》編輯部

摘要:攻擊者常使用域名生成算法(DGA)生成大量的隨機域名來傳輸惡意軟件控制指令,而傳統(tǒng)DGA檢測方法存在計算量大、檢測精確度低等問題,采用機器學(xué)習(xí)和深度學(xué)習(xí)的方法可極大緩解上述問題。首先從域名的基本特征、語言特征和統(tǒng)計特征3個方面對DGA域名和正常域名進行特征提取,在特征集上采用機器學(xué)習(xí)算法進行模型訓(xùn)練;同時,采用長短期記憶(LSTM)網(wǎng)絡(luò)以域名字符串的嵌入向量作為輸入,提取域名的深度特征進行域名檢測。通過查準(zhǔn)率、召回率、F1-score、ROC曲線、AUC值等評測指標(biāo)對模型訓(xùn)練結(jié)果進行對比,獲得較優(yōu)的DGA域名檢測模型。

關(guān)鍵詞:域名生成算法;機器學(xué)習(xí);深度學(xué)習(xí);域名檢測

doi:10.12045/j.issn.1007-3043.2024.08.003

引言

大多數(shù)僵尸網(wǎng)]依賴集中C&C服務(wù)器,一旦C&C域名被識別拆除,僵尸主機將失去對整個僵尸網(wǎng)絡(luò)的控制。因此,攻擊者常會利用域名生成算法(DGA)生成大量隨機域名為惡意程序和命令控制服務(wù)器建立通信,以提升C&C服務(wù)器逃避檢測的能力。傳統(tǒng)的DGA檢測方法,如黑名單過濾法和逆向惡意樣本DGA算法,存在檢測準(zhǔn)確率不高、實際應(yīng)用中難以實現(xiàn)等問題。因此,采用機器學(xué)習(xí)方法對DNS域名服務(wù)器數(shù)據(jù)進行分析和檢測已成為當(dāng)前的研究熱點。該方法主要基于域名服務(wù)器流量或域名語言統(tǒng)計特征進行機器學(xué)習(xí)完成DGA域名的標(biāo)識和分類。但設(shè)計人工特征是一個非常耗時的工作,且需隨著域名生成算法的更新而不斷更新。因此,深度學(xué)習(xí)算法開始被應(yīng)用于自動檢測DGA域名,例如以域名字符串的嵌入向量為輸入的動態(tài)卷積算法模型能顯著提高檢測準(zhǔn)確率,但是這類模型通過捷徑學(xué)習(xí)進行特征提取,在對抗樣本下十分脆弱。

針對上述問題,某省聯(lián)通分別采用了機器學(xué)習(xí)和深度學(xué)習(xí)的方法來檢測分析DGA域名,通過對比試驗,選出較優(yōu)的方法應(yīng)用于日常威脅檢測工作中。在機器學(xué)習(xí)方面,通過從域名的基本特征、語言特征和統(tǒng)計特征3個方面形成的數(shù)據(jù)集進行訓(xùn)練;在深度學(xué)習(xí)方面,采用長短期記憶(LSTM)網(wǎng)絡(luò),以域名字符串的嵌入向量作為輸入,提取域名的深度特征并進行域名檢測。通過兩者的對比分析,某省聯(lián)通找到適合DGA域名自動檢測的分類模型。

點擊查看全文(PDF)>

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141