基于混合词向量深度学习模型的DGA域名检测方法.docx 立即下载
2024-12-05
约1.2千字
约2页
0
10KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

基于混合词向量深度学习模型的DGA域名检测方法.docx

基于混合词向量深度学习模型的DGA域名检测方法.docx

预览

在线预览结束,喜欢就下载吧,查找使用更方便

5 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于混合词向量深度学习模型的DGA域名检测方法
一、引言
域名生成算法(DGA)已成为了恶意软件的常见手段,通过使用DGA算法生成大量恶意域名,恶意软件可以避开传统安全防护,使其在网络中的传播更加困难。因此越来越多的关注被投入到了使用机器学习技术来检测DGA域名。然而,由于DGA算法具有很高的灵活性和变异能力,使得现有的检测技术容易被攻击者绕过。为了解决这一问题,本文提出了一种基于混合词向量深度学习模型的DGA域名检测方法。
二、相关工作
早期的DGA检测方法大多基于特征工程,例如,统计字符、单词、二元组、三元组等一些特征,然后使用经典的机器学习算法如SVM、KNN等进行分类。虽然这些方法在过去取得了一定的成功,但是这些方法具有局限性,即他们对于不同样本的特征提取能力有限,不能进行有效的学习,因此检测效果不理想。近年来,深度学习技术在DGA检测领域中得到了广泛的应用。尤其是在自然语言处理领域,诸如CBOW、Skip-Gram等词向量方法的引入,使得DGA域名的语义特征体现的更加充分。
三、方法介绍
1.特征提取阶段
本文使用Skip-gram模型和n-gram模型相结合的方法来进行特征提取。首先,我们使用Skip-gram模型来提取DGA域名的词向量。然后,我们使用n-gram模型,该模型将DGA域名分成n个词,以n-time跨度生成序列数据。这一步可以使数据集产生更多的组合,从而增加了数据规模,提高了模型预测的准确性。
2.深度学习模型
在本文中,我们使用了一个混合词向量深度学习模型来检测DGA域名。该模型由CNN和LSTM两个部分组成。CNN用来提取n-gram特征,LSTM用来处理序列数据。对应于网络结构,我们将提取到的特征分为两个部分,Skip-gram特征和n-gram特征,分别输入CNN和LSTM。
3.分类器
在分类器部分,我们使用Softmax分类器来将DGA域名和非DGA域名进行区分。
四、实验与分析
我们使用了AlexaTop100000站点的域名数据集和包含DGA域名的数据集进行实验评估。我们将所有域名分为两个类别:DGA域名和非DGA域名。为了评估我们的方法的效果,我们使用了准确率、召回率、F1值、ROC曲线等指标。
实验结果表明,本文提出的基于混合词向量深度学习模型的DGA域名检测方法,在Alexa数据集上的准确率为0.976,召回率为0.979,F1值为0.977,在包含DGA域名的数据集上的准确率为0.999,召回率为1.000,F1值为0.999。ROC曲线下面积达到0.999。
五、总结
本文提出了一种基于混合词向量深度学习模型的DGA域名检测方法。该方法结合了Skip-gram和n-gram模型,使用CNN和LSTM两个部分组合起来处理提取到的特征,最后使用Softmax分类器进行分类。实验结果表明,该方法能够有效地检测DGA域名。与传统的特征工程和机器学习算法相比,该方法具有更好的性能表现。亿虎娱乐
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

基于混合词向量深度学习模型的DGA域名检测方法

文档大小:10KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用