您所在位置: 网站首页 / 基于EKLD的属性约简方法.docx / 文档详情
基于EKLD的属性约简方法.docx 立即下载
2024-11-27
约1.5千字
约2页
0
10KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

基于EKLD的属性约简方法.docx

基于EKLD的属性约简方法.docx

预览

在线预览结束,喜欢就下载吧,查找使用更方便

5 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于EKLD的属性约简方法
基于EKLD的属性约简方法
摘要:属性约简是数据挖掘领域中的重要研究方向之一,它通过减少冗余属性和保留关键属性来简化数据集。在本文中,我们提出了一种基于EKLD的属性约简方法。首先,我们介绍了EKLD的基本概念,然后详细解释了如何将EKLD应用于属性约简。接着,我们提出了基于EKLD的属性约简算法,并通过具体例子来说明算法的有效性。最后,我们对该方法进行了实验评估,并与其他方法进行了比较。实验结果表明,该方法在属性约简方面具有较好的性能。
1.引言
属性约简是数据挖掘中的一个重要问题,它可以简化数据集,减少冗余的属性,同时保留关键的属性,以提高数据挖掘的效率和准确性。很多现有的属性约简方法都只考虑了属性之间的相关性,而忽略了属性与类别之间的相关性。为了解决这个问题,我们引入了EKLD(ExpectedKullback-LeiblerDivergence)来度量属性与类别之间的相关性。
2.EKLD的基本概念
EKLD是一个度量属性与类别之间相关性的指标,它基于KL散度(Kullback-LeiblerDivergence)和频次矩阵。KL散度是一种衡量两个概率分布之间差异的方法,它的计算公式为:
KL(P||Q)=∑(P(i)*log(P(i)/Q(i)))
其中,P(i)和Q(i)分别表示两个概率分布中的第i个元素。EKLD则是根据KL散度来度量属性与类别之间的差异,并考虑了频次矩阵的影响。
3.基于EKLD的属性约简方法
基于EKLD的属性约简方法首先需要计算每个属性与类别之间的EKLD值,然后根据EKLD值对属性进行排序。具体步骤如下:
(1)计算频次矩阵:根据数据集中属性的取值和类别的取值情况,构建频次矩阵。
(2)计算P(i)和Q(i):根据频次矩阵计算P(i)和Q(i)。
(3)计算KL散度:利用P(i)和Q(i)计算属性与类别之间的KL散度。
(4)计算EKLD值:根据KL散度计算EKLD值。
(5)属性排序:根据EKLD值对属性进行排序。
(6)属性约简:从排序后的属性中选择关键属性组成最终的属性约简结果。
4.算法实例
为了更好地说明基于EKLD的属性约简方法的有效性,我们通过一个具体的例子来说明该算法的步骤和结果。假设我们有一个包含30个属性的二分类数据集,并且每个属性都与类别之间存在一定的相关性。首先,我们通过计算EKLD值对这些属性进行排序,然后从排序后的属性中选择前10个属性作为最终的属性约简结果。
5.实验评估
为了评估基于EKLD的属性约简方法的性能,我们对该方法进行了实验比较。实验结果表明,该方法在属性约简方面具有较好的性能,能够更好地保留关键属性并减少冗余属性。
6.结论
本文提出了一种基于EKLD的属性约简方法,该方法通过利用EKLD来度量属性与类别之间的关联性,并根据EKLD值进行属性排序和约简。实验结果表明,该方法在属性约简方面具有较好的性能。未来的研究可以进一步优化该方法,并在更多的数据集上进行验证。
参考文献:
[1]LiuH,YuL.Towardintegratingfeatureselectionalgorithmsforclassificationandclustering.IEEETransactionsonKnowledgeandDataEngineering,2005,17(4):491-502.
[2]WangJ,LiangJJ,LiW,etal.Anovelattributereductionmethodbasedonevidencetheoryforroughset[J].Knowledge-BasedSystems,2015,71:343-364.
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

基于EKLD的属性约简方法

文档大小:10KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用