关联规则中Apriori算法的研究与改进的中期报告.docx 立即下载
2024-09-13
约1.8千字
约3页
0
11KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

关联规则中Apriori算法的研究与改进的中期报告.docx

关联规则中Apriori算法的研究与改进的中期报告.docx

预览

在线预览结束,喜欢就下载吧,查找使用更方便

5 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

关联规则中Apriori算法的研究与改进的中期报告
一、研究背景
Apriori算法是一种经典的数据挖掘算法,主要用于挖掘数据集中的关联规则。该算法的基本思想是利用频繁项集的性质来减少搜索空间,从而提高算法效率。然而,Apriori算法存在一些缺点,如不适用于数据集中稀疏项集的挖掘、候选项集生成过程中存在大量的扫描和计算等,所以在实际应用中可能面临着一些困难和挑战。因此,有必要对Apriori算法进行研究和改进,以满足实际应用的需要。
二、研究内容
本次中期报告的主要研究内容包括:
1.Apriori算法中候选项集生成过程的优化
候选项集生成是Apriori算法的核心步骤之一,同时也是时间和空间开销最大的步骤。目前已有一些研究对该过程进行了优化,如FP-growth等。本次研究将从以下方面对候选项集生成过程进行优化:
(1)减少扫描次数。候选项集生成过程中需要反复扫描数据集,因此可以通过对数据集进行预处理、采用数据压缩技术等方式来减少扫描次数。
(2)采用多线程并行计算。候选项集生成计算是一个比较简单的计算任务,可以采用多线程并行计算来加快计算速度。
(3)使用GPU加速。候选项集生成过程中大量的计算可以通过GPU等硬件设备来加速。
2.Apriori算法的改进
Apriori算法是一种基于频繁项集挖掘的算法,其主要瓶颈在于候选项集生成和频繁项集计算。由于其依赖性比较强,因此改进难度比较大。本次研究将从以下方面对Apriori算法进行改进:
(1)改进候选项集生成过程。通过挖掘频繁子项集来生成候选项集,从而减少候选项集的数量。
(2)改进频繁项集计算过程。采用增量式计算方法来计算频繁项集,可以避免重复计算。
(3)结合其他算法进行改进。将Apriori算法与其他算法结合使用,如FP-growth等,可以提高算法效率。
三、研究计划
本次研究计划分为以下几个阶段:
1.研究Apriori算法及其优化方法,阅读相关文献,了解算法的基本思想和流程;
2.分析Apriori算法的缺陷和不足,提出改进的思路和方法;
3.实现改进后的Apriori算法,进行实验验证,并与原始算法进行比较分析;
4.对实验结果进行分析和总结,撰写毕业论文。
四、参考文献
1.Agrawal,R.,Srikant,R.(1994).Fastalgorithmsforminingassociationrules.InProceedingsofthe20thInternationalConferenceonVeryLargeDataBases(VLDB),Santiago,Chile(pp.487-499).
2.Han,J.,Pei,J.,Yin,Y.(2000).Miningfrequentpatternswithoutcandidategeneration.InProceedingsoftheACMSIGMODConferenceonManagementofData(pp.1-12).
3.Liu,B.,Hsu,W.,Ma,Y.(1999).Integratingclassificationandassociationrulemining.InProceedingsofthe4thInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD)(pp.80-86).
4.Park,J.S.,Chen,M.S.(1995).Distributedalgorithmsforminingassociationrules.InProceedingsoftheACMSIGMODConferenceonManagementofData(pp.201-212).
5.Savasere,A.,Omiecinski,E.,Navathe,S.(1995).Anefficientalgorithmforminingassociationrulesinlargedatabases.InProceedingsoftheInternationalConferenceonVeryLargeDataBases(VLDB)(pp.432-444).
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

关联规则中Apriori算法的研究与改进的中期报告

文档大小:11KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用