实验报告封面
课程名称: 数据仓库与数据挖掘技术 课程代码:SE3006 任课老师: 袁丽娜 实验指导老师: 袁丽娜
实验报告名称:实验13 Fp-growth算法
学生姓名:
学号: 教学班: 递交日期: 2014.12.5
签收人:
我申明,本报告内的实验已按要求完成,报告完全是由我个人完成,并没有抄袭行为。我已经保留了这份实验报告的副本。
申明人(签名):
实验报告评语与评分:
评阅老师签名:
一、实验名称: Fp-growth算法 二、实验日期:2014年 月 日 三、实验目的:
通过本次实验掌握Fp-growth算法的思想
四、实验用的仪器和材料:
硬件:PC电脑一台;
配置:内存,2G及以上 硬盘250G及以上 软件环境:操作系统 windows server 2003 数据库环境:Microsoft SQL SERVER 2005
五、实验的步骤和方法:
1、假设事务集合T如下表所示: 事务ID T1 T2 T3 T4 T5 T6 T7 T8 事务的项目集 A,B,E B,D B,C A,B,D A,C B,C A,C A,B,C,E 根据以上事务集合,通过Fp-growth算法实现: 1)假定最小事务支持数是2,画出FP树。 2)列出逐层递归产生的频繁项集。 项 B A C D E
支持度计数 6 5 5 2 2
NULL
A:2 B:6 C:2 C:2
A:3 D:1 D:1 C:1 E:1
E:1 项 条件模式基 条件FP-树 频繁模式 E BA:1,BAC:1 (B:2,A:2) BE:2,AE:2,BAE:2 D BA:1,B:1 (B:2) BD:2 C BA:1,B:2,A:2 (B:3,A:1)(A:2) BC:4,AC:4,BAC:2 A B:3 (B:3) BA:3
2、假设事务集合T如下表所示: 事务ID 事务的项目集 T1 T2 T3 T4 T5 T6 T7 T8 A,B C,D B,C,D A,D A,B,C B,C A,C A,B,C,E 根据以上事务集合,通过Fp-growth算法实现: 1) 假定最小事务支持数是2,画出FP树。 项 C A B D 支持度计数 6 5 5 3
NULL A:2 B:4 A:2 C:6 D:1 D:1 B:1 A:1 D:1
项 条件模式基 条件FP-树 频繁模式 D A:1,C:1,CB:1 (A:1,C:1),(CB:1) AD:1,CD:1,CBD:1 B A:1,C:4 (A:1)(C:4) AB:1,CB:4: A A:2,CB:2,C:1 (A:2,)(CB:2,C:1) A:2,ACB:2,AC:1
2)列出逐层递归产生的频繁项集。
六、数据记录和计算:指从实验中测到的数据以及计算结果。
七、实验结果或结论:即根据实验过程中所见到的现象和测得的数据,作出结论。
八、备注或说明:可写上实验成功或失败的原因,实验后的心得体会、建议等。
九、引用参考文献:
1. 张兴会.数据仓库与数据挖掘技术.清华大学出版社
因篇幅问题不能全部显示,请点此查看更多更全内容