《数据挖掘》课程教学大纲
课程名称:数据挖掘 课程编号:11630603
英文课程名称:Discrete Mathematics
适用专业:软件工程本科专业;
总学时数:45 学分数:4
理论教学时数:41 实验 (实践)教学时数:4
执笔者:赵曦 编写日期:2012.2
一、课程性质和目的
数据挖掘技术经过十几年的发展,已经取得一些重要成果,特别是在基本概念、基本原理、基本算法等方面发展的越来越清晰。因此,现在开设此课程具备基本的技术条件。本课程以介绍基本概念和基本算法为主,以前沿问题的讨论与探索为辅,其目的是为学生将来研究和学习提供知识储备。
数据挖掘作为高级数据处理和分析技术,其目的是通过本课程学习让学生了解信息处理技术的发展方向以及数据挖掘技术本身的概念、原理和方法。
二、课程教学内容、要求及学时分配
1
(一)第1张 绪论(2学时)
本章作为绪论,其目的是让学生对数据挖掘技术有一个总体的认识。因此,主要内容是对数据挖掘技术的概念、产生背景技术、发展趋势以及应用等进行提炼和概括。
1.1 数据挖掘技术的产生与发展
1.2 数据挖掘研究的发展趋势
1.3 数据挖掘概念
1.4 数据挖掘技术的分类问题
1.5 数据挖掘常用的知识表示模式与方法
1.6 不同数据存储形式下的数据挖掘问题
1.7 数据挖掘的应用分析
(二)第2章 知识发现过程与应用结构(2学时)
本章对KDD过程及其应用模型结构进行阐述,其目的是从系统应用角度给学生一个关于KDD设计和实现的技术概括。
2.1 知识发现的基本过程(1学时)
2.2 数据库中的知识发现处理过程模型(2学时)
2
2.4 知识发现项目的过程化管理(1学时)
(三)第3章 关联规则挖掘理论和算法(10学时)
本章对关联规则挖掘中的概念、方法、算法进行全面的分析和论述。由于关联规则挖掘是数据挖掘技术中研究最早、成果最多、相对比较成熟的分支,因此本章重点在于一些经典理论和算法、热点问题的介绍。
3.1 基本概念与解决方法(1学时)
3.2 经典的关联规则挖掘算法分析(3学时)
3.3 Apriori算法的性能瓶颈问题(1学时)
3.4 Apriori的改进算法(2学时)
3.5 对项目集空间理论的发展(3学时)
(四)第4章 关联规则挖掘理论和算法(10学时)
分类在数据挖掘中是一项非常重要的任务,本章对分类的基本概念与步骤、经典的分类方法以及与分类有关的问题进行了阐述。
4.1 分类的基本概念与步骤(1学时)
4.2 基于距离的分类算法(2学时)
3
4.3 决策树分类方法(4学时)
4.4 贝叶斯分类(3学时)
(五)第5章 聚类方法(10学时)
聚类是数据挖掘技术中一个重要内容,内容很多,因此本章主要从基本方法、按划分聚类方法、层次聚类方法和密度聚类方法等进行重点讲解。
5.1 概述(1学时)
5.2 划分聚类方法(4学时)
5.3 层次聚类方法(3学时)
5.4 密度聚类方法(2学时)
(六)第7章 Web挖掘技术(4学时)
由于Web挖掘是数据挖掘领域崭新的研究分支,所以许多方法具有探索性。因此本章重点介绍Web挖掘所要解决的主要问题和意义,并性质一些研究比较集中和相对比较成熟的技术进行介绍。
Web挖掘的意义、含义、应用、主要方法归纳(2学时)
Web访问信息挖掘方法与算法介绍(1学时)
其他Web挖掘方法与算法介绍(1学时)
4
注:剩余6学时为实验教学和考试。
三、课程教学的基本要求
1. 课堂教学 主要采用传统课堂教授的教学方式,主要使用多媒体课件,部分内容及例题用黑板解释。注重启发式教学。
2. 习题课与作业 在学时内安排一定量的习题课,每次课(2学时)后布置一定的作业。
3. 考试方式 闭卷考试。
四、本课程与其他课程的联系和分工
本课程先修课程为数据库,安排在大学三年级的第二学期开设,与计算机科学中的数据库、人工智能等课程联系紧密。
五、建议教材及教学参考书
教材:
《数据挖掘原理与算法》 毛国君等编著 清华大学出版社(2007年第二版)
教学参考书:
《Data Mining: Concept and Techniques》 Jiawei Han等编著 高等教育出版社(2001年)
5
因篇幅问题不能全部显示,请点此查看更多更全内容