还剩6页未读,继续阅读
文本内容:
数据挖掘
一、课程概况所属专业计算机科学与技术开课单位数学计算机科学学院课程类型院系必修课程课程代码07413150开课学期6学分3学时课堂讲授34+实验34核心课程否拟使用教材:Jiawei Hanand MichelineKamberz著,范明,孟小峰译.Data mining:Concepts andTechniques(3幅edition).北京机械工业出版社.
2012.8国内(外)现有教材Jiawei Hanand MichelineKamber.Data Mining:Concepts andTechniques(影印版).高等教育出版社.2001学习参考资料[l]W.H.Inmon著,王志海等译,《数据仓库》,机械工业出版社,2000
[2]W.H.Inmon著,王天佑译,《数据仓库管理》,机械工业出版社,2002[31Pang-Ning Tan著,范明等译.数据挖掘导论.人民邮电出版社.2006
[4]王珊.数据仓库技术与联机分析处理.清华大学出版社.2002
[5]安淑芝等.数据仓库与数据挖掘.清华大学出版社.2005[6J http://eoLcqu.edu.cn/eol/jpk/course/layout/page/index.jspcourseId=2766
二、课程描述《数据挖掘》是计算机科学与技术专业的选修课程,对学生了解计算机发展的前沿具有重要作用,可以培养学生的探索知识的意识,扩大计算机类学生的知识面,巩固学生对数据库系统的理解,提高学生独立分析问题和解决问题的工作能力课程主要内容有数据仓库、数据挖掘的相关概念,数据仓库设计与实现的关键技术,挖掘大型数据库中关联规则的经典方法,常用分类与预测以及聚类分析方法
三、课程目标了解数据仓库与数据挖掘的产生和发展,了解数据仓库与数据挖掘的作用;掌握数据仓库设计与实现的关键技术;掌握数据挖掘的基本概念和方法;掌握几种主要数据挖掘算法并能应用于实际数据的处理;了解部分变种数据挖掘算法的思路;最终能够胜任数据仓库设计与管理、数据挖掘的工作
四、教学要求授课教师将按照学校本科教学工作有关要求做好课程教学各项工作,严格按照课表规定的时间、地点上课,不迟到、不早退,将根据本大纲要求,认真备课完成教案与讲稿编写等各项课前准备工作;授课过程力求内容充实、概念准确、思路清晰、详略得当、逻辑性强、重难点突出,力戒平铺直叙、照本宣科,同时重视对学生的学习方法指导和课堂教学效果信息的反馈,实现教与学的双向互动;同时将结合课程目标要求,做好考核内容设计,并严格按照本大纲要求做好出勤率统计、作业评价等各项工作学习是大学生自己的责任和义务,学生应根据课程大纲要求制定本门课程学习计划,加强学业管理,严格自我要求,提升自主学习能力,主动适应课程学习要求参与课堂教学活动不迟到、不早退,无正当理由不请假,上课认真听讲,不做任何与课堂教学无关事宜,不使用手机,积极与授课教师进行教学互动,同时利用课余时间做好预习、复习、课外书籍阅读等工作,主动与同学开展合作学习,认真完成任课教师布置的课程作也
五、考核方式及要求为实现课程教学目标,本门课程考核方式及要求为平时分40%+期末考试分60%平时分包括出勤率、作业完成情况、随堂测验期末考试分卷面考试与实践操作两部分,分别占总成绩的30%
六、课程内容课堂讲授第一章引言(授课时间第六学期第一周)教学目标了解在何种数据上进行数据挖掘、数据挖掘的功能、数据挖掘的分类、数据挖掘的主要任务教学重点在何种数据上进行数据挖掘、数据挖掘的分类教学难点数据挖掘的分类学时课堂教学2学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容1什么是数据挖掘
1.2在何种数据上进行数据挖掘
1.3数据挖掘的功能
1.4所有模式都有趣吗
1.5数据挖掘的分类
1.6数据挖掘的主要任务学习方法小组讨论、学习笔记、典型问题分析课后作业第二章数据预处理(授课时间第六学期第二周)教学目标掌握为什么要进行数据预处理,了解数据清理的作用、数据集成和转换、数据归约、离散化和概念分层教学重点为什么要进行数据预处理教学难点数据归约、离散化和概念分层学时课堂教学2学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容
2.数据预处理
2.1为什么要进行数据预处理
2.2数据清理
2.3数据集成和转换
2.4数据归约
2.5离散化和概念分层学习方法小组讨论、学习笔记、典型问题分析课后作业第三章数据仓库和数据挖掘的OLAP技术(授课时间第六学期第三周)教学目标了解数据立方体技术,掌握多维数据模型、数据仓库的实现,数据仓库的体系结构教学重点数据仓库的体系结构教学难点多维数据模型学时课堂教学2学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容
3.数据仓库和数据挖掘的OLAP技术
3.1什么是数据仓库
3.2多维数据模型
3.3数据仓库的体系结构
3.4数据仓库的实现
3.5数据立方体技术
3.6从数据仓库到数据挖掘学习方法小组讨论、学习笔记、典型问题分析课后作业第四章挖掘大型数据库中的关联规则(授课时间第六学期第四,五,六周)教学目标了解有效的频繁项集挖掘方法,挖掘不同类型的关联规则,从关联挖掘到相关度分析,掌握基于约束的关联规则挖掘教学重点基于约束的关联规则挖掘教学难点从关联挖掘到相关度分析学时课堂教学6学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容
4.挖掘大型数据库中的关联规则
4.1基本概念
4.2有效的频繁项集挖掘方法
4.3挖掘不同类型的关联规则
4.4从关联挖掘到相关度分析
4.5基于约束的关联规则挖掘学习方法小组讨论、实验操作(4学时)课后作业第五章分类和预测(授课时间第六学期第七,A,九周)教学目标了解什么是分类?什么是预测,掌握基本决策树分类、贝叶斯分类、后向传播分类、关联分类教学重点决策树分类、贝叶斯分类教学难点决策树分类、贝叶斯分类学时课堂教学6学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容
5.分类和预测
5.1什么是分类?什么是预测
5.2决策树分类
5.3贝叶斯分类
5.4基于规则的分类
5.5后向传播分类
5.6关联分类
5.7精确度和错误度度量学习方法小组讨论、实验操作(4学时)课后作业第六章聚类分析(授课时间第六学期第十,十一,十二周)教学目标了解什么是聚类分析、主要的聚类分析方法分类,掌握基本划分方法、层次方法、密度方法、异常点分析教学重点划分方法、层次方法教学难点划分方法、层次方法学时课堂教学6学时,课外自主学习时间不少4学时教学方法讲授法、演示法主要内容
6.聚类分析
6.1什么是聚类分析
6.2聚类分析的数据类型
6.3主要的聚类分析方法分类
6.4划分方法
6.5层次方法
6.6密度方法
6.7异常点分析学习方法小组讨论、实验操作(4学时)课后作业实验实验一Microsoft SQLServer Analysis Services的使用(授课时间第六学期第十,十一周)教学目标学习并掌握AnalysisServices的操作,加深理解数据仓库中涉及的一些概念,如多维数据集,事实表,维表,星型模型,雪花模型,联机分析处理等主要内容在实验之前,先通读自学SQL SERVER自带的Analysis Manager概念与教程按照自学教程的步骤,完成对FoodMart数据源的联机分析建立、编辑多维数据集,进行OLAP操作,看懂OLAP的分析数据学时4学时教学方法演示法/讲授/现场指导实验类型验证性实验实验二使用WEKA进行关联规则分析(授课时间第六学期第十二,十三周)教学目标掌握数据挖掘平台WEKA的使用综合运用数据预处理、关联规则挖掘算法、结果的解释等知识进行数据挖掘从而加深理解课程中的相关知识点主要内容阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA,针对实际数据,能够使用WEKA进行数据的预处理,了解属性选择,能选择合适的关联规则算法对数据进行分析,并能解释分析结果学时4学时教学方法演示法/讲授/现场指导实验类型综合性实验实验三使用WEKA进行分类与预测(授课时间第六学期第十四,十五周)教学目标掌握数据挖掘平台WEKA的使用综合运用数据预处理、分类与预测的挖掘算法、结果的解释等知识进行数据挖掘从而加深理解课程中的相关知识点主要内容阅读并理解WEKA的相关中英文资料,熟悉数据挖掘平台WEKA,针对实际数据,能够使用WEKA进行数据的预处理,能选择合适的分类与预测算法对数据进行分析,并能解释分析结果学时4学时教学方法演示法/讲授/现场指导实验类型综合性实验实验四数据挖掘算法的程序实现(授课时间第六学期第十六,十七周)教学目标运用数据挖掘、程序设计等相关知识,选择一个数据挖掘的常用算法进行程序设计实现加深对数据挖掘算法基本原理、详细执行过程和具体应用情况的理解主要内容采用任何一种自己熟悉的编程语言,完成算法的程序设计,并在每个程序设计语句后面进行详细的注释能够运用实现的算法来解决某个具体的问题,得到并解释程序运行的结果推荐的算法:1关联规则:Apriori算法;2分类与预测ID3,C
4.5,KNN,BP;3聚类k-means学时4学时教学方法演示法/讲授/现场指导实验类型设计性实验
七、课程内容调整说明实验
三、四也可以继续在Microsoft SQLServer AnalysisServices进行。