还剩6页未读,继续阅读
文本内容:
数据挖掘技术Data miningtechnology课程代码:08410228学分3学时56(其中讲课学时40实验学时16)先修课程数据库原理及应用、概率论与数理统计、统计分析软件基础适用专业信息管理与信息系统、工商管理、物流统计、市场营销教材数据挖掘技术与应用,陈燕,清华大学出版社,2016年8月第二版
一、课程性质与课程目标(-)课程性质本课程是信息管理与信息系统专业学生必须掌握的专业课程,本课程与与信息专业培养目标密切相关,既涉及信息系统相关理论,更是对信息管理的具体实现有详尽阐述是培养本专业学生掌握决策支持技术的重要课程本课程以数据挖掘的基本概念和基本方法为主要内容,以方法的应用为主线,系统叙述数据挖掘的有关概念和基础知识,使学生掌握数据挖掘的基本概念,基本方法和应用背景本课程的任务,主要是要求学生能对数据挖掘的基本方法和基本概念有整体的了解,掌握数据挖掘结构化数据源数据仓库的原理和方法,掌握OLAP联机分析的基本概念、原理数据挖掘技术理论中,系统学习数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析等对当前数据挖掘的新技术流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘要有所了解,对可视化技术要有一定的掌握通过课程学习学生应对数据挖掘的关联规则,分类方法,聚类方法有深入的掌握,并能够在软件开发过程中熟练掌握这些方法加以应用
(二)课程目标
1.知识方面课程目标1数据挖掘所需数据源的相关理论知识数据库里操作型数据转变为数据仓库里分析型数据理论、数据仓库数据采集、多维数据分析课程目标2预测模型的基础理论、OLTP与OLAP、OLAP与DM相关理论知识OLTP与OLAP概念与区别,OLAP与DM概念与处理逻辑区别课程目标3数据挖掘相关技术知识分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析数据挖掘的新技术-----------流数据挖掘技术、高维聚类算法、分布式数据挖掘、物联网数据挖掘课程目标4R语言相关技术知识R语言使用基础、R语言数据探索理论、R语言数据分析理论与R语言数据处理、R语言数据挖掘建模
(二)能力与素质方面课程目标5通过课程学习,加强学生数据源的组织能力,具有将前期课程所学数据库基础知识深化数据仓库的能力,培养学生了解数据源的基本素质课程目标5通过课程学习,使学生掌握OLTP与OLAP、OLAP与DM相关理论知识和思维方式,培养学生比较高的IT运用素质课程目标7通过课程学习,使学生掌握经典数据挖掘技术,了解较新的数据挖掘技术,从而培养学生有一定的数据挖掘能力和素质课程目标8通过R语言的学习,使学生具有较高的数据挖掘实战能力,从而使学生具有较高的数据分析和数据挖掘素质
(三)课程目标与专业毕业要求指标点的对应关系本课程支撑专业培养计划中毕业要求指标点如下毕业要求1系统地掌握经济管理科学、信息技术和信息管理的基本理论与政策、知识与技能毕业要求2能够熟练运用信息化工程理论发、方法与工具毕业要求3能进行信息系统规划、分析设计、实施毕业要求4具备在政府、企业信息化过程担任管理信息化咨询,信息系统运维管理和信息化项目评价能力毕业要求6具有独立开发信息系统能力,信息系统运管操控能力与创新能力毕业要求9能承担软件公司的信息系统开发、实施指导与监理工作毕业要求10能承担信息中心的信息管理工作与培训机构的教育工作课程目标目标目标目标目标目标目标目标5目标7毕业要求指标123468毕业要求1L L L L L L毕业要求2L L L L L L毕业要求3L L L L LLLL毕业要求4LLL毕业要求6LLL毕业要求9M M M M MMMM毕业要求10LLLLL
三、课程内容及要求(按章撰写)第一章数据挖掘概述(-)教学内容数据仓库和数据挖掘定义与解释数据仓库的定义与解释、数据挖掘的定义与解释;数据仓库系统的相关技术数据仓库系统相关技术之间的关系、数据仓库系统模式;数据仓库系统中多维数据组织的形式化定义与描述;数据挖掘方法与研究体系数据挖掘系统的发展与结构、数据挖掘的相关技术与工具、数据挖掘应用及发展;商务智能系统
(二)教学要求掌握DW、DM基本概念理解数据仓库系统相关技术之间的关系了解商务智能系统
(三)重点与难点
1.重点DW、DM基本概念
2.难点DB中数据与DW中数据区别第二章数据采集、集成与预处理技术数据采集的对象;数据集成技术与方法异构数据集成的设计与实现;数据预处理技术与方法数据清理的方法、数据融合的方法、数据变换的方法、数据归约的方法;基于样本数据划分的通用数据挖掘模型系统;中间件技术中间件技术的定义与作用、中间件技术在数据仓库系统中数据采集的应用
(二)教学要求掌握ETL基本概念理解数据仓库数据处理技术
(三)重点与难点
1.重点ETL
2.难点数据仓库与ETL第三章多维数据分析与组织多维数据分析概述联机分析处理的定义和特点、联机分析处理的评价准则、多维数据分析的主要概念;多维数据模型与结构多维数据的概念模型、多维数据的逻辑模型、多维数据的物理模型;多维数据分析应用与工具多维数据分析的基本操作维、多数据分析的工具及特点从联机分析处理到联机分析挖掘联机分析挖掘形成原因、联机分析挖掘概念及特征
(二)教学要求掌握OLTP与OLAP基本概念、多维数据分析理解OLAP与联机分析挖掘关系了解多维数据模型与结构
(三)重点与难点
1.重点OLTP、OLAP基本概念、多维数据分析
2.难点OLAP与DM关系第四章分类算法初步分类概念;分类方法;决策树算法ID3算法、C
4.5算法;贝叶斯分类;粗糙集方法粗糙集模型扩展、粗糙集与其他不确定信息处理理论的关系;遗传算法;其他分类算法
(二)教学要求掌握分类概念、掌握聚类和分类区别理解粗糙集、决策树算法了解其他分类算法
(三)重点与难点
1.重点分类概念
2.难点ID3算法第五章聚类算法分析聚类分析概述聚类分析概念、聚类分析中的数据类型;聚类分类;划分方法K—means算法、Kmedoid算法;层次方法BIRCH算法、CURE算法;密度方法DBSCAN算法、OPTICS算法;网格方法STING算法、Wavecluster算法;基于标量化III的聚类统计算法数学描述、计算方法、文本数据、应用实例;其他聚类算法
(二)教学要求掌握聚类分析概念、K-means算法、层次方法理解基于标量化III的聚类统计算法了解其他聚类算法
(三)重点与难点
1.重点聚类算法
2.难点具体算法实现(SPSS、R)第六章关联规则模型及应用关联规则的基础理论:关联规则的定义与解释、关联规则在知识管理过程中的作用;Apr iori关联规则算法关联规则算法的相关概念、关联规则算法的流程、基于Apriori算法的关联规则算例;改进的Apriori关联规则方法动态存储空间的构建、快速产生强项集的算法流程、改进算法的时间复杂性分析;Apriori关联规则方法的实例
(二)教学要求掌握关联规则的基础理论Apriori关联规则方法理解关联规则算法的流程了解商务智能系统
(三)重点与难点
1.重点Apriori关联规则方法
2.难点具体算法实现(SPSS、R)第七章粗糙集方法与应用粗糙集理论背景介绍粗糙集的含义、粗糙集的应用及与其他领域的结合;粗糙集基本理论知识与不可分辨关系、不精确范畴、近似与粗糙集、粗糙集的精度和粗糙度、粗糙集的粗等价和粗包含;基于粗糙集的属性约简知识的约简和核、知识的依赖性度量和属性的重要度;基于粗糙集的决策知识表示基于粗糙集的决策知识表示方法、粗糙集在规则提取中的应用算例
(二)教学要求掌握粗糙集理论理解数据仓库系统相关技术之间的关系了解商务智能系统
(三)重点与难点
1.重点粗糙集理论等
2.难点粗糙集在规则提取中的应用算例第八章遗传算法与应用遗传算法基础理论遗传算法概述、遗传算法特点;遗传算法的应用领域和研究方向遗传算法的应用领域、遗传算法的研究方向;遗传算法的基础知识:遗传算法的相关概念遗传算法的编码规则、遗传算法的主要算子、遗传算法的适应度函数;遗传算法计算过程和应用:遗传算法计算过程、遗传算法参数选择、遗传算法实例应用
(二)教学要求掌握遗传算法基础理论理解遗传算法的编码规则了解遗传算法的应用领域和研究方向
(三)重点与难点
1.重点遗传算法基础理论
2.难点遗传算法实现第九章R语言数据分析与数据挖掘R语言相关技术知识R语言使用基础、R语言数据探索理论、R语言数据分析理论与R语言数据处理、R语言数据挖掘建模
(二)教学要求掌握R语言使用基础、R语言数据探索理论理解数据仓库系统相关技术之间的关系
(三)重点与难点
1.重点R语言使用基础、R语言数据探索理论
2.难点R语言数据分析理论与R语言数据处理、R语言数据挖掘建模第十章数据挖掘的新技术及其应用流数据挖掘技术、高维聚类算法、分布式数据挖掘、业务活动监控挖掘技术、业务活动监控预测模型
(二)教学要求掌握流数据挖掘技术、高维聚类算法、分布式数据挖掘基本概念理解业务活动监控挖掘技术了解业务活动监控预测模型
(三)重点与难点
1.重点数据挖掘新技术理论
2.难点实际应用分析
四、教学形式与学时分配学时分配章讲课实验上机课外小计第一章数据挖掘概述2第二章数据采集、集成与预处理技术2第三章多维数据分析与组织2第四章分类算法初步4第五章聚类算法分析42第六章关联规则模型及应用44第七章粗糙集方法与应用4第八章遗传算法与应用42第九章R语言数据分析与数据挖掘128第十章数据挖掘的新技术及其应用2合计4016注课外学时按相关专业培养计划列入表格
五、本课程开设的实验项目编号实验项目名称学时类型要求备注1回归分析与相关分析数据挖掘-SPSS(银行风险分析2综合性必做案例)2聚类数据挖掘-SPSS(中国城市空气质量聚类、2综合性必做中国城市地理经济聚类分析)3决策树-SPSS2综合性必做4神经网络-SPSS2综合性必做5R语言数据探索与数据处理72综合性必做6R语言数据探索与数据处理-22综合性必做7分类分析、聚类分析-R2综合性必做8关联规则:Apriori-R2综合性必做合计16六课程考核考核方式或途径考核要求考核权重备注平时作业
30.1实验
80.2期末考试闭卷
0.7七参考书目及学习资料(书名,主编,出版社,出版时间及版次)
1.R语言数据分析与挖掘实战,张良俊著,机械工业出版社,2015年10月第一版
2.SPSS统计分析与数据挖掘,谢龙汉,尚涛编著,电子工业出版社,
3.数据挖掘技术,王小妮,北京航空航天大学出版社,2014年8月第一版
八、大纲说明本大纲教学内容安排,主要以选定教材内容组织内容,其中融合参考书目中相关内容,实验用数据挖掘工具根据需要和技术发展可安排2017年8月13日。