还剩3页未读,继续阅读
文本内容:
《数据仓库与数据挖掘》教学大纲一课程概况课程名称数据仓库与数据挖掘英文名称Data warehousingand datamining课程性质课程学时课程学分授课对象开课时间讲课方式主讲老师
二、教学目的本课程把数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和应用问题三教学任务完成《数据仓库与数据挖掘》教材内容,及教学计划中的互动实践内容,另有学生自主选题的大作业、选作的论文报告学时课堂、实验、课外、研讨学时四教学内容的结构课程由9个教学单元组成,对应于《数据仓库与数据挖掘》的内容第1章数据仓库和数据挖掘概述
1.1概述
11.2数据中心
41.
2.1关系型数据中心
1.
2.2非关系型数据中心123混合型数据中心(大数据平台)
1.3混合型数据中心参考架构第2章数据
1.
1.1的概念
1.
1.2的内容221实时数据与历史数据
1.
1.3时态数据与事务数据
1.
1.4图形数据与图像数据
1.
1.5主题数据与全部数据
1.
1.6空间数据226序列数据和数据流
1.
1.7元数据与数据字典
2.3数据属性及数据集
2.4数据特征的统计描述
222.
4.1集中趋势
222.
4.2离散程度
232.
4.3数据的分布形状
252.5数据的可视化
262.6数据相似与相异性的度量
292.7数据质量
322.8数据预处理
322.
8.1被污染的数据
332.
8.2数据清理
352.
8.3数据集成
362.
8.4数据变换
372.
8.5数据规约38第3章数据仓库与数据ETL基础
393.1从数据库到数据仓库
393.2数据仓库的结构
393.
2.1两层体系结构
413.
2.2三层体系结构
413.
2.3组成元素
423.3数据仓库的数据模型
433.
3.1概念模型
433.
3.2逻辑模型
433.
3.3物理模型
463.4ETL
463.
4.1数据抽取
473.
4.2数据转换
483.
4.3数据加载
493.5OLAP
493.
5.1维
493.
5.2OLAP与OLTP
493.
5.3OLAP的基本操作
503.6OLAP的数据模型
513.
6.1ROLAP
523.
6.2MOLAP
523.
6.3HOLAP53第四章数据仓库和ETL工具
544.1IBM DB2V
104.
1.1自适应压缩
544.
1.2多温度存储
554.
1.3时间旅行查询
564.
1.4DB2兼容性功能
604.
1.5工作负载管理
614.
1.6PureXML
624.
1.7当前已落实
634.
1.8DB2PureScale Feature
634.
1.9分区特性
654.
1.10并行技术
674.
1.11SQW
684.
1.12Cubing Services
684.
1.13列式存储及压缩技术BLU
704.2InfoSphere Datastage
714.
2.1基于Information Server的架构
724.
2.2企业级实施和管理
754.
2.3高扩展的体系架构
794.
2.4具备线性扩充能力
814.
2.5ETL元数据管理
824.3InfoSphere QualityStage82第5章数据挖掘基础
845.1数据挖掘的起源
845.2数据挖掘的定义
855.3数据挖掘的任务
865.
3.1分类
5.
3.2回归分析
5.
3.3相关分析
5.
3.4聚类分析
5.
3.5关联规则
5.
3.6异常检测
5.4数据挖掘标准流程
5.
4.1商业理解
5.
4.2数据理解
5.
4.3数据准备
5.
4.4建立模型
5.
4.5模型评估
5.
4.6结果部署
5.5数据挖掘的十大挑战性问题
5.
5.1数据挖掘统一理论的探索
5.
5.2高维数据和高速数据流的研究与应用553时序数据的挖掘与降噪
5.
5.4从复杂数据中找寻复杂知识
5.
5.5网络环境中的数据挖掘
5.
5.6分布式数据挖掘
5.
5.7生物医学和环境科学数据挖掘
5.
5.8数据挖掘过程自动化与可视化559信息安全与隐私保护5510动态、不平衡及成本敏感数据的挖掘第6章数据挖掘算法
6.1算法概述
6.
1.1分类算法及评估指标
6.
1.2聚类算法及其评价指标
6.2C
4.
56.3CART算法
6.4K-Means算法
6.5SVM算法
1216.6Apriori算法
6.7EM算法
6.8PageRank
6.9Adaboost算法
6.10KNN算法
6.11Naive Bayes第7章数据挖掘工具与产品
7.1数据挖掘工具概述
7.2商业数据挖掘工具IBM SPSSModeler
7.3开源通用的数据挖掘工具WEKA第8章数据挖掘案例
8.1概述
8.2纳税评估示例
8.3税收预测建模示例
8.4税务行业纳税人客户细分探索
8.5基于Hadoop平台的数据挖掘思考题第9章大数据管理
9.1什么是大数据
9.2Hadoop介绍
9.3NoSQL介绍
9.4InfoSphere Biginsights
3.0介绍
五、教学活动以及教学方法上的基本要求课堂教学、实验、课外作业、自选题目的大作业、论文和报告结合,另有课外讨论环节通过课堂教学讲解基本原理和方法;通过互动实践课巩固课堂教学内容,并在助教辅导下完成基础实验,由助教验收;课外作业由学生独立完成,并提交系统进行评分自选题目的大作业可以分组进行,要在期中提交选题报告,期末提交全部文档及程序并且逐一答辩答辩形式为学生演示9分钟,教师提问3分钟,当即给出成绩论文和报告属于加分因素课外讨论安排在每次课堂教学之后,加1学时,自愿参加,每人每学期至少参加一次内容为教师对难点进行复习、讲解补充例题,学生提问和讨论
六、主教材七电子资源。