还剩1页未读,继续阅读
文本内容:
数据挖掘课程大纲课程名称数据挖掘/DataMining课程编号242023授课对象信息管理与信息系统专业本科生开课学期第7学期先修课程C语言程序设计、数据库应用课程属性专业教育必修课总学时/学分48含16实验学时/3执笔人编写日期
一、课程概述数据挖掘是信息管理与信息系统专业的专业基础课课程通过介绍数据仓库和数据挖掘的相关概念和理论,要求学生掌握数据仓库的建立、联机分析以及分类、关联规则、聚类等数据挖掘方法从而了解数据收集、分析的方式,理解知识发现的过程,掌握不同问题的分析和建模方法通过本课程的教学我们希望能够使学生在理解数据仓库和数据挖掘的基本理论基础上,能在SQLServer2005平台上,初步具备针对具体的问题,选择合适的数据仓库和数据挖掘方法解决现实世界中较复杂问题的能力Dataminingisaprofessionalbasiccourseofinformationmanagementandinformationsystem.Throughintroducingtherelatedconceptsandtheoriesofdatawarehouseanddataminingitrequestsstudentstounderstandtheapproachesfortheestablishmentofdatawarehouseon-lineanalysisclassificationassociationrulesclusteringetc.Soastogetfamiliarwiththemethodsofdatacollectionandanalysisunderstandtheprocessofknowledgediscoveryandmastertheanalysisandmodelingmethodofdifferentproblems.ThroughtheteachingofthiscoursestudentsareexpectedtobeequippedwiththebasictheoryofdatawarehouseanddataminingandtheabilitytosolvecomplexreallifeproblemsontheplatformofSQLServer2005byselectingtheappropriatedatawarehouseanddataminingapproaches.
二、课程目标.了解数据仓库的特点和建立方法;.学会联机分析;.掌握分类、关联规则、聚类等数据挖掘方法;.理解知识发现的过程
三、主要内容及其基本要求本课程须完成的基本教学内容和要求如下1引论主要讲解数据挖掘的基本概念、可挖掘的类型模式、数据挖掘技术及数据挖掘的主要问题,要求学生理解数据挖掘的基本概念、作用;2数据预处理,主要讲解数据对象和属性类型、数据的基本描述统计、数据清理、数据集成、数据归约、数据变换及数据离散化“要求了解数据的形态,掌握数据预处理的方法;3数据仓库与联机分析处理主要讲解数据仓库的概念、数据仓库的设计与使用、联机分析处理要求理解数据仓库的概念、掌握数据仓库的设计与使用,熟悉联机分析过程;4数据立方体技术主要讲解数据立方体计算的概念、方法及应用要求学生了解数据立方体技术的概念、掌握数据立方体计算的方法;5关联规则主要讲解关联规则的原理及应用要求学生了解关联规则的概念、掌握关联规则的挖掘方法;6分类主要讲解分类的原理及应用要求学生了解分类的概念、掌握分类方法;7聚类主要讲解聚类的原理及应用要求学生了解聚类的概念、掌握聚类方法
四、教学方式和考试方式课堂讲授为主,适量课后作业考试方式为闭卷考试任课教师根据学生的实验30%、期中20%和期末考试50%三方面评定综合成绩
五、参考教材教材JiaweiHanMichelineKamberJianPei《数据挖掘概念与技术》第三版机械工业出版社,2012年;参考书AnandRajaraman《大数据——互联网大规模数据挖掘与分布式处理》,人民邮电出版社,2012年;坎塔尔季奇,《数据挖掘概念、模型、方法和算法》,清华大学出版社,2013年
六、教学内容及课时分配章节内容学习要点备注引论4学时数据挖掘概念可以挖掘的类型模式数据挖掘技术数据挖掘的主要问题重点介绍可以挖掘的类型模式第二章数据及数据预处理8学时数据对象及属性类型数据的基本统计描述数据可视化度量数据相似性和相异性数据的清理、集成、归约、变换与数据离散化重点讲解如何进行数据预处理第三章数据仓库与联机分析处理4学时数据仓库基本概念数据立方体与联机分析数据仓库的设计与使用数据仓库的实现数据泛化重点讲解数据仓库的设计及联机分析第四章数据立方体技术4学时数据立方体计算基本概念数据立方体计算方法数据立方体空间的多维数据分析重点讲解数据立方体计算方法第五章关联规则(8学时)关联规则基本概念频繁项集挖掘方法多层、多维空间中的模式挖掘模式探索与应用重点讲解频繁项集挖掘方法第六章分类(12学时)分类基本概念决策树贝叶斯分类支持向量机模型评估与选择重点讲解决策树及模型评估第七章聚类(8学时)聚类概念K-均值聚类基于密度的聚类基于网格的聚类聚类图和网络数据聚类评估重点讲解K-均值聚类及评估。