还剩4页未读,继续阅读
文本内容:
《数据挖掘》教学大纲
一、课程基本信息数据挖掘课程名称Data Mining课程编码SEM223221030开课院部经济管理学院课程团队数据挖掘与智能决策教学团队学分
3.0课内学时52讲授40实脸|12上机0|实践0课外学时0适用专业工程管理授课语言中文先修课程程序设计(Python)、线性代数、概率论与数理统计、运筹学、管理统计学本课程是工程管理专业学生必修的一门至要的学科基础课课程主要讲授数据挖捱标准流程和典型机濯学习算法.介绍Python数据挖掘与应用通过本课程的学习.学生应了解数据挖掘标准流程,理解数据挖掘的基本概念和方法.掌握数据挖掘相关模型的基础理论知识;针对数据挖掘的分类、聚类、关联分析等问题,能对数据进行有效的狡处理.选择合适的算法并进行参数调优,进行数据分析与挖掘以获得智能决策支持信息掌握专门面向机器学习的Python包Scikit-lcarn,能够通过Python编程进行具体的数据挖掘.具备数据分析和挖掘的能力课程简介(限Thiscourseisanimportantcompulsorybasiccourseforstudentsmajoringinengineeringmanagement.Thecoursemainlyteaches选)dataminingstandardprocessesandtypicalmachinelearningalgorithms,andintroducesPythondataminingandapplication.Throughthe studyof thiscourse,students shou1d understandlhe standardprocess of data mining,and understandthe basicconcepts andmethodsofdata mining,master thebasic theoreticalknowledge ofdata miningrelated models.Focusing onthe classification,clustering,association analysisand otherissues ofdatamining,students shouldknow howto effectivelypreprocess thedata,selecttheappropriatealgorithmandperformparametertuning,andconductdataanalysisandminingtoobtainintel1igencedecisionsupport informalion.Students shouldmaster thePython packageSeiki learnwh ich isspeci ficullyused formachine learningandbe ableto dodata analysisand mining wiIhPython programming.负责人大纲执笔人审核人二课程目标毕业要求指标点序号代号课程目标OBE任务自选1Ml目标1:理解数据挖掘的基本概念和流程,掌握数据挖掘相关算法的基础理论知识是
2.
62.6目标2:针对具体数据挖掘问题,能选择合适的算法,进行Python编程,数据分析与挖掘以获得智能决2M2是
3.
53.5策支持信息三课程内容支撑课程课内学课外序号量节号标题课程内容/重难点教学方式课外环节目标时学时第1至数据挖掘概述本章重点难点数据挖掘的概念、数据挖掘的流程及主要任务课程1第1章思政遵纪守法.尊重个人隐私讲授、讨论
21.
11.1数据挖掘简介数据挖掘的需求和基本定义,应用案例讨论Ml21自主学习
1.2数据挖掘的流程数据挖掘涉及的领域.数据挖掘的流程.数据挖掘的主要任务,常见讲授、讨论
31.2Ml21自主学习的数据挖掘软件第2章数据的理解与本章至点难点数据对象与属性类型、数据的基本统计描述与可4第2章////预处理视化、数据预处理方法
2.1数据对象与属性数据对象与属性术语表达,标称属性、二元属性、有序属性、数
52.1M21讲授1自主学习类型值型属性
2.2数据的基本统计
62.2集中趋势的度量.离散度的度量.数据的图形描述与可视化M21讲授1作业描述与可视化
2.3数据预处理方
72.3数据清洗,数据整合,数据缩减,数据变换与离散化M22讲授1自主学习法第3*模型评价与选8第3章本章重点难点交叉验证、超参数选择、数据挖娓方法比较////择训练和测试集合的划分,预测性能的置信区间,旁置法、交叉睑
93.
13.1旁置法估计Ml2讲授i作业证、留一交叉验证法、自助法.验证集与超参数选择
3.2数据挖掘方法比T检验比较,损失函数.分类模型评价指标,成本计算,回归性能
103.2Ml2讲授1自主学习较指标11第4章第4至贝叶斯网本章重点难点朴素贝叶斯分类器、贝叶斯网络学习算法////络
1.1朴素贝叶斯分类类别型朴素贝叶斯分类器、高斯朴素贝叶斯、多项式朴素贝叶斯
124.1M22讲授1作业第
134.
24.2贝叶斯网络贝叶斯网络定义,贝叶斯网络学习算法的构建,K2,TAX M22讲授1自主学习14第5章第5堂决策树本章重点难点决策树常用算法、剪枝////
5.1决策捌常用算法OneR算法,连续性数据离散化方法,ID3算法,C.5算法.
155.1M21讲授1作业CART算法
5.2决策树剪枝方法
165.2预剪枝,后剪枝.后剪枝的两种方式.剪枝的原则M21讲授i自主学习
175.
35.3集成学习装袋法、提升法、随机森林M22讲授自主学习118第6章第6至聚类分析本章重点难点K Yeuns聚类、层次聚类,DBSCAN聚类///相似度测度.K-Means聚类算法,对变量的预处理,K-Means55类
196.
16.1K-Means聚类M21讲授1作业的提升
206.
26.2层次聚类层次聚类的特点,类别层次合并的方法,聚类数目的确定M21讲授1自主学习
216.
36.3DBSCAN聚类M22讲授1自主学习DBSCAN聚类方法的基本参数、基本概念和算法,聚类质量的评价22第7章第7至关联规则挖掘本章重点难点覆盖算法、Apriori算法////
7.1覆盖算法建立
237.1规则与树,覆盖算法.规则与决策列表M22讲授1自主学习规则产生频繁项集.寻找频繁项集.依据频繁项集产生关联规则,高效
247.
27.2Apriori算法M22讲授1作业地生成规则.关联规则测度指标本章重点难点线性回归模型正则化项,logistic回归,感知机的25第8章第8堂线性模型//i/线性分类线性回归模型表达及求解,正则化项对应的算法,logistic回归
268.
18.1线性回归模型M22讲授1自主学习模型表达及求解
278.
28.2感知机感知机的线性分类,Winnow的线性分类M22讲授自主学习128第9章第9章神经网络本章重点难点误差逆传播算法.全局最小与局部最小.深度学习////神经元模型.多层神经网络,误差逆传播算法,全局最小与局部最
299.
19.1多层神经网络M22讲授1自主学习小
309.
29.2深度学习卷积神经网络.循环神经网络,深度学习流行框架M22讲授自主学习1第10第10堂支持向量机本章重点难点支持向量机的模型求解、核函数的应用.支持向量31///章回归
10.1支持向量机分
3210.1间隔与支持向量.对偶问题,核函数.软间隔与正则化M22讲授1作业类
10.2支持向量回归
3310.2基于线性和非线性核函数的支持向量回归M22讲授1自主学习实的1分类问题一针对于银行有关客户个人信息、通话过程、以往销售活动等因素34实验1银行理财产品电话的数据,进行描述性分析,选取合适的特征,构建合理的模型,并M24上机2撰写报告销售预测根据分类准确度等指标和工具评估模型的预测效果,实脸2聚类分析通过对网络零售客户个人信息的聚类,发现客户群的特征.以实现35实验2网络零名客户聚对目标客户的准确理解和客户定位.便于后期针对不同特点的客户M24上机2撰写报告类采用不同的管精策略.实聆3预测问题选择经脱敏后的锅炉传感器采集的数据(采集痰率是分钟级别),36实验3M24上机2撰写报告・工业蒸汽量预测根据锅炉的工况,预测产生的蒸汽量
四、考核方式序号考核环节操作细节总评占比
1.每周布置1道遨目
2.成绩采用百分制.根据作业完成准确性、是否按时上交、是否独立完成评分1平时作业15%
3.考核学生对电力拖动自动控制系统基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力题型主要有作图、分析和计算题
1.本课程12个学时实验.共3次实验2实脸15%
2.成绩采用百分制,根据实脸完成情况评分
3.考核学生对机部学习算法包Scikit-learn的应用能力,针对不同的数据挖掘问题.进行数据分析与挖抠以获得智能决策支持信息考核学生能够应用数据挖掘的相关理论方法.对数据进行科学的加工和分析处理,提供决策支持并进行阐述和交流的能力
1.从业务需求出发.解析为合适的数据挖掘问题,能对数据进行有效的预处理和统计性描述3结课报告
2.针对数据挖掘的分类、聚类、关联分析等问题,能够选杼合适的算法并进行参数调优,进行数据分析与挖掘.-10H
3.将数据挖掘结果进行解释和可视化,能够获得智能决策支持信息,4课堂表现随机检查学生上课精神状态、回答问题情况10S使用雨课堂随堂测验.主要考核学生对数据挖掘基本知识的掌握,学生综合运用所学知识分析问题、解决问题的能力.题型主5线上互动20%要有简答题、选界题填空题、计算题等.
五、H,分细则序号课程目标考核环节大致占比评分等级A-按时提交作业,数据挖抠和模型算法等基本知识点理解无误B按时提交作业.数据挖掘和模型算法等基本知识点理解存在少量错误,.C-不按时提交作业.数据挖掘和模型算法等基本知识点理解存在少量错误.『不按时1Ml平时作业30%提交作业,数据挖掘和模型算法等基本知识点理解存在错误、E-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在大量错误A-回答问题积极,数据挖掘和模型算法等基本知识点理解无误B-回答问题积极,数据挖掘和模型算法等基本知识点理制存在少量错误c-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在少量错误A回答2Ml课堂表现20%问题不积极,数据挖掘和模型算法等基本知识点理解存在错误:E-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在大量错误3Ml线上互动50%根据雨课堂导出的测试成绩标准化评价入B.C,D,E]=[90-
100.80-
89.70-
79.60-69,0-59]A-按时提交实脸报告,能正确地进行Pyihon编程.算法性能优秀,能得到较好的数据分析与挖掘结果B-按时提交实验报告,能进行Python编程,但算法性能不好,能得到数据分析与挖掘的结果.C-不按时提交4M2实验40%实验报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果卜不按时提交实验报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果E-不按时提交实骏报告,不能正确地进行Python编程.得到的数据分析与挖掘结果错误5M2结课报告60%A-按时提交结课报告,能正确地进行Python编程,算法性能优秀,能得到较好的数据分析与挖掘结果.B-按时提交结课报告,能进行Python编程,但算法性能不好,能得到数据分析与挖掘的结果C-不按时提交结课报告.能进行Python编程,但算法性能不好.不能得到数据分析与挖掘的结果.D不按时提交结课报告,能进行Python编程,但算法性能不好,不能得到数据分析与挖掘的结果E-不按时提交结课报告,不能正确地进行Python编程,得到的数据分析与挖掘结果错误评分等级说明[A,B,C,D,E]-[90-100,80-89,70-79,60-69,0-59];
六、教材与参考资料序号教学参考资料明细1图书Data Mining:Concepts andTechniques(英文版第三版),Jiawei Han,机械工业出版社,
2014.07,ISBN:
9787111374312.(*主教材)2图书机器学习,周志华,清华大学出版社,
2016.01,ISBN:
9787302423287.3M00C Python快速入门,张敏,泰迪云课堂.期刊论文|UC IrvineMachine LearningRepository,Dua,D.,University ofCalifornia,School ofInformation andComputer Science,
2017.45期刊论文A data-driven approachto predictLhe successof hanktelemarketing,Sergio Moro,Decision SupportSystems,
2014.
06.
七、实验项目信息序号项目名称实验室名称门牌号组人数学时实验类别要求实验类型上机分类问题一银行理财产品电话销隹预1机房24专业必做骏证性是测2聚类分析一网络零售客户聚类机房24专业必做验证性是3预测问题一工业蒸汽量预测机房24专业必做骏证性E1。