还剩5页未读,继续阅读
文本内容:
《商务智能与数据挖掘》教学大纲
一、课程基本信息商务智能与数据挖掘课程名称Business Intelligenceand Data Mining课程编码SEM221411035开课院部经济管理学院课程团队数据挖掘与智能决策教学团队
3.5课内学时60讲授48实验12上机0实践0课外学时48学分适用专业信息管理与信息系统中文授课语言先修课程程序设计(Python)、线性代数、概率论与数理统计、运筹学、管理统计学本课程是信息管理与信息系统专业学生必修的一门重要的学科基础课课程主要讲授商务智能与数据挖掘标准流程和典型机器学习算法,介绍Python数据挖掘与应用通过本课程的学习,学生应了解商务智能的系统架构和数据挖掘标准流程,理解商务智能与数据挖掘的基本概念和方法,掌握数据挖掘相关模型的基础理论知识;针对数据挖掘的分类、聚类、关联分析等问题,能对数据进行有效的预处理,选择合适的算法并进行参数调优,进行数据分析与挖掘以获得商务智能决策支持信息;掌握专门面向机器学习的Python包Scikit learn,能够通过Python编程进行具体的数据挖掘,具备商务数据分析和挖掘的能力This courseis animportant compulsorybasic coursefor studentsmajoring ininformation managementand informationsystems.The课程简介(必course mainlyteaches business intelligence anddata miningstandard processesand typicalmachine learningalgorithms,and introduces修)Python data mining andapplication.Through thestudy ofthis course,students shouldunderstand thesystem architectureof businessintelligenceand thestandard processof datamining,and understandthe basicconcepts andmethods ofbusiness intelligenceand datamining,master thebasic theoreticalknowledge of dataminingrelated models.Focusing onthe classification,clustering,associationanalysis andother issuesofdatamining,students shouldknow howto effectivelypreprocess thedata,select theappropriate algorithmandperform parametertuning,and conductdata analysisand miningto obtainbusinessintelligencedecision supportinformation.Studentsshould masterthe Pythonpackage Scikit-learn whichis specificallyused formachine learningand beable toanalyze andmine businessdatawith Pythonprogramming.负责人大纲执笔人审核人
二、课程目标课程目标毕业要求指标点序号代号OBE任务自选1Ml目标1了解商务智能的系统架构和数据挖掘标准流程是
3.
23.22M2目标2:理解商务智能与数据挖掘的基本概念和方法,掌握数据挖掘相关算法的基础理论知识是
4.
24.2目标3针对具体数据挖掘问题,能选择合适的算法,通过Python编程进行数据分析与挖掘,获得商务3M3是
3.
33.3智能决策支持信息
三、课程内容支撑课程课内学课外学序号章节号标题课程内容/重难点教学方式课外环节目标时时本章重点难点商务智能与数据挖掘的概念、数据挖掘的流程及主要第1章商务智能与1第1章任务、商务智能的系统架构及实施课程思政遵纪守法,尊重个人/////数据挖掘概述隐私
1.1商务智能与数商务智能与数据挖掘的需求和基本定义,应用案例讨论,商务智能支讲授、讨论
21.1Ml11自主学习据挖掘简介撑技术
1.2数据挖掘的流程数据挖掘涉及的领域,数据挖掘的流程,数据挖掘的主要任务,常见讲授、讨论
31.2Ml22自主学习的数据挖掘软件
1.3商务智能的系统讲授、讨论
41.3商务智能系统架构,商务智能系统要素,商务智能系统实施Ml11自主学习架构及实施第2章数据的理解本章重点难点数据对象与属性类型、数据的基本统计描述与可视化、5第2章////与预处理数据预处理方法
2.1数据对象与属性数据对象与属性术语表达,标称属性、二元属性、有序属性、数值型
62.1M21讲授1自主学习类型属性
2.2数据的基本统
72.2集中趋势的度量,离散度的度量,数据的图形描述与可视化M21讲授1作业计描述与可视化
2.3数据预处理方
82.3数据清洗,数据整合,数据缩减,数据变换与离散化M22讲授2自主学习法第3章数据仓库与9第3章本章重点难点数据仓库设计与应用、联机分析处理的实现////在线分析处理
3.1数据仓库基本概数据管理与数据库,数据仓库定义,数据仓库模型,数据抽取一转换
103.1M222自主学习念-装载,数据仓库设计与应用讲授、讨论联机分析处理简介、分类,基本概念和典型操作,实现途径及实施过讲授、讨论
113.
23.2联机分析处理M222自主学习程,评价准则第4章模型评价与选12第4章本章重点难点交叉验证、超参数选择、数据挖掘方法比较////择训练和测试集合的划分,预测性能的置信区间,旁置法、交叉验证、
134.
14.1旁置法估计Ml2讲授2作业留一交叉验证法、自助法,验证集与超参数选择
4.2数据挖掘方法比T检验比较,损失函数,分类模型评价指标,成本计算,回归性能指
144.2Ml2讲授2自主学习较标15第5章第5章贝叶斯网络本章重点难点朴素贝叶斯分类器、贝叶斯网络学习算法////
5.1朴素贝叶斯分类类别型朴素贝叶斯分类器、高斯朴素贝叶斯、多项式朴素贝叶斯
165.1M22讲授2作业器
175.
25.2贝叶斯网络贝叶斯网络定义,贝叶斯网络学习算法的构建,K2,TAN M222讲授自主学习18第6章第6章决策树本章重点难点决策树常用算法、剪枝////OneR算法,连续性数据离散化方法,ID3算法,C.5算法,
6.1决策树常用算法
196.1M21讲授1作业CART算法
6.2决策树剪枝方法
206.2预剪枝,后剪枝,后剪枝的两种方式,剪枝的原则M21讲授1自主学习
216.
36.3集成学习装袋法、提升法、随机森林M222讲授自主学习22第7章第7章聚类分析本章重点难点K-Means聚类、层次聚类,DBSCAN聚类////相似度测度,K-Means聚类算法,对变量的预处理,K-Means聚类的提
237.
17.1K-Means聚类M21讲授1作业升
247.
27.2层次聚类层次聚类的特点,类别层次合并的方法,聚类数目的确定M21讲授1自主学习DBSCAN聚类方法的基本参数、基本概念和算法,聚类质量的评价
257.
37.3DBSCAN聚类M22讲授2自主学习第8章关联规则挖26第8章本章重点难点覆盖算法、Apriori算法////掘
8.1覆盖算法建立
278.1规则与树,覆盖算法,规则与决策列表M22讲授2自主学习规则产生频繁项集,寻找频繁项集,依据频繁项集产生关联规则,高效地
288.
28.2Apriori算法M22讲授2作业生成规则,关联规则测度指标本章重点难点线性回归模型正则化项,logistic回归,感知机的29第9章第9章线性模型////线性分类线性回归模型表达及求解,正则化项对应的算法,logistic回归模
309.
19.1线性回归模型M22讲授2自主学习型表达及求解
319.
29.2感知机感知机的线性分类,Winnow的线性分类M222讲授自主学习第10章本章重点难点误差逆传播算法,全局最小与局部最小,深度学习32第10章神经网络////
10.1多层神经网络神经元模型,多层神经网络,误差逆传播算法,全局最小与局部最小
3310.1M22讲授2自主学习
3410.
210.2深度学习卷积神经网络,循环神经网络,深度学习流行框架M222讲授自主学习第11本章重点难点支持向量机的模型求解、核函数的应用,支持向量回35第11章支持向量机////归1L1支持向量机分类
3611.1间隔与支持向量,对偶问题,核函数,软间隔与正则化M22讲授2作业
11.2支持向量回归
3711.2基于线性和非线性核函数的支持向量回归M22讲授2自主学习第12第12章商务智能系本章重点难点基于SAP的商务智能系统,商品个性化推荐的客户智38M2////统与应用能应用
12.1基于SAP的商SAP商务智能系统在SAP应用系统中的地位,商务智能平台,基于SAP
3912.1M22翻转课堂2自主学习务智能系统的商务智能系统案例
4012.
212.2客户智能应M222客户智能推荐系统应用案例,商品个性化推荐的客户智能应翻转课堂自主学习用用,工业互联网中的客户智能应用实验1分类问题一针对于银行有关客户个人信息、通话过程、以往销售活动等因素的41实验1银行理财产品电话销数据,进行描述性分析,选取合适的特征,构建合理的模型,并根M34上机2撰写报告据分类准确度等指标和工具评估模型的预测效果售预测实验2聚类分析一通过对网络零售客户个人信息的聚类,发现客户群的特征,以实现42实验2网络零售客户聚类对目标客户的准确理解和客户定位,便于后期针对不同特点的客户M34上机2撰写报告采用不同的营销策略实验3预测问题一选择经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),43实验3M34上机2撰写报告工业蒸汽量预测根据锅炉的工况,预测产生的蒸汽量
四、考核万式序号考核环节操作细节总评占比
1.每周布置1道题目
2.成绩采用白分制,根据作业完成准确性、是否按时上交、是否独立完成评分1平时作业15%
3.考核学生对数据挖掘基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力题型主要有论述、分析和计算题
1.本课程12个学时实验,共3次实验
2.成绩采用白分制,根据实验完成情况评分2实验15%
3.考核学生对机器学习算法包Scikit-learn的应用能力,针对不同的数据挖掘问题,进行数据分析与挖掘以获得商务智能决策支持信息考核学生能够应用数据挖掘的相关理论方法,对数据进行科学的加工和分析处理,提供决策支持并进行阐述和交流的能力
1.从业务需求出发,解析为合适的数据挖掘问题,能对数据进行有效的预处理和统计性描述
2.针对数据挖掘的分类、聚类、关联分析等问题,能够选择合适的算法并进行参数调优,进行数据分析与挖掘3结课报告40%
3.将数据挖掘结果进行解释和可视化,能够获得商务智能决策支持信息410%课堂表现随机检查学生上课精神状态、回答问题情况5使用雨课堂随堂测验,主要考核学生对数据挖掘基本知识的掌握,学生综合运用所学知识分析问题、解决问题的能力,20%线上互动
五、评分细则题型主要有简答题、选择题、填空题、计算题等序号课程目标考核环节大致占比评分等级A-按时提交作业,商务智能架构和数据挖掘基本流程理解无误B-按时提交作业,商务智能架构和数据挖掘基本流程理解存在少量错误c-不按时提交作业,商务智能架构和数据挖掘基本流程理解存在少量错误D-不按时提交1Ml平时作业50%作业,商务智能架构和数据挖掘基本流程理解存在错误E-不按时提交作业,商务智能架构和数据挖掘基本流程理解存在大量错误A-按时提交报告,商务智能架构和数据挖掘基本流程理解无误B-按时提交报告,商务智能架构和数据挖掘基本流程理解存在少量错误c-不按时提交报告,商务智能架构和数据挖掘基本流程理解存在少量错误D-不按时提交2Ml结课报告50%报告,商务智能架构和数据挖掘基本流程理解存在错误E-不按时提交报告,商务智能架构和数据挖掘基本流程理解存在大量错误A-按时提交作业,数据挖掘和模型算法等基本知识点理解无误B-按时提交作业,数据挖掘和模型算法等基本知识点理解存在少量错误C-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在少量错误D-不按时提交3M2平时作业40%作业,数据挖掘和模型算法等基本知识点理解存在错误E-不按时提交作业,数据挖掘和模型算法等基本知识点理解存在大量错误4M240%[A,B,C,D,E]=[90-100,80-89,70-79,60-69,0-59]线上互动A-回答问题积极,数据挖掘和模型算法等基本知识点理解无误B-回答问题积极,数据挖掘和模型算法等基本知识点理解存在少量错误C-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在少量错误D-回答问题不5M2课堂表现10%积极,数据挖掘和模型算法等基本知识点理解存在错误E-回答问题不积极,数据挖掘和模型算法等基本知识点理解存在大量错误A-按时提交实验报告,针对具体数据挖掘问题,能选择合适的算法,Python编程正确,算法性能优秀,能得到较好的数据分析与挖掘结果B-按时提交实验报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Pylhon编程正确,但算法性能不好,能得到数据分析与挖掘的结果C-不按时提交实验报告,针对具体数据挖掘问题,能6M3实验50%选择该问题所属类的算法,Python编程正确或有少量错误,算法性能不好,能得到数据分析与挖掘的结果D-不按时提交实验报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Python编程不止确,算法性能不好,数据分析与挖掘的结果错误E-不按时提交实验报告,针对具体数据挖掘问题,不能选择该问题所属类的算法,Python编程不止确,得到的数据分析与挖掘结果错误7M3结课报告50%A-按时提交结课报告,针对具体数据挖掘问题,能选择合适的算法,Python编程正确,算法性能优秀,能合理地阐释和可视化数据分析与挖掘结果B-按时提交结课报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Python编程正确,但算法性能不好,能合理地阐释和可视化数据分析与挖掘的结果C-不按时提交结课报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Pylhon编程正确或有少量错误,算法性能不好,能合理地阐释和可视化数据分析与挖掘的结果D-不按时提交结课报告,针对具体数据挖掘问题,能选择该问题所属类的算法,Python编程不止确,算法性能不好,不能合理地阐释和可视化数据分析与挖掘的结果E-不按时提交结课报告,针对具体数据挖掘问题,不能选择该问题所属类的算法,Python编程不正确,不能合理地阐释和可视化数据分析与挖掘的结果评分等级说明[A,B,C,D,E]=[90-100,80-89,70-79,60-69,0-59];
六、教材与参考资料序号教学参考资料明细1图书DataMining:Concepts andTechniques(英文版第三版),Jiawei Han,机械工业出版社,
2014.07,ISBN:
9787111374312.(*主教材)2图书1商务智能与数据挖掘,陈晓红,高等教育出版社,
2018.09,ISBN:
9787040497946.3图书1机器学习,周志华,清华大学出版社,
2016.01,ISBN:
9787302423287.4M00C|Python快速入门,张敏,泰迪云课堂.期干IJ论文UC IrvineMachine LearningRepository,Dua,D.,University ofCalifornia,School ofInformation andComputer Science,
2017.56期干论文A data-driven approachto predictthe successof banktelemarketing,Sergio Moro,Decision SupportSystems,
2014.
06.
七、实验项目信息实验室名称门牌号组人数要求上机序号项目名称学时实验类别实验类型分类问题一银行理财产品电话销售预测1机房24专业必做验证性是2聚类分析一网络零售客户聚类24专业验证性机房必做是324专业验证性预测问题一工业蒸汽量预测机房必做是。