还剩8页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《数据分析与统计软件》教学大纲
一、课程基本信息数据分析与统计软件课程名称Data AnalysisWith StatisticalSoftwareSCC321911030课程编码开课院部理学院课程团队统计团队
3.05632024056学分课内学时讲授实验上机实践课外学时数学与应用数学适用专业授课语言中文先修课程概率论、数理统计《数据分析与统计软件》是数学与应用数学专业的核心必修课程它是一门以概率论与数理统计和计算机软件为基础,关于数据的分析描述和推断学习的科学,是数据科学的基础内容它已广泛应用到自然科学、工程技术、经济金融和社会科学的许多领域中,与大数据分析和人工智能密切相关该课主要内容有统计软件RPython基础知识,探索性数据分析,回归分析,分类分析,机器学习的回归分类方法,聚类分析,主成分分析通过教学,能够使学生掌握数据分析的基本理论和常用的多元数据分析方法,掌握R Python软件在数据分析中的使用,了解现代数据分析的新进展,培养学生发现和解决数据科学领域实际问题的能力以及数据思维和计算思维能力,为将来研究和实际工作打下必要基础《Data analysis and statisticalsoftware》isacore compulsorycourse formathematics andapplied mathematicsmajors.It isascience basedon probabilitytheory,mathematical statisticsand computersoftware,and isthe basiccontent ofdata science.Ithas beenwidely usedin manyfields ofnatural science,engineering technology,economic financeand socialscience,and iscloselyrelated tobig data analysis andartificial intelligence.The maincontents ofthis lessoninclude:basic knowledgeof StatisticalSoftwareRPython,exploratory data analysis,regression analysis,classification analysis,regression classificationmethod ofmachine1earning,cluster analysisand principalcomponent analysis.Through teaching,students canmaster thebasic theoryof dataanalysisand commonlyused multivariatedataanalysismethods,master theuse ofRPython softwarein dataanalysis,and understandthenew progressof moderndataanalysis,to cultivatestudents*ability todiscover andsolve practicalproblems inthe fieldofdata science,as wellas datathinking andcomputational thinking,so asto laya necessaryfoundation forfuture researchand practicalwork.负责人大纲执笔人审核人6图书《人工智能与机器学习》,王秋月,中国人民大学出版社,2020,ISBN:
9787300275819.7图书An Introductionto StatisticalLearning withApplications inR,Gareth James,Springer,2013,ISBN:
9781461471387.图书Statistical Regressionand Classification_From LinearModels toMachine Learning,Norman Matloff,CRC Press,2017,ISBN:
9781498710916.89Data ScienceUsing Pythonand R,Chantal D.Larose,Wiley,2019,ISBN:
9781119526834.图书
二、课程目标毕业要求指标点序号代号课程目标0BE任务自选1Ml目标1掌握数据分析的基本理论和常用的多元数据分析方法是
3.
23.22M2目标2培养学生发现和解决数据科学领域实际问题的数据思维和计算思维能力是
3.
13.13M3目标3掌握R(Python)软件在数据分析中的使用
3.
13.1是4M4目标4通过使用英文统计软件,提高学生的专业英语水平
4.1是5M5目标5能保障课程正常秩序(政治层面、课堂保障层面,非学生能力层面)否
三、课程内容支撑课课内学课外学序号章节号标题课程内容/重难点教学方式课外环节程目标时时第一章R软件的使//1第1章本章重点难点统计软件R的基础知识、R在数据分析中的使用////用
21.
11.
1.R软件简介R软件下载安装与启动,R软件的界面M
30.5讲授
0.5自学
31.
21.
2.R数据结构R的对象与属性,向量、因子、数组、矩阵、数据框与列表M
30.5讲授
0.5自学
1.
3.R数据的输
41.3数据的输入,数据的输出M
30.5讲授
0.5自学/作业入与输出
51.
41.
4.R编程M
30.
50.5条件控制,循环控制讲授自学/作业
61.
51.
5.R图形基本画图,高级绘图M
30.
50.5讲授自学
1.
6.其它软件在数
71.6Python、MATLAB、SAS和SPSS在数据分析中的使用介绍M
30.5讲授/讨论
0.5自学据分析中的使用介绍上机⑴R软件基本撰写实验报8上机1上机
(1)R软件基本操作M3,M42上机2操作告第2章探索性数据9第2章本章重点难点数据的数字特征和图示方法/////分析
102.
12.
1.一维数据的样本均值,中位数,分位数,极差,方差,偏度,峰度Ml11讲授自学数字特征
2.
2.数据的分布图五数概括,直方图,茎叶图,箱线图,QQ图,经验分布函数,正态
112.2Ml1讲授1自学示检验上机⑵一维数字特撰写实验报12上机2征与数据的分布图示上机
(2)一维数字特征与数据的分布图示M3,M42上机2告
2.
3.多维数据的数随机向量的分布与数字特征,多维样本均值,协方差阵,相关阵
132.3Ml1讲授1作业字特征
2.
4.多维正态分布
142.4多元正态分布的概念基本性质,参数估计,案例与软件实现Ml1讲授/讨论1作业/自学及统计推断初步上机⑶多维数字特撰写实验报15上机3上机
(3)多维数字特征与参数估计M3,M42上机2征与参数估计告本章重点难点回归分析中估计检验方法及软件实现、回归分析中16第3章第3章回归分析/////相关公式的推导
3.
1.一元线性回归
173.
13.1一元线性回归分析Ml,M22讲授2作业•分析上机⑷一元线性回撰写实验报18上机4上机
(4)一元线性回归分析M3,M42上机2归分析告
3.
2.多元线性回归
193.2多元线性回归分析数学模型,参数估计与假设检验Ml2讲授2作业分析
(1)
3.
3.多元线性回归
203.3假设检验,回归诊断,预测,案例与软件实现Ml1讲授1作业分析
(2)
3.
4.自变量选择与作业/综合大
213.4自变量选择原理方法,Lasso方法,案例与软件实现Ml,M21讲授1逐步回归作业
3.
5.非线性回归模
223.5非线性回归,案例与软件实现Ml1讲授1作业型23上机5上机
(5)多元线性回归分析M3,M422撰写实验上机⑸多元线上机性回归分析报告本章重点难点Logistic回归、距离判别法和贝叶斯判别法及软件24第4章第4章分类分析/////实现、判别方法的基本思想及公式推导
254.1Logistic回归模型,案例分析与软件实现Ml,M21讲授1作业
4.
1.Logistic回归
4.
2.分类效果评价
264.2交叉核实,混淆矩阵,R0C曲线Ml1讲授1作业/自学上机6撰写实验报27上机6上机6:Logistic回归M3,M42上机2Logistic回归告
284.
34.
3.距离判别判别的基本思想,距离判别方法,案例分析与软件实现Ml11作业讲授作业/综合大
294.
44.
4.Bayes判别Bayes判别的基本思想和方法,案例分析与软件实现Ml,M22讲授2作业
304.
54.
5.Fisher判别Fisher判别的基本思想和方法Ml1讲授/讨论1作业/自学上机7判别分析撰写实验报31上机7上机7判别分析M3,M42上机2告第5章机器学习的回本章重点难点机器学习的回归分类方法的问题背景、数学原理与软32第5章/////归分类方法件实现
5.
1.决策树及其组作业/综合大
335.1决策树原理算法,随机森林原理方法,案例分析与软件实现Ml,M22讲授2合方法作业撰写实验报34上机8上机8决策树上机8:决策树M3,M42上机2告作业/综合大
355.
25.
2.支持向量机支持向量机原理算法,案例分析与软件实现Ml,M22讲授2作业上机9支持向量撰写实验报36上机9上机9支持向量机M3,M42上机2机告作业/综合大
375.
35.
3.神经网络神经网络原理算法,案例分析与软件实现Ml,M22讲授2作业上机
(10)神经网络撰写实验报38上机10上机
(10):神经网络M3,M42上机2告39第6章第6章聚类分析本章重点难点系统聚类法及软件实现、类间距离计算公式推导/////
6.
1.距离和相似系
406.1聚类的基本思想,距离度量,相似系数度量Ml1讲授1作业数作业/综合大
416.
26.
2.谱系聚类法谱系聚类基本原理和计算方法,案例分析与软件实现Ml,M21讲授1作业
426.
36.
3.快速聚类法快速聚类基本原理,K-Means聚类算法Ml1讲授/讨论1作业/自学上机
(11):聚类分析撰写实验报43上机11上机
(11)聚类分析M3,M42上机2告本章重点难点主成分分析的数学模型及应用软件实现、主成分的推44第7章第7章主成分分析/////导与性质
457.
17.
1.总体主成分Ml22作业主成分数学模型,主成分及其性质讲授作业/综合大
467.
27.
2.样本主成分样本主成分的计算,案例分析与软件实现Ml,M21讲授1作业上机
(12)主成分分撰写实验报47上机12上机
(12)主成分分析M3,M42上机2告析
四、考核方式序号考核环节操作细节总评占比
1.每周布置「2道题目,平均每次课1道题以上
2.成绩采用等级制(百分制),根据作业完成准确性、是否按时上交、是否独立完成评分1平时作业10%
3.考核学生对数据科学基本知识的掌握能力,学生综合运用所学知识分析问题、解决问题的能力题型主要有简答题、分析和计算题
1.本课程24个学时上机实验,共十二次上机实验2上机
2.成绩采用等级制(百分制),根据上机实验完成情况评分20%
3.考核学生对数据科学软件编程实现知识的应用能力,对实验结果的正确分析和解读
1.本课程要求利用R语言等现代数据分析工具建立研究对象的数据科学模型,编写出相应的程序实现计算,给出结论3大作业15%
2.根据模型建立情况和上机计算分析结论的准确性评分45%考勤随机点名、刷卡点名等5课堂表现随机检查学生上课精神状态、回答问题情况5%
1.半开卷考试,学生可带一张A4纸成绩采用百分制,卷面成绩总分100分6期末考试
3.主要考核学生对数据科学基本理论和方法的掌握情况,学生综合运用所学知识分析问题、解决问题的能力,题型主要有填空45%题、简答题、计算题、软件解读题等
五、评分细则课程目标序号考核环书大致占比评分等级A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确1Ml平时作业40%C-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准确D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分析解读实验数据,B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正确分析解2Ml上机10%读实验数据c-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没有正确分析解读实验数据D-上机实验过程中不能完成实验要求,不能得到正确的实验结果3Ml期末考试40%(见试卷评分标准)A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分析非常到位,方法等方面有一定创新B-利用R语后等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分4Ml大作业10%析基本到位C-利用R语百等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位D-利用R语言等现代数据分析工具建立研究对象的模型不正确,编写的程序不能给出模型的计算结果,解读分析不到位A-在解决数据科学领域实际问题时思维和计算无误B-在解决数据科学领域实际问题时思维和计算存在少量错误c-在解决数据科学领域实际问题时思维和计算存在一5M2平时作业10%定量错误D-在解决数据科学领域实际问题时思维和计算存在大量错误A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分析解读实验数据B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正确分析解6M2上机60%读实验数据C-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没有正确分析解读实验数据D-上机实验过程中不能完成实验要求,不能得到正确的实验结果A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分析非常到位,方法等方面有一定创新B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位7M2大作业20%C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位D-利用R语言等现代数据分析工具建立研究对象的模型不正确,编与的程序不能给出模型的计算结果,解读分析不到位8M210%(见试卷评分标准)期末考试A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确9M3平时作业10%C-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准确D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱10M350%A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分上机析解读实验数据B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正确分析解读实验数据c-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没有正确分析解读实验数据D-上机实验过程中不能完成实验要求,不能得到正确的实验结果A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分析非常到位,方法等方面有一定创新B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位11M3大作业30%C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位D-利用R语言等现代数据分析工具建立研究对象的模型不止确,编写的程序不能给出模型的计算结果,解读分析不到位12M310%期末考试(见试卷评分标准)A-独立思考、按时完成,书写图表规范,解题思路清晰、步骤完整、格式合理、答案准确B-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式合理、答案准确13M4平时作业10%C-独立思考、按时完成,书写图表比较规范,解题思路比较清晰、步骤比较完整、格式比较合理、答案准确D-作业抄袭,未能按时完成,书写图表不规范,解题思路混乱A-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述清楚,正确分析解读实验数据B-上机实验过程中认真完成实验要求,得到正确的实验结果,实验报告格式正确,步骤叙述比较清楚,正确分析解14M4上机70%读实验数据C-上机实验过程中认真完成实验要求,不能得到正确的实验结果,实验报告格式正确,步骤叙述清楚,没有正确分析解读实验数据D-上机实验过程中不能完成实验要求,不能得到正确的实验结果15M410%A-利用R语言等现代数据分析工具建立研究对象的模型正确,编写的程序能给出模型的计算结果,解读分大作业析非常到位,方法等方面有一定创新B-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位C-利用R语言等现代数据分析工具建立研究对象的模型基本正确,编写的程序基本能给出模型的计算结果,解读分析基本到位D-利用R语言等现代数据分析工具建立研究对象的模型不正确,编与的程序不能给出模型的计算结果,解读分析不到位16M410%期末考试(见试卷评分标准)A—全勤B-缺勤1次17M5考勤50%C-缺勤2-3次D-缺勤3次以上2缺勤3次及以上且很少参加课堂讨论A-精神状态饱满,回答问题准确B-精神状态良好,问题回答较好c-精神状态一般,问题回答一般18M5课堂表现50%D-精神状态较差,回答问题有误评分等级说明[A,B,C,D,E]=[90-100,80-89,70-79,60-69,0-59];[A,B,C,D]=[90-100,75-89,60-74,0-59];[A,B,C]=[90-100,75-89,60-74,0-59];[A,B]=[80-100,0-79]
六、教材与参考资料教学参考资料明细序号1图书1《数据分析与R软件》(第2版),李素兰,科学出版社,2017,ISBN:
9787030531582.(*主教材)2图书1《数据科学》,方匡南,电子工业出版社,
2018.,ISBN:
9787121342448.3图书1《数据科学导论一一R与Python实现》,吴喜之,高等教育出版社,2019,ISBN:
9787040525458.4图书1《应用回归及分类一一基于R》,吴喜之,中国人民大学出版社,2016,ISBN:
9787300222875.5图书1《大数据挖掘与统计机器学习》(第2版),吕晓玲,宋捷,中国人民大学出版社,2019,ISBN:
9787300264066.。