还剩4页未读,继续阅读
文本内容:
数据分析课程教学大纲DataAnalysis学时数32其中实训学时12课外学时学分数2适用专业信息与计算科学
一、课程的性质、目的和任务本课程为信息与计算科学专业的专业课,其目的和任务是通过本课程的学习,能够掌握数据分析的基本理论知识与方法,熟悉数据处理领域权威的数据分析软件SAS系统,了解数据分析的实际分析过程,具备应用数据分析软件解决实际问题的能力,并能够进行数据分析SAS系统应用程序的编程及计算使学生为信息与计算科学专业的后续课程的学习作好充分的准备通过本课程的学习,要使学生获得以下知识.数据描述性分析;.线性回归分析;.主成分分析与典型相关分析;.判别分析;.聚类分析;.Bayes统计分析;.常用数据分析方法的SAS过程简介
二、课程教学的基本要求(-)数据描述性分析.了解一维数据的数字特征.掌握数据的分布.掌握多维数据的数字特征与相关分析
(二)线性回归分析.掌握线性回归模型及其参数估计.掌握统计推断与预测.理解残差分析的方法.了解回归方程的选取
(三)主成分分析与典型相关分析.掌握总体主成分方法.掌握样本主成分方法.了解典型相关分析
(四)判别分析.掌握距离判别方法.了解Bayes判别方法
(五)聚类分析.了解距离与相似系数.掌握谱系聚类法.掌握快速聚类法
(六)bayes统计分析了解Bayes统计模型了解Bayes统计推断
(七)常用数据分析方法的SAS过程简介.了解SAS系统.掌握几种描述性统计分析的SAS过程.掌握线性回归分析的SAS过程.掌握主成分分析的SAS过程.掌握判别分析的SAS过程.掌握聚类分析的SAS过程
三、课程的教学内容、重点和难点第一章数据描述性分析
一、一维数据的数字特征
(一)均值、方差等基本知识,中位数、分位数、三均值与极差;
(二)表示位置的数字特征、分散性的数字特征、分布形状的数字特征;
二、数据的分布(-)直方图、经验分布函数与QQ图,径叶图;
(二)数据的分布拟合检验与正态性检验;
三、多元数据的数字特征与相关分析简介
(一)多元数据的数字特征与相关系数、相关矩阵重点数据的数字特征;难点各种数据的分布图第二章回归分析
一、线性回归模型及其参数估计
(一)线性回归模型及其矩阵表示;
(二)参数估计极其性质;
二、统计推断与预测(-)回归方程的显著性检验;
(二)回归系数的统计推断;
(三)预测及其统计推断;
(四)与回归系数有关的假设检验的一般方法;
三、残差分析(-)误差项的正态性检验(两类残差正态性检验);
(二)残差图分析(3种残差图);
四、回归方程的选取
(一)穷举法;
(二)逐步回归法重点线性回归模型,回归方程的显著性检验,残差分析;难点参数估计极其性质,回归系数的统计推断,误差项的正态性检验第三章」主成分分析与典型相关分析
一、总体主成分分析
(一)总体主成分定义、性质和求解方法;
(二)标准化变量的主成分;
二、样本主成分分析
(一)定义、求解方法;
三、典型相关分析(-)总体典型相关分析;
(二)样本典型相关分析重点主成分分析的定义和性质;难点主成分分析的求解方法,典型相关分析的方法第四章判别分析
一、距离判别(-)距离判别的基本思想及意义;
(二)两个总体及多个总体的距离判别准则;
二、Bayes判别:
(一)Bayes判别的基本思想;
(二)两个总体及多个总体的Bayes判别准则重点距离判别和Bayes判别的基本思想;难点距离判别和Bayes判别判别准则第五章聚类分析
一、谱系聚类法
(一)谱系聚类法基本思想、距离的定义;
(二)Q型聚类和R型聚类的0统计量、聚类的步骤及聚类图;
二、快速聚类法
(一)快速聚类法的定义、步骤重点谱系聚类法和快速聚类法的定义、步骤;难点谱系聚类法和快速聚类法的定义、步骤及聚类图做法及解读第六章Bayes统计分析
一、Bayes统计模型(-)Bayes统计思想、模型和原则
二、Bayes统计推断
(一)Bayes的区间估计与假设检验重点Bayes统计思想、模型,Bayes的区间估计与假设检验;难点Bayes统计思想、模型和原则,Bayes的区间估计与假设检验第七章常用数据分析方法的SAS过程简介
一、SAS系统简介
(一)数据的输入和输出;
(二)数据集的建立;
(三)数学运算符号与函数;
(四)逻辑语句与循环语句;
二、常用数据分析方法的SAS过程(-)几种描述性统计分析的SAS过程
(二)线性回归分析的SAS过程
(三)主成分分析与典型相关分析的SAS过程
(四)判别分析的SAS过程
(五)聚类分析的SAS过程重点常用数据分析方法的SAS过程;难点常用数据分析方法的SAS过程
四、课程各教学环节要求
(一)本课程共安排32课时,其中上机实践12课时
(二)本课程作业共布置22题,通过作业的练习,是学生达到巩固知识,消化内容的目的,具体题量分布见下表
(三)本课程采用上机考试形式,其中90%为基本内容,其余为提高题,重点考察学生对本课程内容的掌握程度、利用SAS软件的编程能力,以及对运算结果的实际解释
五、学时分配
六、课程与其它课程的联系该门课程是信息与计算科学本科专业的专业必修课程通过本课程的学习,使学生掌握数据分析基本理论知识与方法,熟悉SAS程序设计的基本过程,同时为后续课程的学习打下一个良好基础
七、教材与教学参考书
(一)教材范金城,梅长林编数据分析方法.北京高等教育出版社,2006年.(-)教学参考书
[1]施锡铃等.数据分析方法.上海上海财经大学出版社,1997年
[2]孙文爽等.多元统计分析.高等教育出版社,1994年
[3]王吉利等.SAS软件与应用统计北京中国统计出版社,2000年教学内容各教学环节学时分配作业题量备注节主要内容讲授实验讨论习题课外其它小计*数据描述性分析4265线性回归分析4265—•主成分分析与典型相关分析2244四判别分析4264五聚类分析4264八Bayes统计分析22七常用数据分析方法的SAS过程简介22合计20123222。