还剩15页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
英语口语教学实验效果评价摘要本文主要是对英语口语教学实验效果进行评价,我们将本题归为对大量数据分析整理的统计问题,采用曲线拟合模型、显著性分析、聚类、灰色关联等数学方法进行分析得到预期结果问题一本文根据题目所给出的数据首先作图观察成绩的趋势,然后采用曲线拟合的方法来建立合适的模型利用模型进行预测,根据预测图探讨需要经过未来几年英语成绩的发展趋势,通过分析得出结论在未来几年内,英语口语的平均分将在70分以下,所以本组认为如果要达到80分的目标,__很有必要问题二本文将评价O___效果显著性问题转换为实验前后的成绩对教学实验有无显著性差异的问题,若影响不显著则说明O___效果不显著,据此建立方差检验模型,构造一个Z检验统计量,通过假设检验来确定实验前与实验后的成绩存在显著性差异然后统计出成绩提高的人数并通过它们所占总人数的百分比得出结论OTM成效显著问题三首先根据11个院系实验前后四项成绩差值的平均值的偏差程度说明各系学习英语的氛围是否存在差异然后根据氛围的相对优劣程度分成两类,利用K均值聚类分析的方法得到处在同一水平下的院系的分类结果英语学习氛围相对高国贸、动科、机制、动医、水产、GIS英语学习氛围相对低计算机、植科、水族、林学、营销问题四我们将本题转换为分析不同班级、院系对OTM效果是否有影响本文采用有相互作用的双因素方差分析,将引起效果总的变异分解为两种因素引起的差异作出数量统计通过方差分析了解班级、院系及交互作用对测定结果的影响及影响的相对大小最后本文认为是否是实验班、不同的系别以及交互作用对成绩的影响都是不显著的,所以不论班级与院系的影响,O___效果还是显著的问题五本题要求阐述成绩与口语介绍、口语描述、口语讨论的水平关系我们采用灰色关联分析,求出参考数列与比较数列的灰色关__数ξ然后计算出介绍、描述、讨论与成绩之间的贴近程度的关联度通过比较各关联度的大小来判断其三者对英语成绩的影响程度,即认为是水平关系最后得到口语讨论、口语描述、口语介绍对口语总分成绩的水平关系的顺序如下口语描述口语讨论口语介绍关键词曲线拟合显著性分析K均值聚类双因素方差分析灰色关联分析
一、问题重述英语,一直是当代大学生学习生活的主题英语好,一切好!似乎已成定律我校是农业院校,英语基础不是很好,但是通过全体英语教师的共同努力,我校学生的英语水平取得较大进步,英语四级通过率不断攀升但是真正英语水平的提高,并不完全是英语四级通过率的提高,而是英语交流水平的提高,即口语的提高为此,我校外语教学研究者进行了近两年的口语教学实验,摸索出了一套完整的口语培训方法,简称OTM一天,就这种培训方法的效果,诸多英语老师和管理工__召开了一场教学研讨会第一问会上,就寻找适合我校学生口语教学方法必要性的论述中,主要研究者拿出了我校近十年来我校进行口语教学以来我校学生口语平均成绩,见数据包中的数据3她得出了一个数学模型,阐述了我校要达到口语平均成绩接近80分的长远规划就必须进行口语教学__请你帮她完整地叙述这个模型以及她得出的结论第二问会上,由管理者就OTM教学效果向研究者提出疑问研究者于是拿出文件夹数据1中的数据来进行论述请你帮她就口语介绍、口语描述、口语讨论、口语总分对O___效果进行论证第三问会上有人认为各个院系学习英语口的氛围存在差异,你是如何看待的?如果各院系学习口语氛围存在差异,那哪些院系口语氛围处在同一水平?第四问有专家提出,阐述OTM是否存在效果,不能简单地依靠数据1来说明为此,研究者又拿出文件夹数据2的数据,用实验班与对照班的平均成绩进行对比但由于院系、班级不一样,简单的平均对比引起众多人的质疑请你帮她解决这一问题第五问口语总分是单独测试的,其成绩应该与口语介绍、口语描述、口语讨论的水平有关系,请你详细阐述这种关系
2、问题分析
2.1问题一在问题一中,根据数据3中给出的近十年来的英语口语教学的学生平均成绩本组考虑首先作图观察成绩的趋势,然后利用曲线拟合的方法来建立合适的模型,利用模型进行预测,根据预测图探讨需要经过未来几年英语成绩的发展趋势,如果达到80分的年数较长就说明__很必要
2.2问题二在问题二中,需要通过数据1中口语介绍、口语描述、口语讨论、口语总分的数据对O___效果进行论证首先不考虑院系和班级的影响,仅将每位学生的四项成绩整理为实验前与试验后本题考虑根据Z检验判定实验前与实验后的两组数据的差异是否显著然后统计出口语介绍、口语描述、口语讨论、口语总分这四项中实验后成绩提高的人数,求出它们所占总人数的百分比,并且对结果作图,最后根据结果说明O___效果
2.3问题三在问题三中,要求分析各院系学习口语氛围是否存在差异,并且探讨哪些院系口语氛围处在同一水平由于学习英语口语的氛围与口语介绍、口语描述、口语讨论、口语总分有关首先对11个院系的数据进行处理,求出这11个院系实验前和实验后四项成绩差值的平均值,并且根据差值的偏差程度说明各系学习英语的氛围是否存在差异然后根据氛围的相对优劣程度分成两类,利用聚类分析来分析哪些院系处在同一水平
2.4问题四本题要求分析不同班级、院系对OTM效果是否有影响,分析效果之间是否存在差异首先我们对实验班和对照班的每个班级的成绩进行统计,并得出实验班和对照班的成绩差值考虑到不同院系以及班级之间也会有相互影响的可能,所以我们采用有相互作用的双因素方差分析,将引起试验总的变异分解为两种因素引起的差异作出数量统计通过方差分析可以了解两种因素及交互作用对测定结果的影响及影响的相对大小即可分析不同班级、院系对OTM效果是否有影响
2.5问题五本题要求阐述成绩与口语介绍、口语描述、口语讨论的水平关系我们运用灰色关联分析,首先确定反映系统行为特征的参考数列和影响系统行为的比较数列,求出参考数列与比较数列的灰色关__数ξ然后计算出介绍、描述、讨论与成绩之间的贴近程度的关联度通过比较各关联度的大小来判断其三者对英语成绩的影响程度,即认为是水平关系
3、问题假设
1、假设英语口语介绍、口语描述、口语讨论、口语总分这四项成绩的满分都是100分;
2、假设题目所给的数据真实可靠;
3、假设在问题二中院系和班级不影响结果;
4、假设只有口语介绍、口语描述、口语讨论、口语总分的成绩影响学习氛围
5、假定问题四中,不同院系以及班级的成绩是__的并且服从等方差的正态分布
4、符号说明英语口语平均分年份实验前学生英语成绩的平均值实验后学生英语成绩的平均值实验前学生英语成绩的标准差实验后学生英语成绩的标准差实验前学生样本容量实验后学生样本容量平均效应因素A的第i个水平水平的附加效应因素B的第j个水平的附加效应因素A的第i个水平和因素B的第j个水平相互作用的附加效应随机误差项分辨系数关__数关联序权重
5、模型建立与求解
5.1问题一本组将数据一的数据做一个散点图,然后确定模型的拟合函数散点图如下图5-1-1分析上图,我组认为此样本应该用逻辑斯蒂增长函数,我们将逻辑斯蒂增长函数函数初步看作通过对数据以及散点图的观察,得出当t=6时,平均增长速率最大所以我们初步对以上的数据进行拟合,得到结果如下回归的结果决定系数R方为
0.993,DW值为
1.338,将上模型求出的结果和原数据进行对比,如下图图5-1-2从上图看来,初步建立的模型是非常合理的,决定系数已经到了
0.99但是我组秉承着精益求精的精神,我们将进一步优化拟合,使模型达到更好的结果,进行多次试验后,得到最后模型如下上述模型回归结果的决定系数R方为
0.996,DW值为
2.170,此时我们认为拟合结果最佳,并且预测图如下图5-1-3从预测图上可以看到,在未来几年内,英语口语的平均分将在70分以下,距离80分的目标不可预估,所以本组认为如果要达到80分的目标,__很有必要
5.2问题二统计检验是先对总体的分布规律作出某种假说,然后根据样本提供的数据,通过统计运算,根据运算结果,对假说作出肯定或否定的决策Z检验法适用于大样本的两平均数之间差异显著性检验的方法它是通过计算两个平均数之间差的Z分数来与规定的理论Z值相比较,看是否大于规定的理论Z值,从而判定两平均数的差异是否显著的一种差异显著性检验方法由于问题二中样本数据大于30,所以对问题
(2)用Z检验来判定实验前与实验后每个学生的成绩差异是否显著总体标准差σ未知的正态分布资料,是用于两个平均值差异程度的检验方法它是用Z分布理论来推断差异发生的概率,从而判定实验前与实验后的两组数据的差异是否显著其一般步骤
(1)建立假设
(2)检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著其Z值计算公式为其中,是样本
1、样本2的平均数; ,是样本
1、样本2的标准差; ,是样本
1、样本2的容量
(3)比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断如下表示表5-2-1P值差异显著程度差异非常显著差异显著差异不显著
(4)第四步,根据是以上分析,结合具体情况,作出结论运用SPSS软件进行求解,得到结果如下表所示表5-2-2双侧检验水准口语介绍口语描述口语讨论口语总分方差方程的levene检验
0.
0280.8__
00.588均值方程的t检验00000000是否具有显著性差异是是是是由上表分析可得,因为口语介绍、口语描述、口语讨论、口语总分的P值均小于
0.05,所以可以说明实验前与实验后的成绩存在显著差异将上面差异性数据进行进一步的分析,我们将实验前成绩减去实验后的成绩,根据增长值的正负来判断成绩的增加与减少最后求出成绩增加占总人数的百分率,来说明O___效果,结果如下表所示表5-2-3提高的人数总人数百分率口语介绍60372184%口语描述62172586%口语讨论639720__%口语总分633715__%通过对上表数据的分析,本校采用了OTM后,四项成绩均提高了百分八十以上,说明OTM是有一定的效果的我们用四项成绩均值的雷达图来更直观地展现O___显著成效图5-2-1图5-2-2图5-2-3图5-2-
45.3问题三学习英语口语的氛围与口语介绍、口语描述、口语讨论、口语总分有关为了研究各院系学习英语口语的氛围,我们需要对11个院系的数据进行处理,求出这11个院系实验前和实验后四项成绩差值的平均值,得到各个院系的四项成绩的差值结果如下表表5-3-1分院口语介绍口语描述口语讨论口语总分植科
9.
065.
726.
227.07林学
2.
293.
984.
981.__机制
3.
153.
514.
884.64动医
5.
839.
469.
877.96动科
5.
4010.
8411.
839.42水产
6.
987.
0714.
149.04GIS
9.
1910.
0515.
0310.52机制
8.
4214.
2714.
6110.41国贸
6.
7712.
5521.
3911.99营销
1.
933.
375.
053.79计算机
4.
234.
824.
8819.52水族
3.
644.
046.
323.87根据上表的结果可以看出;实验前和实验后的差值偏差比较大,说明各系学习英语的氛围存在差异,本文利用聚类分析来求解哪些院系处在同一水平快速聚类法又称K均值法,其基本思想是先给出一个粗略的分类,然后根据某种原则判断分类是否合理,如果不合理就用某种原则进行修改,知道分类结果比较合理为止根据问题分析,本文将所有的样本分成两类,即学习氛围的相对优与劣,在每类选择一个有代表性的样品作为凝聚点选出凝聚点之后对数据进行聚类,聚类步骤如下
(1)定义样品间距离,假设2个凝聚点的__是用每个样品以最靠近的凝聚点归类的原则实现初始分类,即这样将样品分为k个不相交的类,得到初始分类,记为
(2)从出发,计算新的类重心__其中,是类的重心其中是类中的样品数,从出发将样品作为新的分类,记得到分类
(3)设第m步得到分类是类的重心,不一定是样品,也不一定是的重心但当m逐渐增大时,分类趋于稳定此时,就会近似为的重心从而有,算法即可结束利用R软件进行聚类,结果如下图5-3-1通过上图可以很直观地看出这11个院系学习英语氛围的聚类情况可以分为两大类国贸、动科、机制、动医、水产、GIS,即这6个院系的英语学习氛围相当;计算机、植科、水族、林学、营销这5个院系的英语学习氛围相当并且从数据上分析,认为国贸、动科、机制、动医、水产、GIS这6个院系的英语学习氛围比计算机、植科、水族、林学、营销这5个院系的英语学习氛围要好
5.4问题四双因素方差分析基本原理一般试验得到的数据,由于受到各种因素的影响,它们之间存在差异,这种差异既可能是由于随机因素引起的,也可能是试验条件的改变引起的方差分析是将引起试验总的变异分解为各种因素引起的差异作出数量统计因此,通过方差分析可以了解每个因素对测定结果的影响及各因素影响相对大小,从而为优选提供科学依据考虑到不同院系以及班级之间也会有相互影响的可能,所以我们采用有相互作用的双因素方差分析,因此建立数学模型,且相互__;其中表示平均的效应,分别表示因素A的第i个水平和因素B的第j个水平的附加效应,表示因素A的第i个水平和因素B的第j个水平相互作用的附加效应,为随机误差项,这里也假定它们是__的并且服从等方差的正态分布并且引进以下统计量总平均值因素A平方和因素B平方和交互作用平方和误差平方和总离差和可以证明构造检验统计量在成立时,检验统计量在成立时,检验统计量对于给定的显著性水平,的拒绝域为的拒绝域为因此构造方差分析表如下表5-4-1来源自由度平方和平均平方和F统计量P值因素A因素BA*B随机误差根据上表的信息,就可以对各个因素间交互作用是否显著和每个因素各水平间的差异是否显著做出判断根据题意,提出假设通过R软件计算得出下表表5-4-2求和Sq均值SqF值p值实验班与否
370370.
30.
3560.551系别
20691034.
60.
9950.371交互作用
31051552.
71.
4930.226根据上表,可以看出,P值均大于
0.05,因此认为是否是实验班、不同的系别以及交互作用对成绩的影响都是不显著的,所以不论班级与院系O___效果还是显著的
5.5问题五利用灰色关联分析进行综合评价的步骤是:
(1)根据评价目的确定评价指标体系收集评价数据设数据序列形成如下矩阵:其中n为指标总数m为样本区间其中
(2)确定参考数据列参考数据列应该是一个理想的比较标准可以以各指标的最优值或最劣值构成参考数据列也可根据评价目的选择其它参照值,记作
(3)逐个计算每个被评价对象指标序列比较序列与参考序列对应元素的绝对差值即
(4)确定并计算其值,
(5)计算关__数由下式分别计算每个比较序列与参考序列对应元素的关__数式中为分辨系数,在01内取值,若越小,关__数间差异越大,区分能力越强,通常取
0.5如果为最优值数据列越大,越好,若为最劣值数据列,越大,越不好
(6)计算关联序对各评价对象分别计算其个指标与参考序列对应元素的关__数的均值以反映各评价对象与参考序列的关联关系并称其为关联序记为:模型求解对数据进行初步整理后,将没有成绩和缺失成绩的学生剔除,构成应该成绩矩阵,如下将上两个数据矩阵串联在一起,合成最终矩阵X,如下利用__tlab编程计算,得到相应的关联度,并通过关联度换算成权重最后得到结果如下表所示表5-5-1口语讨论口语描述口语介绍关联度
0.
91250.
91570.9052权重
0.
3330.
3350.332由以上结果可知口语讨论、口语描述、口语介绍对口语总分成绩的水平关系的顺序如下口语描述口语讨论口语介绍
6、模型评价和__本题中我们采用了较多的模型来求解各个问题,其中包含了逻辑增长曲线模型、也包含了灰度关联分析法,以及方差分析、聚类的数学分析方法,其中在第二问中,把实验前后的成绩差异显著性分析转化为组别这一因素对OTM成效影响的显著性过程中,对显著性分析的巧妙转化应用是处理问题的关键灰度关联法这一方法也可以广泛应用到多个变量对某一因变量有影响的数学问题中只要给出了一段有相关性的序列数据就可以通过这一方法求出各变量与因变量的相关系数,并能通过优势因素分析找到影响因变量的关键变量,并确定变量对因变量影响的重要程度排名问题五中,我们将研究成绩与口语介绍、口语描述、口语讨论的水平关系这一问题,抛开方程模型的常规思想,大胆尝试通过灰色关联分析来确定各个指标的关__数,来确定水平关系,可以将此评分方法应用到诸多含多个指标的数学问题评分当中去同时在模型的求解中,我们采用多种软件进行编程求解,一定程度上巩固了结果的正确性当然在诸多模型中难免出现一些不足之处,如在问题一的回归模型中,模型缺少理论的支撑,这在一定程度上影响了模型的__,或则说在某一些数学问题的研究中由于这一限制条件的纯在必然导致结果纯在一定的偏差,此时如何最大程度减少误差应是问题处理的关键,而本题中我们过度地__了指标的__,而缺少了误差的分析,可能会对题目的求解结果有一定的影响
7、____【1】陈东彦,李冬梅,王树忠,数学建模,北京科学出版社,
2007.【2】林君,陈翰林,数学建模教程,北京科学出版社,
2011.附录。