还剩5页未读,继续阅读
文本内容:
计【教师】多媒体出示了agg函数的一般格式详见教材,并详细讲解各部分表示的内容DataFrame.aggfuncaxis=O其中,func表示汇总数据的函数,可以为单个函数或函数列表;axis表示函数作用轴的方向,取0或index表示将函数应用到列,取I或columns表示将函数应用到行,默认为0此处需要注意的是,func既可以是Pandas中的内置函数,也可以是自定义函数并且,这些函数既可以应用到每一列或行也可以将多个函数应用到同一列或行还可以将不同函数应用到不同的列或行十【教师】按照教材步骤逐步分析并进行演示例3-9详见教材的程序编写步骤importnumpyasnpimportpandasaspdarr=np.random.randint
1.
20.size=33df=pd.DataFramearr.columns=[abc]priniC原始数据\ndfprint每列求和聚合\n\df.aggsumprim每列同时求和及平均值聚合\n\df.agg[summean]defrangarr:#定义函数求极差,即最大值和最小值的差returnarr.max-arr.minpriniC各行分别求和、平均值和极差聚合\n.df.agg{0:sum1:mean2:rangaxis=l详见教材小【学生】观察、记录、理解»【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果详见教材小【教师】巡视课堂记录,对学生进行个别指导
3.
3.2数据的分组>【教师】多媒体出示了groupby函数的一般格式详见教材,并详细讲解各部分表示的内容DataErame.groupbyby=Noneaxis=0sorl=True其中,by表示分组条件,通常取列标签或字典;axis表示分组轴的方向,取0或index表示按行分组,取1或columns”表示按列分组,默认为0;sort表示是否对分组标签进行排序,如果为True则排序否则不排序,默认为True.如果by为列标签,则将该列中雌相同的行分为一组;如果by为字典则将设置为相同分组标签的列分为一组,此时axis应设置为1该函数返回一个DataFrameGroupBy对象,它是一个可迭代的对象,可以通过循环语句查看每一组的数据,还可以根据分组标签通过gecgroupO函数获取对应组的蝇〉【教师】按照教材步骤逐步分析并进行演示例3-10详见教材的程序编写步骤importpandasaspdpd.setop【iondisplay.unicode.easiasianwidlhTrue课题第10课数据的聚合与分组课时2课时90min教学目标知识技能目标
(1)掌握数据聚合的方法
(2)掌握数据分组的方法
(3)掌握字符型数据编码和连续数据离散化的方法
(3)能对数据进行聚合与分组、编码与离散化等预处理操作素质目标强化身体健康安全意识,敬畏生命、珍惜生命教学重难点教学重点字符型数据编码和连续数据离散化的方法教学难点对数据进行聚合与分组、编码与离散化等预处理操作教学方法案例分析法、问答法、讨论法、讲授法教学用具电脑、投影仪、多媒体课件、教材、APP敕学设计第1节课考勤(2min)一问题导入(5min)一传授新知(28min)一课堂讨论(10min)第2节课问题导入(8min)一传授新知(20min)一课堂讨论(12min)一课堂小结(3min)一作业布置(2min)教学过程主要教学内容及步骤设计意图第一节课考勤2min【教师】使用APP进行签到【学生】按照老师要求签到培养学生的组织纪律性,掌握学生的出勤情况问题导入(5min)【教师】提出问题在进行数据分析之前要进行数据清洗,除了查找缺失值和重复值,数据清洗还需要进行哪些操作?【学生】思考、举手回答通过提问的方法,了解学生对上节课知识的掌握程度,进而引出新知传授新知(28min)【教师】总结学生的回答,并引入新知讲解数据合并的相关知识
3.
3.1数据的聚合>【教师】请同学们扫描二维码学习数据的聚合与分组,并回答以下问期怎么理解数据的聚合和分组?小【学生】扫描二维码、思考、回答问题+【教师】总结学生的回答,并浴解新知数据的聚合和分组是数据分析中比较常见的操作,聚合是指对数据执行某些汇总操作,如求和、求平均值等;分组是指根据特定的条件将原数据划分为多个组Pandas提供了agg()函数,用于数据的聚合通过教师讲解、课堂讨论、多媒体df=pd.DaiaFramc{班级:[一班丁一班‘一班二班丁二班二班姓名‘r刘武.王振丁赵胜丁赵霞,方芳丁齐婷1语文
[8510296126130135]数学:
[10090124123140109]英语
[8311012310313590]print原始数据\n\dfgroup1=df.groupby班级priniC以班级列按行分组foriingroup1:#循环输出分组结果printi详见教材小【学生】观察、记录、理解»【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果详见教材»【教师】巡视课堂记录,对学生进行个别指导【学生】聆听、思考、理解、记忆课堂实践iomin【教师】提出以下问题让学生迸行实践练习.原始数据班级姓名语文数学英语一班丁浩8510083一班王皓10290110一班于颖96124123一班张名126123103一班宋媛130140135一班孙好13510990二班马文12412383二班邵曼123103110二班王美
119135123.问题描述请按照班级对数据的分组,并按行聚合总成绩【学生】聆听、思考、讨论【教师】总结学生的回答通过课堂实践,加深学生对数据聚合与分组的理解第二节课问题导入8min【教师】提出问题我们已经学习了数据分组聚合的相关知识,那么数据的转换应该如何处理呢?通过提问的方法,引导学生主动思考,激发学生的学习兴趣【学生】聆听、思考、回答问题传授新知20min【教师】总结学生的回答,并引入新知,讲解数蟒专换的相关知识A【教师】请同学们扫描二维码学习数据和的转换,并回答以下问题怎么理解数据的转换?小【学生】扫描二维码、思考、回答问题小【教师】总结学生的回答,并讲解新知根据数据的取值,可以将数据分为字符型和数值型两大类在数据分析中,通常无法对字符型数据进行直接处理,因此需要将字符型数据转换为数值型数据此外,连续的数值型数据也常常需要离散化处理字符型数据的编码计【教师】提出问题什么是字符型数据?>【学生】观察、记录、理解、分析、回答问题小【教师】总结学生的回答,并对程序进行分析字符型数据的编码是指将字符型数据通过编码转换为数值型数据小【教师】多媒体出示了get_dummies函数的一般格式详见教材,并详细讲解各部分表示的内容Pandas提供了gct_dinnmics由数,用于字符型数据的编码,其一般格式如下.pandas.gct_dummicsdataprcfix=Noncprcfix_scp=_\columns=Noncdlypc=Nonc1data表示需要编码的数据,可以为数组、Series对象或DataFrame对象2prefix表示进行编码处理后列标签的附加前缀,默认为列索引或标签3prefix_sep表示附加前缀连接符,默认为4columns表示要编码列的标签,为列表,默认为None表示对所有列进行编码.该函数返回一个DataFrame对象♦【教师】按照教材步骤逐步分析并进行演示例3-H详见教材的程序编写步骤importpandasaspdpci.set_optiondisplay.unicode.east_asian_width.Truedf=pd.DalaFrame{职业,:[教师丁司机「编辑1城市[北京青岛武汉]}print原始数据\n\dfprinl编码后的数据\n»pd.gct_dummiesdfprint股置附加前缀指定列编码后的数据\npd.get_dummiesdfprefix居住地prefix_sep=-cokimns=「城市[详见教材小【学生】观察、记录、理解通过教师讲解和课堂讨论,使学生了解数据预处理的相关知识包括字符型数据的编码及连续数据的离散化十【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作并对比程序运行结果详见教材♦【教师】巡视课堂记录,对学生进行个别指导字符型数据的编码是指将字符型数据标记为1或0即将指定列的标签和数据组合成新列的标签,并在该列中将数据所在行标记为I其余行标记为0例如,编码职业列中第一行的数据教师,即生成标签为“职业_教师的列,并标记该列第一行为1其他行为
03.
4.2连续数据的离散化+【教师】多媒体出示了cut函数的一般格式详见教材,并详细讲解各部分表示的内容连续数据的离散化是指将数据划分为几个分段区间Pandas提供了cut函数用于连续数据的离散化,其一股格式如下pandas.cutxbinsrighl=Truclabcls=Nonerctbins=Falseprecision=3include_lo\vest=False1x表示需要离散化的一维序列2bins可以是整数或序列,如果是整数,表示x的范围内等差分段区间的数量;如果是序列,表示将数据划分为序列元素组成的分段区间,如果元素不在序列中,则为NaN.例如,bins=[05JO
15.20]表示05]、510]、1015]、1520]四个分段区间.3right表示是否包含区间的右端点,默认为True.4labels表示每个分段的标签.5retbins表示是否返回bins6precision表示分段端点的精确度7includeJowest表示是否包含区间的左端点,默认为False.按照教材步骤逐步分析并进行演示例3-12详见教材的程序编写步骤importnumpyasnpimportpandasaspdarr=np.random.randinli1005printC一维原始数据\ii.arrprinl1等差分段离散化数据\npd.cutarrbins=5print自定义分段离散化数据:\n\pd.cutarrbins=
[020406080100]prints自定义分段离散化数据,并设置分段标签\n;pd.cutarrbins=
[020406080100]labels=[0+20+40+60+80+]详见教材【学生】观察、记录、理解中【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果详见教材小【教师】巡视课堂记录,对学生进行个别指导十【教师】按照教材步骤逐步分析并进行演示例3/3详见教材的程序编写步骤体质指数BMI的计算公式为,其中体重的单位为kg身高的单位为n如果BMI小于
18.5则为“消瘦,处于
18.5含〜24则为“正常”,处于24含〜28则为“超重,28含以上则为“肥胖”首先导入学生信息,计算体质指数,并将其添加到列末;然后离散化体质指数歹1」,根据上述标准划分区间,并设置相应的标签;最后对性别列进行编码,并设置附加前缀及其连接符为空pd.set_optiondisplay.unicode.east_asian_\vidthTruedf=|xl.read_csvstudent_info.csvindex_col=0encoding=GBKprime原始数据\n\dDdT体质指数1=dfT体重kg]/dff身高m1»*2dff健康状况]=pdcutdfT体质指数1bins=[O
18.5242850]right=Falseinclude」owest=Truclabels=「消瘦丁正常,超重•,肥胖]prime计算并离散化体质指数后的数据\n\dfprini对性别进行编码,并设置附加前缀及其连接符为空的数据\npd.gcl_dunimiesdfprefix-prcfix_scp=columns=「性别]详磁材沙【学生】观察、记录、理解计【学生】教师演示完成后,学生按照教材提示和教师演示进行实际操作,并对比程序运行结果详见教材十【教师】巡视课堂记录,对学生进行个别指导【提示】教师讲解体制指数的划分»【学生】聆听、思考课堂讨论12min【教师】讲解“旗帜引领”部分内容,并提出问题,请同学们分小组讨论什么是全民健身日?你有什么启示?【学生】聆听、结组、思考、讨论、写代码、展示程序代码及运行结果【教师】聆听学生的回答通过课堂讨论,使学生能够了解更多关于全民健身日的知识课堂小结3min【教师】简要总结本节课的要点本节课学习了数据的预处理相关知识,包括数据的聚合与分组,数据的专函等相关内容,希望大家在课下多加练习,巩固所学知识【学生】总结回顾知识点总结知识点讥固学生对相关知识的印象作业布置2min【教师】布置课后作业1完成课后本章考核3”的习题.2预习时间信息的转换与提取【学生】完成课后任务通过课后作业复习巩固学到的知识,提高理论接收能力教学反思本节课效果不错,学生积极参与到教学活动中数学活动,它是数学活动的核心动力,是一种积极的思维活动和探索行为,是同化,是探索,是发现,是再创造。