《大数据及其作用与价值》
基本信息
学科 信息技术 实施年级 高一
学校 主备人
课程标准模块 必修1:数据与计算
使用教材 华东师范大学出版社《高中信息科技(第一册)》
单元名称 数据与大数据
单元课时 9课时(第9课时)
教学设计
第9课时 数据、信息与知识
1.课时教材分析 本节课是第一章“数据与大数据”中第三节“大数据及其作用与价值”中的教学内容。从第一节到第三节,从数据上升为大数据,项目任务也从选购电子图书、制作电子图书,过渡到推荐电子图书。
2.课时学情分析 高一年级学生经常通过手机和电脑使用互联网应用,通过新闻知道“大数据”,觉得自己很熟悉大数据,但是对于大数据的了解是片面的,理解也只是停留在表面和感性的认识。通过前2节教材的学习,他们对于数据的含义、数据与信息、知识的关系有了更深入的理解。但是在下面这些方面的理解不深刻:大数据的特征,数据的价值如何在应用中体现。
3.课时学习目标 在完成任务(上海图书馆图书推荐)的过程中, (1)观察上海图书馆电子网站和其它网络应用所提供的数据信息,讨论并总结大数据的特征。(信息意识) (2)阅读两种常用推荐算法的概念,为图书推荐选择合适的推荐算法,然后结合数据的采集判断自己的选择是否正确。(信息意识,计算思维) 通过权值表的设置、相似表的填写、相似度的计算,初步理解推荐算法的实现机制。能根据自己计算所得的图书推荐结果,正确推理权重的分配、相似表的填写与推荐结果的关系(计算思维)。
4.课时教学思想 图书推荐项目活动贯穿整课,通过有组织的问题链完整呈现数据采集、数据预处理、数据分析与应用的大数据处理过程。
5.课时教学重点 理解大数据的4个特征,了解两个常用推荐算法的区别,体验基于物品的推荐算法的应用。
6.课时教学难点 基于物品的推荐算法中:权值表中权重的分配、相似表的填写对推荐结果的影响。
7.课时教学策略与工具 1. 问卷星收集学生手工推荐的结果,在解决用电脑推荐电子图书的问题前让学生知道推荐的预期结果。 2. 将复杂推荐算法的核心部分抽出来,将实际问题简化为从4本书中推荐2本书,方便学生可以通过手工计算的方式体验推荐算法的内部实现机制,体会算法的不同部分对推荐结果的影响,达到对算法的深入理解,而不是浅尝辄止。 授课条件:机房环境(极域教学软件,演示文稿,实物投影台或希沃电子屏)
8.教学过程
教学环节 学生活动 教师活动 设计意图 备注
项目活动引入 学生完成问卷。 为上海图书馆官网的用户推荐图书。 通过问卷为用户手工推荐10本图书。 老师展示学生问卷的统计结果。 通过项目活动引入,激发学习兴趣,让学生快速进入学习状态。 3分钟
新知一:大数据特征之规模与速度征 预设学生回答:是或不是,没有统一标准。 学生讨论回答:查询速度快 老师提问:现实问题不是10本书,而是5600万本书,引出关键问题。 关键问题1:上海图书馆的数据是不是大数据? 大数据的特征之一:规模大。 大数据在速度方面的特征除了产生速度快,根据图片你觉得还有什么快? 通过项目过渡到关键问题1,引出大数据的特征。但是只讲解相关的2个特征,剩余2个特征在最后讲解。 3分钟 板书:大数据的特征,规模大,处理速度快
新知二:推荐算法 学生预设回答:“用户”或“物品”,并给出自己的理由。 大数据的处理速度快,意味着图书推荐速度也要快,所以不能手工推荐,而要为计算机设计推荐算法。然后讲授2种常用推荐算法。 关键问题2:你选择基于用户的还是基于物品的推荐算法?为什么? 学生选择哪个算法都可以,老师对两个算法所需数据进行讲解,最后引导学生得出结论: 虽然都可以使用,但由于数据隐私的问题,图书推荐最好使用基于物品的算法。 先提出问题,再详细解答,更能让学生主动对比两个算法。 关键问题2为后续项目实践选定推荐算法。 5分钟 板书: 推荐算法,基于用户,基于物品
新知三:大数据处理的步骤 认真倾听 介绍大数据处理的4个步骤。 采集上海图书馆的数据。 教师讲解指标ISBN。 项目实践的第一步 5分钟
任务一:数据预处理 学生找出并完成学习单。 教师指出第一个数据问题:数据缺失。 数据重复和数据错误的地方在哪里? 现实生活中经常会出现这些数据问题,学生应具备这方面的辨识能力。 3分钟
任务二:相似表与权值表 关键问题3的预设学生回答:第一本和第2本。 学生完成学习单中相似表的填写。 学生完成学习单中权值表的填写。 关键问题3:如果你是用户,你觉得这4本书中,你最可能喜欢的是哪本或哪2本?为什么? 两本书的相似表填写,教师自己填写一部分,关键问题4:在“图书名称”这个指标中,你觉得应该填1还是0?为什么? 预设追问:指标“索书号”,计算机只需要比较是否相等就可以得出1或0,计算机要如何计算,才能在指标“图书名称”中得出1或0呢? 根据相似表的计算结果可得出每行1的个数,如果以此作为相似度,你觉得用户对推荐的满意度会如何? 哪些指标对相似度最重要?依据指标对相似度的贡献,你打算如何分配权重?请学生完成权值表。 关键问题3非常关键。如果推荐算法算出来的结果跟用户预期不一致,那么就需要调整推荐算法了。 权值表是推荐算法的要素之一。 关键问题4的答案相对开放,填1更好。引导学生采用计算机可以处理的方式界定问题。 相似表是推荐算法的要素之一。 8分钟
任务三:相似度计算 学生完成学习单中相似度的计算。 同时完成教师问卷调查中的权重排序。 教师演示1本书的相似度计算。 使用实物展台展示3个学生的推荐结果,教师分析跟用户预期不一致的原因,请学生尝试解释? 展示学生所完成的权值排序问卷的统计结果,布置拓展任务1,请学生课后完成。 重点培养学生的计算思维。分析推荐算法的要素:权值表和相似表对推荐结果的影响。思考如何改进才能优化算法。 8分钟
新知四:大数据特征之价值与类型 学生讨论回答:多。不多。 布置拓展任务2,引出大数据特征之价值。 提问:5600万本图书中跟 朱自清的书“《唐诗三百首》指导大概”不相似的图书多吗? 有相似点的图书多吗? 通过让学生看图,总结大数据在类型方面的特征,完成学习单对应内容。 从简化后的项目活动过渡到实际图书推荐遇到的大数据问题,继续启发讲解大数据的剩余特征。 3分钟。 板书:价值密度低,类型多
小结 大数据的特征,推荐算法的选择,项目实践之推荐算法主要步骤,大数据的作用 2分钟
课后作业 完成拓展任务1和2,体验上海图书馆官网刚刚上线的图书推荐功能。
9.课时预期效果
学生通过手工推荐和学习计算机使用的推荐算法,学会用计算机可以处理的方式界定问题。知道计算机常用的2种推荐算法,知道不同场景应该选用哪种的推荐算法(信息意识)。对基于物品的推荐算法有深入的理解,能通过修改权值表来优化推荐结果(计算思维)。