5.1 走近数据分析 教案(2课时)

文档属性

名称 5.1 走近数据分析 教案(2课时)
格式 zip
文件大小 62.1KB
资源类型 教案
版本资源 教科版(2019)
科目 信息技术(信息科技)
更新时间 2020-11-23 15:47:13

文档简介

第二课时
任务二体验实时公交
活动1我在哪里
假如来到一个陌生的地方,需要知道自己所处的具体位置,手机里的地图软件可以很方便地帮助你定位、计算并推荐去目的地的路线。
打开地图软件,屏幕上的蓝色标记就是使用者所处的位置,如图5.1.4所示。
很多地图软件还提供了“全景”模式。选择“查看全景”可以展示实地拍摄的“全景”照片,如图5.1.5所示。在照片上滑动手指,可以多角度查看场景。点击移动方向箭头,场景则根据位置改变。
让我们估算一下全景模式下照片数据的“体量”?。根据全景照片的拍摄规则,一个拍摄点需要多角度拍摄数张照片进行拼接。如果一个拍摄点需要拍摄8张照片,每张照片的大小约为4MB,1个拍摄点的照片数据量是多少?考虑到地图的连续性,如果相邻拍摄点间隔为16米,那么一条长1千米的街道需要多少张照片?数据量是多少?如果是一个城市呢?
大数据
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
大数据的“大”是一个相对概念,没有具体标准,如果一定要定一个标准,那么10TB~?100TB通常称为大数据的门槛。实际应用中,很多企业级用户把多个数据集放在-?-起,已经形成了PB级的数据量。而且随着数据来源的多样化,数据的类型也更加复杂,如网络日志、音频、视频、图片和地理位置信息等。大数据的意义在于,我们有可能从如此庞杂的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。
活动2公交车距离我多远
在地图软件中输入起点和终点,点击搜索按钮就可以获得所需的公交方案。但是在公交站台等车,久等不来总令人焦急。实时公交信息查询软件则可以实时反馈公交车辆的运行信息,提升乘客的出行效率,如图5.1.6所示。
大数据分析的应用
面对海量的数据,为了搜索、处理、分析、归纳和总结其深层次的规律,大数据分析应运而生。大数据分析是指对规模巨大的数据进行分析。它的应用日益丰富,例如实时公交系统根据用户当前位置,迅速定位最近的公交站点,查找系统中公交车辆的位置数据,选出经过该站点所有线路车辆的即将到站信息,使用户可以直观地在手机上查看车辆实时位置。用户和车辆的位置信息通常通过卫星定位系统、Wi-Fi热点和基站的位置确定。
例子
下载一款实时公交信息查询软件,使用后填写表5.1.2,感受大数据分析在支持实时公交方面的应用。
大数据分析带来价值的同时,也在隐私保护、安全问题等方面带来危机。因此,合理、健康地使用大数据,遵循“?数据道德”是我们的必备品质。
拓展
1.调查分析:根据数据分析提出合理化建议。
某市第-期建设了46个公共自行车站点,主要布局在居民生活工作区、公交车站附近等地。1240个锁车柱已经全部建成,1000辆?自行车也已经配备到位。在使用一段时间之后,相关管理部门对公共自行车使用数据进行采集(数据表见教科书配套资源中的“某市公共自行车-?-月份运营数据.xIs"?),同时对使用者进行访谈。受访者均表达了公共自行车方便了自己的出行,但也提出了很多问题,如自行车损坏严重、借不到车,以及还车桩满等问题。
请阅读整理相关文字和表格数据资料;对资料进行分析,发现该市公共自行车使用中存在的问题,为二期工程建设提出合理化建议,完成《某市公共自行车使用情况调查分析报告》。
2.案例分析:根据大数据发现人们的出行规律。
在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名扒手在地铁交通系统上被抓,490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通?数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。
【拓展训练】
1.案例分析:根据大数据发现人们的出行规律
在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名扒手在地铁交通系统上被抓,
490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。
参考答案:
案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分析了896条地铁经过的44524个公交车站和18条地铁经过的320个地铁站的数据。从出行轨迹提取特征。例如正常行人在从A地区到B地区会考虑最短时间、距离,或者最少换乘,但是类似“A-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。
2.
调查分析:根据数据分析提出合理化建议。
某市第一期建设了46个公共自行车站点,主要布局在居民生活工作区、公交车站附近等地。
1240个锁车柱已经全部建成,
1000辆自行车也已经配备到位。在一段使用时间之后,相关管理部门对公共自行车使用数据进行采集(数据表见教科书配套资源中的“某市公共自行车一月份运营数据.xls”),同时对使用者进行访谈。受访者均表达了公共自行车方便了自己的出行,但也提出了很多问题,如自行车损坏严重、借不到车,以及还车桩满等问题。请阅读整理相关文字和表格数据资料;对资料进行分析,发现该市公共自行车使用中存在的问题,为二期工程建设提出合理化建议,完成《某市公共自行车使用情况调查分析报告》。
参考答案:
A市公共自行车运营情况调查报告
作者:XXX
时间:XXX
随着我国经济的快速发展和城市化进程的加快,城市人口和机动车辆日益增多,城市交通拥堵现象日益严重。大力发展公共交通成为解决问题的有效途径之一。随着公交、地铁等公共交通工具的发展,“公交最后1公里”的问题日益凸显。为了解决此问题,公共自行车应运而生,成为城市公共交通的重要组成部分。
某市第一期建设了50个公共自行车站点,主要布局在居民生活工作集聚区出入口、公交车站附近等地。在一段使用时间之后,相关管理部门对公共自行车使用情况进行了调查。受访者均表达了公共自行车方便了自己的出行,但也提出了很多问题。如自行车损坏严重,借不到车,还车桩满等问题。下表为第一季度运行数据。我小组依据表中数据,发现其中的问题,为二期工程建设提出合理化建议。【数据来源:A市公共自行车50个投放站点一月份运营数据】
分析思路
本项目将从各站点公共自行车借还数量、平均毎桩借还数、还车维修率等角度进行分析,得出有效建议及改进方案。
图1
A市自行车借还数量对比图
如图1所示,一月07、09、10、16、22、23、28、32、33、37借还数量高于其他站点,属于热点区域。另06、44、46、48几个站点借还数量明显低于其他站点,属于冷门区域。
图2
A市自行车平均毎桩借还数图
如图2所示,10个热门站点中16、32两个站点平均毎桩借还数明显高于其他站点,可能存在公共自行车不够使用的风险,同时,冷门站点中44、46、48三个站点平均毎桩借还数明显低于其他站点,公共自行车利用效率很低。
图3
A市自行车还车数与维修量比图
进一步研究维修数量和还车数量的比值。如图所示,48号,46号和44号维修数量与还车数量之比明显高于其他站点。
数据表明我市共享单车非常受欢迎,市民使用量很大,但仍有热点站点需扩大以满足需求。为了使我市共享单车二期工程更加便于广大市民使用,满足大家的需求,提出以下优化改善方案。
1.向10,16,
32这样的热点站点适量建设更多的桩,或者在这些站点附近增设新站点,并酌情投入共享单车以缓解压力。
2.44、46、48三个冷门站点共享单车使用效率低,且维修工作量大,建议取消这些站点。
3.对于借还差值数量加大的站点加强巡查次数。对借还差为负值的站点要及时将车桩上的车挪走,对借还差为正值的站点要及时补充车辆。
【教学反思】教科版2019信息技术必修1数据与计算
第5单元数据分析与人工智能5.1
走近数据分析教学设计
【教材分析】
信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源。数据分析和大数据是当前最流行的两个话题。教材在起始节对数据分析的内容已经有所涉及。在本节,学生将基于对数据与计算有全面认识的基础上,综合运用所学知识,从解决实际问题的角度,较为深入地经历数据分析的完整过程和体验大数据分析的应用。本部分的内容对应数据与计算模块的数据处理与应用部分。
数据分析的一般过程是根据分析的目标提出假设,然后收集有关数据,选择恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。教材首先创设了问题情境:某同学和妈妈的乘车体验,从而引发问题,希望学生自己提出分析假设,在数据分析基础上验证假设的真实性。这个项目的知识点包含数据分析的基本方法:对比分析和平均分析;数据可视化表达的方法;数据分析报告的结构和规范表述。由于篇幅所限,教材只简要提及数据分析报告包含分析目的和背景、分析过程和结果建议等。教师可以给出范例,让学生结合项目任务选择恰当的结构和表述方式。
随着数据规模的扩大,人们无法在可承受的时间范围内使用常规软件工具采集、管理和处理数据,因此需要新的数据分析方式,于是大数据分析成为当前最热门的数据应用领域。2015年《促进大数据行动发展纲要》中指出:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合;维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中指出大数据时代的三大特征:不是随机样本,而是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。本节通过实时公交软件的大数据应用实例,初步接触大数据的概念、特点和工作机制,在体会和实践的基础上,逐步形成对大数据应用的正确认识。
【教学建议】
本节我们将围绕“感受智能公交”项目展开学习。本项目主要包含“体验公交出行”和“体验实时公交”两个任务。“体验实时公交”任务主要从感受一个完整的数据分析过程出发,了解数据分析和可视化表达的基本方法,以及分析报告的撰写;“体验实时公交”则侧重学生感受大数据的含义和大数据在生活中的应用。
任务一的“体验公交出行”着眼于传统的数据分析。本节开头创设了某同学和他妈妈乘车的情境,希望学生通过数据分析验证两者的乘车体验。首先教师可以引导学生根据情境提出假设,如27路车客流量小于49路车;某同学乘车时间不是客流高峰,因此乘客人数较少;27路车在部分时间段的客流量较少等。第二步教师可以根据学生提出的假设有目的的收集数据,在数据收集中引导学生思考平均客流量的问题,从而为平均分析埋下伏笔。第三步,给出27路和49路各时段数据表请学生依据提出的假设进行对比分析。第四步得出结论。这四个步骤对应了数据分析的一般过程,在教学时要引导学生主动探索,在体验中总结数据分析的具体方法。
任务二“体验实时公交”着眼于大数据分析。大数据分析的案例较多,教师可以适当补充,拓展学生的视野。教材中选用了比较贴近学生生活的手机实时公交APP。很多地图类软件如“百度地图”“高德地图”都兼有实时公交的功能,但由于地域的差异,教师也可选用有本城市特色的软件。教师通过创设实际的出行情境,让学生在实践中感受软件的操作流程,并体会其中的大数据的体量和大数据分析的特点。
【教学目标】
1、了解数据分析的几种常用方法。
2、体验对比分析和平均分析的一般分析过程。
3、了解大数据的含义,认识大数据分析在信息社会的重要作用。【教学重点】了解数据分析的基本方法(对比分析法和平均分析);了解数据可视化表达的特点;了解分析报告的一般结构和表述规范。
【教学重点、难点】
1数据分析的几种常用方法。对比分析和平均分析的一般分析过程。大数据的含义,认识大数据分析在信息社会的重要作用。
【教学方法】
讲授法,演示法,任务驱动法
【教学过程】
引入
让机器具有智能,是人类千百年来的梦想。计算机技术的飞速发展,为人类的这一-梦想插上了翅膀。特别是在当前的信息时代,遍布生活各个角落的海量数据积累,使人工智能技术及其应用得到了迅速的发展,并广泛地渗透进我们的生活。
每一天,你都置身其中。当你打开手机或电脑,新闻客户端推送的是高度个性化的新闻,地图软件提供的是更便捷的行车路线,天气软件给出了友好的生活指数建议....
计算机技术为什么能够实现“智能”?大数据在其中又发挥了怎样的作用?在本单元中,我们将以若干典型应用为例,了解数据分析的常用方法,知道人工智能的概念及应用领域,体验数据分析和人工智能,感受大数据和人工智能给人类生活带来的深刻变化。
信息时代的日常生活中,碎片化的数据不断产生,它们往往杂乱而无序,仿佛并没有太大的价值。数据分析就是对数据进行计算、处理,从而得出一-些有意义的结论的技术。了解数据分析并具备-
-定的数据分析能力,是大数据时代对我们的基本要求。
在本节中,我们将结合实例,通过对比分析和平均分析的实际操作,形成对数据分析的认识,并在此基础上,初步接触大数据的概念、特点和工作机制,感受大数据应用的魅力。
随着我国经济的快速发展和城市化进程的加快,城市人口和机动车辆日益增多,城市交通拥堵现象日益严重。科学地发展和管理公共交通是解决问题的有效途径之一。例如,如何合理安排公交车辆的发车频率,方便乘车人选择交通线路等,都可以通过数据分析来实现。本节我们将围绕“感受智能公交”项目展开学习。同学们将通过该项目的活动,了解数据分析的几种常用方法,感受数据分析的一般过程,体验大数据应用给生活带来的便利。
本项目主要包含“体验公交出行”和“体验实时公交”两个任务。
任务一体验公交出行
活动1分析公交高峰期
某同学每天7:
00乘坐27路车去学校,17:
00左右放学回家。他觉得每天往返途中,公交车上并不拥挤。而妈妈每天8:
00乘坐49路车出发,18:
00下班。她总是抱怨乘车者太多。请尝试进行数据分析。
数据分析的方法
数据分析主要用于现状分析、原因分析和预测分析。进行数据分析时,首先要根据分析的目标提出假设,然后选择恰当的分析方法进行分析,验证假设是否正确,继而得出相应的结论。数据分析的方法有很多,如对比分析和平均分析。
对比分析
对比分析是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物的发展变化情况和规律。对比有横向对比和纵向对比两种情况。横向对比是在类似的或同类的事物之间进行比较,而纵向对比是将相同事物的不同时期进行比较。例如,我们可以横向比较27路和49路公交线路的客流量,以分析哪一条线路更加繁忙;也可以纵向比较同一条公交线路一天内
不同时段的客流量,分析高峰期出现的时间。
平均分析
平均分析是指运用计算平均值的方法反映总体在-
-定时间、地点条件下某一-数量特征的一般水平。平均分析和对比分析常结合使用,例如比较不同线路的平均客流量。
例子
步骤一,依据活动1要求,提出假设:
步骤二,27路和49路公交线路的月平均分时段客流量如表5.1.1所示,表中“6”表示时段6:
00
-7:
00,
其他以此类推。请对比分析表中数据。
数据可视化表达
以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。数据可视化的应用范围广泛,如图5.1.1所示的第五届世界互联网大会关键词云和图5.1.2所示的手机记录的健身数据。
图表是最常用的数据可视化表达方式之一-。?基本图表类型,如柱状图、饼图和折线图等,利用一般的表格加工软件即可绘制。如需创建表现形式更为丰富或者具有互动功能的图表,则必须借助专业性工具。
例子
绘制如图5.1.3所示的折线图,进一步验证假设,并分析两条公交线路的高峰期出现时间和特点。
活动2完成分析报告
数据分析报告是对整个数据分析过程的一个总结与呈现。请通过数据分析报告,将活动1中所做数据分析的起因、过程、结果及建议完整地呈现出来。
数据分析报告
数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。通过报告不仅把数据分析的起因、过程、结果及建议完整地展现出来,还可以为决策者提供科学、严谨的决策依据。例如,中国互联网络信息中心每半年发布一次的《中国互联网络发展状况统计报告》即是一份典型的反映我国互联网发展的数据分析报告。
在数据分析报告中,首先要明确数据分析的目的和背景,阐述目前存在的问题及通过分析希望解决的问题;其次需要描述数据来源和数据分析的思路、方法和模型;最后要重点呈现数据分析的过程、结论和建议。
信息时代的社会生活中,每天都在产生大量的数据,这些数据也在改变着我们的生活。让我们一起来感受数据给出行带来的变化。