(共12张PPT)
第5单元
数据分析与人工智能
5.1
走进数据分析(第2课时)
必修1
数据与计算
2019版
教科版高中信息技术
课堂导入
假如来到一个陌生的地方,需要知道自己所处的位置,手机里的地图软件可以很方便的帮助你定位,计算并推荐去目的地的路线。
地图软件界面:
全景模式:
如果一个拍摄点需要拍摄8张照片,每张照片的大小约为4MB,1个拍摄点的照征数据量是多少?考虑到地图的连续性,如果相邻拍摄点间隔为16米,那么一条长1千米的街道需要多少张照片?数据量是多少?如果一个城市呢?
4x8=32MB,一个拍摄点的照片数据量是32MB。
1000/16=62.5,所以1千米长的街道需要63个拍摄点,63x8=504张,需要拍摄504张照片。4
504=2016MB,所以数据量是2016MB。
由此可见,如果是一个城市,数据量是很庞大的。
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
大数据的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。
大数据
实时公交信息查询软件可以实时反馈公交车辆的运行信息,
提升
乘客的出行效率
公交车距离我多远
实时公交信息查询软件使用体验
序号
体验并思考的内容
结果
1
查看该软件为用户提供了哪些实用功能?
2
如果有条件,乘公交车出行时使用该软件,并回答以下问题:1.它所提供的公交车运行信息是否及时准确?2.它是否可以提供多种出行方案?
3
定位公交车位置信息需要哪些技术?它们各有什么优缺点?
路线、时间及距离查询
基本准确?
可以提供多种出行方案
卫星定位,WIFI热点和基站等
大数据分析带来价值的同时,也在隐私保护、安全问题等方面带来了危害。因此,合理健康地使用大数据,遵循数据道德是我们的必备品质。
数据道德:
小
结
1、了解大数据的含义,认识大数据分析的重要作用。
2、熟练使用地图软件
扩展部分
案例分析:根据大数据发现人们的出行规律
在美国旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文。论文指出,北京在2014年的前9个月就有350名扒手在地铁交通系统上被抓,
490名扒手在公交车上被抓。因此,他们认为可以通过对北京智能公交一卡通数据进行分析研究,根据异常交通记录分析来抓小偷。如要实现这个功能,要调用哪些数据呢?同学们也可以上网搜索相关资料,了解大数据专家是如何分析的。
参考答案:
案例来源于熊辉等学者提交的论文。论文中阐述了他收集乘客的公交一卡通数据记录,分析了896条地铁经过的44524个公交车站和18条地铁经过的320个地铁站的数据。从出行轨迹提取特征。例如正常行人在从A地区到B地区会考虑最短时间、距离,或者最少换乘,但是类似“A-C-D-B”这种无目的的异常交通方式为异常行为。如果异常行为足够多,则他可能是一名扒手。具体的算法和模型,可见论文详细描述。
?
存储是分布的呀!“分布式”的存储为以后“分布式处理”做准备,“分布”是高效处理的前提,否则大数据处理怎么这么快。
处理也是分布!在分析之前对数据进行规整化是处理阶段的重要工作。一切为了提高效率!
大数据分析的方法有很多,统计分析和数据挖掘也是大数据分析。
大数据采集
分布式文件存储
分布式数据库存储
分布式处理
分析
大数据分析的流程
https://www.21cnjy.com/help/help_extract.php