(共22张PPT)
5.1 认识大数据
目录
01
02
03
04
走进大数据
大数据的概念
大数据的特征
大数据的影响
Big Data
大数据的产生是与人类日益普及的网络行为所伴生的:物联网、云计算、
移动互联网、手机、电脑以及遍布地球各个角落的各种各样的传感器,无一不
是数据的来源或是承载的方式。互联网生成的数据量,不仅远超此前一切人类 所生成的数据量的总和,而且还在以大爆发性的速度不断增长。
大数据已经成为人们提取信息、做出决策的重要依据,是推动信息社会发 展的重要资源。
前言
Big Data
0
1
走进大数据
那么大数据是否就是大量的数据呢?
观看《认识大数据》视频,了解大数据的概念
,并填写项目活动记录表。
Big Data
02
大数据的概念
大数据是指无法在可承受的时间范围内用常规
软件工具进行高效捕捉、管理和处理的数据集合,是
需要新处理模式才能具有更强的决策力、洞察发现力 和流程优化能力的海量、高增长率和多样化的信息资 产。
、圣诞老人需要在圣诞节前给大约 3.78 亿儿童送去圣诞礼物,为了完成这项 任务,圣诞老人的雪橇需要每秒飞行大约 1050 公里,是声速的 3000 倍。
、凤阳中学期末考试之后,所有学生的考试成绩。
、十本《西游记》。
、第六次全国人口普查统计的各地人口的数量、年龄、性别等数据
、网络购物平台一天所生成的数据量。
下面哪些是大数据?
1 Byte (字节) = 8 bit (位) 1KB( 千 字 节 )= 1024 B 1MB(兆字节)= 1024 KB 1GB(吉字节)= 1024 MB 1TB(太字节)= 1024 GB 1PB(拍字节)= 1024 TB 1EB(艾字节)= 1024 PB 1ZB(泽字节)= 1024 EB 1YB(尧字节)= 1024 ZB
数据的存储单位
1BB= 1024 YB 1NB= 1024 BB 1DB= 1024 NB
1KB 相当于 512 个汉字
1MB 就相当于六本红楼 梦的字数……
1GB 就相当于一部电影 淘宝网在 2015 年 3 月每 天大约能产生 7TB 的数 据量,相当于 4000 万本 红楼梦的数据量。
Big Data
大数据的特征
、从互联网产生大数据的角度来看
、从互联网思维的角度来看
、从大数据存储与计算的角度来看
03
Big Data
活动一
以小组为单位,探究大 数据的特征并完成项目 活动记录表。
V V
V V
数据体量巨大。从 TB 级跃升到 PB
级别。
数据类型繁多。如网络日志、视频
、图片、地理位置信息等。
变化速度快。数据来自世界各地的 网络终端,且以秒为单位快速变化
。
价值密度低。以视频为例,在连续 不间断的监控过程中,有用的数据 可能仅仅一两秒。
大量( Volume )
低价值密度( Value )
多样( Variety )
高速( Velocity )
互联网产生大数据的角度 “4V” 特征
Big Data
互联网思维的角度
样本渐趋于总体
在大数据时代强调数据要全量而不是抽样,即强调 数据规模全量,而不是强调数据量巨大。
相关性重于因果
大数据时代无须紧盯事物之间的因 果关系,而应寻找事物之间的相关 关系。
01
02 精确让位于模糊
大数据时代研究的数据如此之多,
追求的不是精确性,而是模糊性。
03
Big Data
分布式存储
大数据存储在互联网不同的服 务器与各客户终端
分布式并行计算
应用分布式并行计算处理互联网的大数据
01
02
存储与计算的角度
Big Data
大数据与传统数据的区别
传统数据 大数据
数据量小 数据体量巨大
数据类型少 数据类型繁多
价值密度高 价值密度低
更新速度慢 更新速度快
追求数据精确性 追求数据模糊性
本地存储 分布式存储
Big Data
活动二
以小组为单位,探究大 数据在日常生活中的应 用以及对日常生活的影 响,并完成项目活动记 录表。
大数据对日常生活的影响
大数据使人们日常生活更为便捷
大数据对人们的日常生活也会产生一些负面影响
04
方便看病与看诊
方便购物与产品推介
方便出行
应用交通系统的大数据,网约车出行
,智能导航行车避免堵车,无人驾驶
,智能地图方便寻路,等等。
方便支付
01
02
04
03
大数据让日常生活更为便捷
Big Data
中国是全球最大的移动支付市场,医 院、餐厅、菜市场、加油站,甚至路
边摊,都在使用移动支付。
应用网络预约挂号,减轻与节省 患者排队挂号看病的辛劳与时间
;同时,又方便医生提前分析患 者的病史数据,以便更科学诊病
。
网络购物不但节省人们出行购物的时间,而且
帮助企业有效判断用户的信息需求和消费需求
,对客户进行产品推介,方便人们选购产品。
在大数据时代,我们的 网络信息随时都可能被 不法分子窃取,并对我 们及身边的亲人造成伤 害。
负面影响
个人信息泄露
在大数据时代,我们使 用的手机、计算机、网 络、信用卡等信息科技
,都会产生数据。这些 数据时刻存在泄露的风
险。
信息伤害与诈骗
Big Data
02
01
1 .下列行为可能使用大数据的是( )。
① 为了避免堵车,利用高德地图,查看道路拥堵情况
② 利用人脸识别打开门禁道闸,进入校园③水银温度计上显示当前气温是 30℃
④ 全民K 歌提示你打败了全国 90% 的人⑤微信运动显示你今天走了 10000 步A .①②③④ B .①②④⑤ C .②③④⑤ D .①②③④⑤
【答案】 B ①②④⑤ 是从海量的数据范围里进行分析,处理,得到结果的。③水银温度计上 显示当前气温是 30℃ ,不涉及从很多数据中分析,没有使用到大数据。故本题选 B 选项
2. 下列有关大数据的说法,错误的是( )
A 、大数据是分布式存储,分布式并行计算的
B 、大数据具有 4v 特征 , 体量大 , 数据类型繁多、价值密度低、变化速度快。 C 、大数据的样本趋于总体,相关性重于因果
D 、大数据的样本趋于总体,相关性低于因果
【答案】 D
3 .以下属于大数据应用实例的是( )。①某系统通过用户视频点播的基础数据如评 分、播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐②某网站通 过追踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议③ 某交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避 开正在堵车的路段,并且帮他们提前规划好行程④某保险公司天都会对美国境内超过 100 万 个地点、未来两年的天气情况进行超过 1 万次模拟,而后将根系结构和土壤孔隙度的相关数 据,与模拟结果相结合,为成千上万的农民提供农作物保险 A .①②④ B .①②③ C .②
③④ D .①②③④
【答案】 D P101 大数据的概念
Big Data
作业
网络购物平台客户行为数 据的采集和分析?
谢谢!