(共13张PPT)
数据与大数据
1.5
1
1.5.1大数据的概念
2
1.5.2大数据的特征
目录 Contents
3
1.5.3大数据思维
4
1.5.4大数据对社会的影响
1.5.1大数据的概念
大数据定义:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
1.5.2大数据的特征
价值(Value)
价值密度低
04
03
多样(Variety)
数据类型多
02
速度(Velocity)
速度快
01
数量(Volume)
数据体量巨大
大数据4V特征
量大速度快,类多价值低
1.5.2大数据的特征——数量(Volume)
数量(Volume): 数据体量巨大。
大数据通常指100 TB( 1TB=1024 GB )规模以上的数据量。
1Byte
1KB
1MB
1GB
1TB
1PB
1EB
1ZB
1YB
1PB相当于50%的全美学术研究图书馆藏书信息内容
5EB相当于至今全世界人类所讲过的话语
1ZB如同全世界海滩上的沙子数量总和
1YB相当于7000位人类体内的微细胞总和
一般情况下,大数据以PB、EB、ZB为单位进行计量
1.5.2大数据的特征——速度(Velocity)
速度(Velocity): 数据产生的速度快;数据处理的速度快。
欧洲核子研究组织的大型强子对撞机
(每秒产生PB级的数据)
1.5.2大数据的特征——多样(Variety)
多样(Variety):大数据的数据来源多,结构化、半结构化、非结构化数据共存。
人工产生的:短信、微信、视频、语音、电子邮件等。
机器自动产生的:各种传感器在生产监测、环境监测、交通监测、安防监测
等过程中产生大量数据。
1.5.2大数据的特征——价值(Value)
价值(Value):大数据蕴含着巨大的价值,但因其数据量庞大,可能发挥价值的
仅是其中非常小的部分,价值密度相对较低。
价值密度的高低与数据总量的大小成反比,“提纯”大数据,让其发挥更大
的价值,是人们一直在努力的目标。
某地交通密集路口发生了一起严重的交通事故,交警调取了这起事故的视频画面,但有效的视频画面仅仅有十几秒钟。
1.5.3大数据思维
大数据要分析的是全体数据,
而不是抽样数据。
对于数据不再追求精确性,
而是能够接受数据的混杂性。
不一定强调对事物因果关系的探求,
而是更加注重它们的相关性。
大数据是一场变革, 改变的不仅是数据,还有人们的思维。
1.5.4大数据对社会的影响
01
大数据让生活更便利
02
大数据让决策更加精准
03
大数据带来新的就业机会
04
大数据带来新的社会问题
讨论
大数据背景下,我们该如何保护自己信息不被泄露?
保护自己的隐私不被偷窥?
巩固练习
★ 下列关于大数据思维的描述,错误的是( )
A. 大数据时代,人们可以采集全体数据进行分析,避免样本不同导致结论不同
B.基于大数据技术,我们能够接受数据的混杂性,个别数据的不准确不影响数据分析
C.数据总量变大会导致大量不相干的数据增加,大数据具有价值密度低的特点
D.使用大数据思维,我们更强调事物因果关系的探求,而不仅仅是数据之间的相关性
★ 下列数据中属于大数据的是( )
①各地交通摄像头记录的全部数据②学生网上高考报名数据③电商平台的用户浏览、交易时产生的数据④全体手机用户的联网信息、实时定位数据
A.①②③ B.①②④ C.①③④ D.②③④
D
C
小结