(共19张PPT)
5.1认识大数据
oc0100010000011021o0o1o10100101行o
1091010001.0
Tro1100010
情境导入
B
3g
[工作的时候气不由自主
看看有
拿手丸]
设有人纶
拉神博
留言
情境导入
●
d
抖音
短视频
8快手
今日头条
它怎么知道我们的兴趣
这么“懂”我们?
大数据
B
93a
大数据
(BIG DATA)
指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管
理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞
察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
二、
大数据的特征
936
从互联网产生大数据的角度来看:
4
1.淘宝网近4亿的会员每天产生的商品交易数据约500TB;总
存储量400EB。
大量
2.在医院,一个病人的CT数据量达几十GB,每年需要保存
(Volume
的数据达100EB。
中国移动“
边0147%■111:08
那片海21
回
何
向我的亲情账号》
1TB=1024GB
210
33
664
6
藏夹
关注店铺
足过
红包卡券
1PB=1024TB
88会员
1EB=1024PB
开通88VIP亨海量权益
88V1P
音淘气值805
克/玩/听/看/实一卡通
1ZB=1024EB
我的订单
查看全部订单)
二、大数据的特征
4
●
从互联网产生大数据的角度来看:
5
食味委丽作隔P不TT程
地理位置
&品品山品
网络日志
多样
(Variety)
数据种类繁多
视频
音频
图片
二、大数据的特征
14
93g
从互联网产生大数据的角度来看:
5
4
5
例如:通过监控视频寻找犯罪分子,可能只有几秒钟的
有效时间。
低价值
密度
(Value)
二、大数据的特征
门4
936
从互联网产生大数据的角度来看:
刚刚过去的一分钟:
高速
email:2亿+封被发出
12306:2000+张车票被卖出
(Velocity)
孕中国铁路12306
把孩年票、保饮、常板言、相兴规置
12306C4N4Ra1.4司
回
首西
印胸程务
安同图野V
站车务√
商务
变化速度快,通常以
秒为单位快速变化。
车
计次,定期票
直
型达地兰州
开售
昆常用造词
发期2022-0-21
生口
高欲动年
产订餐
有小庆兰州庆凉北凉十海,除历中
4
二、大数据的特征
门4
93a
●
从互联网产生大数据的角度来看:
●)
4
BF2
大量
高速
(Volume
(Velocity
4V"
低价值
多样
密度
(Variety)
(Value)