(共13张PPT)
第12课 走近大数据
导入
抖音刷短视频,根据喜好推荐
导航提前告知哪段路段处于拥堵
导入
找一找:生活中,你觉得哪些是大数据?
思 考
新授
大数据是指那些量大且复杂到无法用传统数据处理方法来处理的数据集合。
大数据一般指规模达到10TB以上的数据。
新授
存储容量单位 换算单位
KB,千兆字节 1KB=1024B=210B
MB,兆字节 1MB=1024KB=210KB
GB,吉字节 1GB=1024MB=210MB
TB,太字节 1TB=1024GB=210GB
PB,拍字节 1PB=1024TB=210TB
EB,艾字节 1EB=1024PB=210PB
ZB,泽它字节 1ZB=1024EB=210EB
计算机中数据存储的最小单位是位(bit),基本单位是字节(Byte,简称B),1 B=8 bit。
思考:现在手机的容量一般分为64GB、128GB、256GB、512GB等。老师欲购买256GB的手机一部,问:想要达到10TB的的数据存储需要多少部256GB的手机?一张图片的容量为 2.5 MB,若这些手机都拿来存储图片,共可以存储多少张图片?
ZB>EB>PB>TB>GB>MB>KB>B
1GB= KB
讨论
某店铺实时战报
第七次全国人口普查普查员逐户上门,耗时两个月完成
天猫双11凌晨刚过2分钟营业额
讨论
第七次全国人口普查 天猫双11凌晨2分营业额
相同点
不同点
“4V”特征
1.数量大(Volume)
2.速度快(Velocity)
3.类型多(Variety)
4.价值密度低(Value)
随着信息技术的高速发展,数据来源渠道不断增加,社交网络、移动网络、各种智能工具等时刻都在源源不断地产生海量数据,数据量爆发式增长。数据的存储量级单位也在不断刷新,从TB、PB量级跃升至EB、ZB量级。
速度快,指的是数据产生的速度快和数据处理的速度快两个方面。
在数据量非常庞大的情况下,只有革新数据处理的技术,才能够实现数据的实时处理。数据处理一般遵循“秒级定律”,从各种类型的数据中快速获得有价值的信息。
“秒级定律”是对数据处理速度的要求。数据处理结果一般要在秒级时间范围内通过分析得出。若处理时间太长就会失去价值。
这是大数据的核心特征。虽然获取的数据量呈现出指数级的上升趋势,但是隐藏在大数据中的有价值的信息没有对应的增长。
大数据的数据来源途径宽泛,有的是机器生成的,有的是人为产生的。数据的类型也变得越来越多样。数据的类型不仅包括拥有确定长度和格式的结构化数据,如传感器数据、网络日志数据、输入数据、点击流数据等,还包括许多没有固定格式的非结构化数据,如各种图像、音频、视频数据等。
课堂小结
课堂小结
存储量大,增量大
数据产生速度和处理的速度快
来源多;
结构化数据、半结构化数据、非结构化数据
价值高密度低
......
课堂小测
https://ks.wjx.top/vj/eP48omi.aspx
大数据时代来临,同学们要学会发现身边的大数据现象,善于运用发展的眼光看待问题,感受大数据的魅力,培养自己的大数据意识。任务清单
活动一:发现生活中的大数据
活动二:
活动三:绘制一张关于大数据特征的思维导图。
存储容量单位
换算单位
B,千兆字节
1KB=1024B=210B
B,兆字节
1MB=1024KB=210KB
GB,吉字节
1GB=1024MB-210MB
TB,太字节
1TB=1024GB=210GB
PB,拍字节
1PB=1024TB=210TB
EB,艾字节
1EB=1024PB=210pB
ZB,泽它字节
1ZB=1024EB=210EB