(共35张PPT)
智能大数据 智慧新生活
Intelligent big data Smart new life
认识大数据
Learn about big data
目 录
CONTENTS
01
02
03
大数据内涵与意义
PART 01
01.大数据内涵与意义
最小的单位是bit(位),基本单位是字节(Byte,简写B)
从小到大依次为:
Byte-KB-MB-GB-TB-PB-EB-ZB-YB-BB-NB-DB
01.大数据内涵与意义
01.大数据内涵与意义
32G
64G
128G
Byte-KB-MB-GB-TB-PB-EB-ZB-YB-BB-NB-DB
01.大数据内涵与意义
1PB=1048576GB
5EB相当于至今全世界 人类所讲过的话
1ZB相当于全世界海滩上的沙子数量总和
2020年全球数据总量相当于40ZB
01.大数据内涵与意义
需要3400多亿个128G的手机才能储存
这些庞大的数据与网络行为伴生:物联网、云计算、移动互联网、车联网、手机、电脑、各种传感器都是数据的来源。且正在以大爆发性的速度增长。
大数据已成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。
01.大数据内涵与意义
海量数据的存储
海量数据的计算
“黄金石油”
大数据特征与结构
PART 02
02.大数据特征与结构
案例一
某市交通智能化分析平台的数据来源于道路交通、电信、地理信息系统等各行各业。例如,交通卡刷卡每天产生1900万条记录,手机定位数据每天产生1800万条,出租车运营数据每天产生100万条,电子停车收费系统数据每天产生50万条,等等。这些数据在体量和速度上都达到了大数据的规模。
特征:
数量庞大、种类繁多
02.大数据特征与结构
案例二
搜索引擎公司通过跟踪网民对“感冒症状”以及“治疗”等关键词的搜索,发现某个时段在某个区域内搜索数量急剧增长,从而成功预测了甲型H1N1流感的暴发时间和地域。
特征:
价值性
02.大数据特征与结构
案例三
目前,某基于大数据的网约车平台已覆盖全国400多个城市,涵盖出租车、快车、顺风车、代驾、专车、试驾以及租车等多项业务,为人们的出行带来极大的便利。我们只需在网约车APP上输入或者说出目的地,强大的智能系统就立刻分配订单,即时通知附近司机;借助定时定位系统,我们可以看到司机的大致位置以及预计到达时间。
特征:
数据处理快
02.大数据特征与结构
(a)基于互联网产生大数据的角度看,大数据具有“4V”特征:
02.大数据特征与结构
(a)基于互联网产生大数据的角度看,大数据具有“4V”特征:
02.大数据特征与结构
(b)基于互联网思维的角度看,大数据具有3个特征:
大数据时代强调数据要全量而不是抽样。即强调数据规模全量,而不是数量巨大。
大数据时代处理的数据如此之多,追求的不是精确性而是模糊性。只要掌握大体发展方向即可,适当忽略微观层面的精确度,会让我们在宏观层面拥有更好的洞察力,从而做出决策。
大数据时代不是因果关系,而是相关关系。我们要寻找事物之间的关联。相关关系也许不能准确告诉我们某件事为何发生,但会提醒我们这件事正在发生。
02.大数据特征与结构
(c)基于大数据存储和计算角度看,大数据具有2个特征:
如果一个大数据,分解成N个小数据放到N台机器上去存储,这就是分布式存储。
如果一个大任务,分解成N个任务,分散到N个处理器上去实现指令流在时间或空间并行的运算,就是并行计算(Parallel Computing),注意这N个处理器是属于一台机器的,比如我国的神威太湖之光超级计算机,就有1064万个处理器。
02.大数据特征与结构
传统数据 大数据
讨论
传统数据与大数据的区别
结构化数据为主 结构化、半结构化、非结构化
用常规软件处理 需要新的处理模式
手动输入数据为主 网络、传感器获取为主
…… ……
PART 03
大数据对日常生活的影响
03.大数据对日常生活的影响
(a)大数据使人们日常生活更为便捷
P
A
Y
P
A
Y
P
A
Y
P
A
Y
03.大数据对日常生活的影响
(a)大数据使人们日常生活更为便捷
03.大数据对日常生活的影响
(b)大数据对人们日常生活产生负面影响
03.大数据对日常生活的影响
说一说
大数据对“我”的影响
购物:使用京东多次搜索手机壳后,首页自动推荐相关商品
旅游:出门旅游时,提前查看天气预报,准备相应衣物
外卖:同一份餐,不同客户价格不同
交通:利用GPS,合理规划上下班路线和时间
……
……
知识拓展(课后作业)
1.大数据对国家治理有影响吗?有什么样的影响?
2.大数据对经济运行有影响吗?有什么样的影响?
想一想
目 录
CONTENTS
01
02
03
1.从互联网产生大数据的角度看,大数据具有( )特征。
A.“4V”特征:大量、低价值密度、高速、多样
B.样本渐趋于总体、精确让位于模糊、相关性重于因果
C.分布式存储、分布式并行计算
D.没有特征
课堂学业评价
2.只要量大的数据就是大 数据。如每10年都会进行一次人口普查,统计我国各地人口的数量、年龄、性别、家庭住址、常住人口等信息。( )
A.正确
B.错误
课堂学业评价
3.大数据最显著的特征是( )。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
课堂学业评价
4.大数据的起源是( ) 。
A.金融
B.电信
C.公共管理
D.互联网
课堂学业评价
5.下列对大数据的特点描述错误的是( )。
A.数据规模大
B.数据类型多样
C.数据处理速度快
D.数据价值密度高
课堂学业评价
6.当前社会中,最为突出的大数据环境是( ) 。
A.物联网
B.综合国力
C.自然资源
D.无
课堂学业评价
7.下列关于网络用户行为的说法中,错误的是( ) 。
A.网络公司能够捕捉到用户在其网站上的所有行为
B.数字轨迹用完即自动删除
C.用户的隐私安全很难得到规范保护
D.用户离散的交互痕迹能够为企业提升服务质量提供参考
课堂学业评价
智能大数据 智慧新生活
Intelligent big data Smart new life