(共28张PPT)
人教中图版普通高中教科书
第一章 认识数据与大数据
1.1数据、信息与知识
1.2数据化与编码
1.3数据科学与大数据
认识数据科学,体验大数据对学习、生活和社会发展的影响
了解大数据在社会各领域中的应用,感受大数据在社会变革中的作用
学习目标
大数据的概念与意义
数据科学是利用科学方法、流程、算法和系统从数据中提取价值的跨学科领域。数据科学家综合利用一系列技能(包括统计学、计算机科学和业务知识)来分析从网络、智能手机、客户、传感器和其他来源收集的数据。
数据科学揭示趋势并产生见解,企业可以利用这些见解做出更好的决策并推出更多创新产品和服务。数据是创新的基石,但是只有数据科学家从数据中收集信息,然后采取行动,才能实现数据的价值。
大数据的概念与意义
从概念上来看,大数据 具有狭义性与广泛性的区别。
对于前者而言,一般代表着大量的数据资料,能够促进不同数据之间的融合。
对于后者来说,其属于一个综合性名词,不但能够促进大量数据的融合,而且还对应了很多大数据技术,和传统的计算机技术进行对比,是完全不一样的,这属于一个完全不同的处理机制,能够对大量的数据展开研究、统计及处理。当处理及分析数据的过程中,能够随之创建一套完善、高效的信息资产系统,以便于最大化地彰显出数据的核心价值与重要资源。
大数据的概念与意义
信息化浪潮 发生时间 标志 解决问题 代表企业
第一次浪潮 1980年前后 个人计算机 信息处理 Intel、AMD、IBM、苹果、微软、联想、戴尔、惠普等
第二次浪潮 1995年前后 互联网 信息传输 雅虎、谷歌、阿里巴巴、百度、腾讯等
第三次浪潮 2010年前后 物联网、 云计算、 大数据 信息爆炸 将涌现出一批新的市场标杆企业
表1-1 三次信息化浪潮
大数据的概念与意义
从“数据”到“大数据”
时至今日,“数据”变身“大数据”,开启了一次重大的时代转型。“大数据”这一概念的形成,有三个标志性事件:
大数据的概念与意义
大数据的意义
(1)有数据可说
在大数据时代,“万物皆数”,“量化一切”,”一切都将被数据化”。人类生活在一个海量、动态、多样的数据世界中,数据无处不在、无时不有、无人不用,数据就像阳光、空气、水分一样常见,好比放大镜、望远镜、显微镜那般重要。
(2)说数据可靠
大数据中的“数据”真实可靠,它实质上是表征事物现象的一种符号语言和逻辑关系,其可靠性的数理哲学基础是世界同构原理。世界具有物质统一性,统一的世界中的一切事物都存在着时空一致性的同构关系。这意味着任何事物的属性和规律,只要通过适当编码,均可以通过统一的数字信号表达出来。
因此,“用数据说话”、“让数据发声”,已成为人类认知世界的一种全新方法。
大数据及其应用
大数据时代的技术支撑
大数据及其应用
1.存储设备容量不断增加
图1-1 存储价格随时间变化情况
图1-1 存储价格随时间变化情况
大数据及其应用
1.存储设备容量不断增加
图1-1 存储价格随时间变化情况
来自斯威本科技大学(Swinburne University of Technology)的研究团队,在2013年6月29日刊出的《自然通讯(Nature Communications)》杂志的文章中,描述了一种全新的数据存储方式,可将1PB(1024TB)的数据存储到一张仅DVD大小的聚合物碟片上。
大数据及其应用
图1-1 存储价格随时间变化情况
图1-2 数据存储容量单位
大数据及其应用
2.CPU处理能力大幅提升
图1-1 存储价格随时间变化情况
图1-3 CPU晶体管数目随时间变化情况
大数据及其应用
3.网络带宽不断增加
图1-1 存储价格随时间变化情况
图1-4 网络带宽随时间变化情况
大数据及其应用
大数据特征
图1-1 存储价格随时间变化情况
大数据及其应用
1.巨量性
图1-1 存储价格随时间变化情况
根据IDC(互联网数据中心)作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)
人类在最近两年产生的数据量相当于之前产生的全部数据量
预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍
大数据及其应用
2.多样性
图1-1 存储价格随时间变化情况
大数据是由结构化和非结构化数据组成的
10%的结构化数据,存储在数据库中
90%的非结构化数据,它们与人类信息密切相关
大数据及其应用
3.迅变性
图1-1 存储价格随时间变化情况
从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少
1秒定律:对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了(大数据处理技术和传统数据挖掘技术最大的区别)
大数据及其应用
4.价值性
图1-1 存储价格随时间变化情况
价值密度低,商业价值高
以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值
大数据及其应用
大数据技术
图1-1 存储价格随时间变化情况
大数据技术指对巨量数据资源进行采集、提取、存储、分析和表达的技术,一般包括大数据采集、大数据预处理、大数据存储与管理、大数据分析与挖掘及大数据可视化与应用等技术。
大数据及其应用
1.大数据采集技术
图1-1 存储价格随时间变化情况
大数据采集技术通过物联传感、社交网络等方式获得各种类型的海量数据。
大数据及其应用
2.大数据预处理技术
图1-1 存储价格随时间变化情况
大数据预处理技术不仅能提高数据质量、降低数据计算的复杂度,还能降低数据规模、提升数据处理的准确性。
现实世界中数据大体上都是不完整的,不一致的“脏”数据,无法直接进行数据挖掘,或挖掘结果差强人意,为了提高数据挖掘的质量,产生了数据预处理技术。
大数据及其应用
3.大数据存储与管理技术
图1-1 存储价格随时间变化情况
大数据存储与管理技术能通过相应的数据中心把采集到的数据存储起来,并进行管理和调用。
大数据及其应用
4.大数据分析与挖掘技术
图1-1 存储价格随时间变化情况
大数据分析与挖掘技术能从规模巨大的数据中,分析并提取出有潜在价值的信息。
大数据及其应用
5.大数据可视化与应用技术
图1-1 存储价格随时间变化情况
大数据可视化与应用技术能将分析或挖掘出来的数据进行直观、形象地呈现,为人们的社会活动提供依据,提高各个领域的运行效率,以发挥出更大的效益。
大数据及其应用
实践探究:解读导航地图大数据
图1-1 存储价格随时间变化情况
体验利用导航地图找出出行“捷径”,结合案例,说出其中的大数据从何而来,又是如何处理的。
大数据及其应用
大数据应用
图1-1 存储价格随时间变化情况
随着互联网的发展,大数据已经渗透到很多行业,成为重要的生产要素,并通过各行各业的不断创新,逐步为人类创造着更多的价值和财富。
大数据及其应用
图1-1 存储价格随时间变化情况
大数据及其应用
图1-1 存储价格随时间变化情况