(共21张PPT)
5.1
认识大数据
高中信息技术
必修1
新知导入
本节主要内容:
1、大数据的概念
2、大数据的特征
3、传统数据与大数据的区别
4、大数据对日常生活的影响
新知导入
典型的大数据案列
超市预知高中生顾客怀孕
明尼苏达州一家塔吉特门店被客户投诉,一位中年男子指控塔吉特将婴儿产品优惠券寄给他的女儿——一个高中生。但没多久他却来电道歉,因为女儿经他逼问后坦承自己真的怀孕了。塔吉特百货就是靠着分析用户所有的购物数据,然后通过相关关系分析得出事情的真实状况。
新知讲解
大数据的基本概念:指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
新知讲解
数据(data):是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。
数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。
新知讲解
数据不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“0、1、2…”、“阴、雨、下降、气温”、“学生的档案记录、货物的运输情况”等都是数据。数据经过加工后就成为信息。
计算机系统中,数据以二进制信息单元0、1的形式表示。
新知讲解
数据的承载方式:物联网、云计算、移动互联网、车联网、手机、电脑以及各种各样的传感器。
数据的作用:人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。
温故知新
信息与数据的关系
(1)数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。而信息是数据的内涵,信息是加载于数据之上,对数据作具有含义的解释。
(2)数据是符号,是物理性的,信息是对数据进行加工处理之后所得到的并对决策产生影响的数据,是逻辑性和观念性的
(3)数据是信息的表现形式,信息是数据有意义的表示
(4)数据是信息的表达、载体,信息是数据的内涵,是形与质的关系。
(5)数据本身没有意义,数据只有对实体行为产生影响时才成为信息。
温故知新
大数据的特征
不同的维度
特征
具体表现
互联网产生大数据
大量(Volume)
数据体量巨大,从TB级别跃升到PB级别。
多样(Variety)
数据类型繁多,如网络日志、视频、图片、地理位置信息等。
低价值密度(Value)
价值密度低,以视频为例,在连续不间断的监控过程中,有用的数据可能仅仅一两秒。
高速(Velocity)
变化速度快,数据来自世界各地的网络终端,且以秒为单位快速变化。
互联网思维
样本渐趋于总体
数据要全量而不是抽样,即强调数据规模全量,而不是强调数量巨大。
精确让位于模糊
大数据时代追求的不是精确性,而是模糊性,适当忽略微观层面上的精确度,在宏观层面拥有更好的洞察力。
相关性重于因果
大数据时代应该寻找事物之间的相关关系,无须再紧盯事物之间的因果关系。
大数据存储与计算
分布式存储
大数据存储在互联网不同的服务器与各客户终端。
分布式并行计算
应用分布式并行计算处理互联网的大数据。
温故知新
大数据的与传统数据的区别
传统数据
大数据
依赖模型以及算法
数据本身保证了数据分析结果的有效性
强调数据之间的因果关系
当数据足够多的时候,不需要了解具体的因果关系就能够得出结论
数据都需要前期进行结构化处理,并记录在相应的数据库中
数据的结构的要求大大降低,各种维度的信息勾勒出每一个个体的各种特征。
传统数据挖掘方式,采集方法,内容分类,采信标准等都已存在既有规则,方法论完整
大数据挖掘为新鲜事物,还没有形成清晰的方法、路径、以及评判标准。
传统数据诠释宏观、整体的状况,用于影响政策决策
大数据可以分析微观、个体的状况,用于调整行为与实现个性化。
传统数据来源于阶段性的,针对性的评估,其采样过程可能有系统误差
大数据来源于过程性的,即时性的行为与现象记录,第三方、技术型的观察采样的方式误差较小
传统数据分析所需要的人才、专业技能以及设施设备都较为普通,易获得
大数据挖掘需要的人才,专业技能以及设施设备要求较高,并且从业者需要有创新意识与挖掘数据的灵感而不是按部就班者,这样的人才十分稀缺
新知讲解
大数据的具体应用
(1)洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。
(2)Google流感趋势(Google
Flu
Trends)利用搜索关键词预测禽流感的散布。
(3)统计学家内特·西尔弗(Nate
Silver)利用大数据预测2012美国选举结果。
(4)麻省理工学院利用手机定位数据和交通数据建立城市规划。
(5)梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。
新知讲解
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。
新知讲解
大数据与乔布斯癌症治疗
乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。
奥巴马大选连任成功
2012年11月奥巴马大选连任成功的胜利果实也被归功于大数据,因为他的竞选团队进行了大规模与深入的数据挖掘。时代杂志更是断言,依靠直觉与经验进行决策的优势急剧下降,在政治领域,大数据的时代已经到来;各色媒体、论坛、专家铺天盖地的宣传让人们对大数据时代的来临兴奋不已。
新知讲解
大数据的价值体现
(1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;
(2)做小而美模式的中小微企业可以利用大数据做服务转型;
(3)面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。
新知讲解
大数据对日常生活的影响
正面影响
方便支付。移动支付发展得特别快。应用场所:医院、餐厅、菜市场、加油站等
方便出行。网络约车出行、智能导航行车避免堵车、无人驾驶、智能地图方便寻路
方便购物与产品推介。节省人们出行购物的时间,帮助企业有效判断用户的信息需求和消费需求,对客户进行产品推介,方便人们选购产品。
方便看病与诊病。网络预约挂号,减轻与节省患者排队挂号看病的辛劳与时间;方便医生提前分析患者的病史数据,以便更科学诊病。
负面影响
个人信息泄露。手机、计算机、网络、信用卡等都可能导致数据泄露的风险
信息伤害与诈骗。网络信息可能被不法分子窃取,并对我们及身边的亲人造成伤害。
课堂练习
通过结合大数据和高性能的分析对快递企业有益的情况有哪些?
(1)及时解析故障、问题和缺陷的根源,每年可能为企业节省资金。
(2)为成千上万的快递车辆规划实时交通路线,躲避拥堵。
(3)分析所有库存单位,以利润最大化为目标来定价和清理库存。
(4)根据客户的购买习惯,为其推送他可能感兴趣的优惠信息。
(5)从大量客户中快速识别出金牌客户。
(6)使用点击流分析和数据挖掘来规避欺诈行为
新知讲解
大数据的未来趋势
(1)数据的资源化。指大数据成为企业和社会关注的重要战略资源,企业必须要提前制定大数据营销战略计划,抢占市场先机。
(2)与云计算的深度结合。大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。
(3)科学理论的突破。大数据很有可能是新一轮的技术革命,随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。
新知讲解
大数据的未来趋势
(4)数据科学和数据联盟的成立。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。
(5)数据泄露泛滥。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障。
(6)数据管理成为核心竞争力。数据管理成为核心竞争力,直接影响财务表现。将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。
新知讲解
大数据的未来趋势
(7)数据质量是BI(商业智能)成功的关键。采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。
(8)数据生态系统复合化程度加强。大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。
谢谢
21世纪教育网(www.21cnjy.com)
中小学教育资源网站
有大把高质量资料?一线教师?一线教研员?
欢迎加入21世纪教育网教师合作团队!!月薪过万不是梦!!
详情请看:
https://www.21cnjy.com/help/help_extract.php中小学教育资源及组卷应用平台
5.1
认识大数据
一、选择题
1、从互联网产生大数据的角度来看,大数据具有的特征是(
)
A、“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、
高速(Velocity)
B、样本渐趋于总体,精确让位于模糊,相关性重于因果
C、分布式存储,分布式并行计算
D、没有特征
2、下列关于大数据的特征,说法正确的是(
)。
A、数据价值密度高
B、数据类型少
C、数据基本无变化
D、数据体量巨大
3、大数据的最显著特征是(?
)。?
A、数据规模大??
B、数据类型多样
C、数据处理速度快??
D、数据价值密度高
4、当前社会中,最为突出的大数据环境是(
?)。?
A、互联网??
B、物联网??
C、综合国力??
D、自然资源
5、大数据在我们的生活中,无处不在,下列说法正确的是(
)
A、大数据带给我们的全部都是正面的影响。
B、大数据给我们的生活带来便捷的同时也会产生负面影响。
C、大数据可能会带来个人信息泄露,我们应该全盘否定
D、大数据只会给我们带来信息伤害与诈骗。
6、下列论据中,能够支撑“大数据无所不能”的观点的是(?
)。
A、互联网金融打破了传统的观念和行为??
B、大数据存在泡沫
C、大数据具有非常高的成本??
D、个人隐私泄露与信息安全担忧
7、当前大数据技术的基础是由(?
)首先提出的。
A、微软
B、百度
C、谷歌
D、阿里巴巴
8、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(?
)。?
A、美国
?B、日本?
C、中国?
?
D、韩国
9、大数据时代,数据使用的关键是(
)。?
A、数据收集?
B、数据存储?
C、数据分析?
D、数据再利用
10、支撑大数据业务的基础是(?
)。
A、数据科学
?B、数据应用
?C、数据硬件
?D、数据人才
二、判断题
1、当前,大数据产业发展的特点是规模较小并且增速缓慢。(
)
2、传统营销模式比基于大数据的营销模式针对性更强。(????)
3、打通多源跨域数据属于传统数据密集型行业积极探索和布局大数据应用的表现。(????)
4、大数据人才整体上需要具备数学与统计知识、?计算机相关知识、特定业务领域的知识等核心知识。(????)
5、大数据的本质是洞察。(????)
试题答案
一、选择题
1
2
3
4
5
6
7
8
9
10
A
D
A
A
B
A
C
D
D
B
解析:
1、大数据具有“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)。
2、同上题。
3、大数据最显著的特征是大量(Volume),也就是数据规模大。
4、大数据的起源是互联网,所以目前最为突出的大数据环境仍是互联网。
5、大数据给我们的生活带来方便支付、方便出行、方便购物和方便就医都正面的作用,同时也带来了个人信息泄露、信息伤害与诈骗等负面影响。
6、大数据的起源是互联网。
7、大数据技术的观点首先由谷歌(Google)提出。
8、韩国提出了“重视基础、首都先行”。
9、大数据时代,数据使用的关键是数据再利用。
10、数据应用是支撑大数据业务的基础。
二、判断题
1
2
3
4
5
×
×
√
√
解析:
1、大数据产业发展的特点是规模较大、增速很快与多产业交叉融合。
2、大数据成为企业和社会关注的重要战略资源,企业必须要提前制定大数据营销战略计划,抢占市场先机。
3、数据生态系统复合化程度加强。大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。
4、数据科学和数据联盟的成立。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。。
5、大数据(big
data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
21世纪教育网
www.21cnjy.com
精品试卷·第
2
页
(共
2
页)
HYPERLINK
"http://21世纪教育网(www.21cnjy.com)
"
21世纪教育网(www.21cnjy.com)