(共19张PPT)
数据与大数据
互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了------马云近两年,“大数据”这个词越来越为大众所熟悉,“大数据”一直是以高冷的形象出现在大众面前,面对大数据,相信许多人都一头雾水。下面我们通过几个经典案例,让同学们实打实接触一把“大数据”。你会发现它其实就在我们身边20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。啤酒和尿布在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入明尼苏达州一家塔吉特门店被客户投诉,一位中年男子指控塔吉特将婴儿产品优惠券寄给他的女儿——一个高中生。但没多久她却来电道歉,因为女儿经他逼问后坦诚自己真的怀孕了。塔吉特百货就是靠着分析用户所有的购物及搜索数据,然后通过相关关系分析得出事情的真相超市预知高中生怀孕什么是大数据?其实很简单,大数据其实就是海量资料巨量资料,这些巨量资料来源于世界各地随时产生的数据,在大数据时代,任何微小的数据都可能产生不可思议的价值。大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。大数据的特征数量(volume)速度(Velocity)多样(Variety)价值(Value)大数据的特征数量(volume):TB\PB\EB\ZB仅供开采162年仅供开采45年仅供开采60年过去3年数据总量比以往4万年还多2013年,10分钟的信息总量将达1.8ZB2010年全球数据总量1.2ZB,年增长50%不可再生资源数据1Byte1KB1MB1GB1TB1PB1EB1ZB1YB1PB相当于50%的全美学术研究图书馆藏书信息内容5EB相当于至今全世界人类所讲过的话语1ZB如同全世界海滩上的沙子数量总和1YB相当于7000位人类体内的微细胞总和一般情况下,大数据是以PB、EB、ZB为单位进行计量的大数据必定数据量大,但数据量大未必都是大数据速度(Velocity):数据产生的速度快,数据处理的速度快大数据的特征多样(Variety):人工产生的,机器自动产生大数据的特征价值(Value):价值密度低,有许多冗余数据大数据的特征在连续不断的监控画面中,有效部分仅几分钟…大数据思维大数据是一种变革,改变的不仅是数据,还有人们的思维更好不是因果关系而是相关关系更多不是随机样本而是全部数据更杂不是精确性而是混杂性正面影响大数据让生活更便利大数据让决策更精准大数据带来新的就业需求负面影响大数据带来新的社会问题,如信息泄露、数据安全、个人隐私甚至伦理道德等方面的社会问题大数据对社会的影响为什么广告总能找到你?大数据为生活带来便利的同时也带来了安全隐患。我们应该如何在大数据时代预防信息泄露?谢谢