浙教版 信息技术 必修1 1.5 数据与大数据 课件(共17张PPT)

文档属性

名称 浙教版 信息技术 必修1 1.5 数据与大数据 课件(共17张PPT)
格式 pptx
文件大小 4.7MB
资源类型 试卷
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2021-02-25 14:35:58

图片预览

文档简介

第1章 数据与信息
浙教版(2019版) 信息技术(高中)
1.5 数据与大数据
必修1 数据与计算
学习目标
1
2
3
大数据的概念。
大数据的特征。
大数据思维。
大数据对社会的影响。
4
1
2
重点难点
重点:大数据的特征和思维。
难点:大数据的思维。
课堂导入

互联网、移动网络、物联网等每天都产生着大量数据,这些数据规模巨大、格式多样,已经很难用传统的方式进行处理。于是,大数据技术应运而生,通过分析、挖掘这些数据,发现其蕴藏的价值。
1.5.1 大数据的概念
图公司(SGI) 的一位科学家正式提出。2016年,数据科学家将大数据正式定义为:大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化。为价值。也就是说,大数据之“大”, 不仅指规模、速度和种类的特征,还意味着它超出以往常用的数据采集、组织、 管理和加工等软件的处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。
1.5.2 大数据的特征
数据体量巨大
速度快
数据类
型多
价值密度低
现在,传感器,互联网,智能终端等每天都在产生海量数据。已经从TB、PB升到EB、ZB级别。
一是数据产生的速度快。有的
数据是爆发式产生的,有的数
据是累积产生的。二是数据处
理的速度快。
数据来自多种数据源
,其数据各类与格式
不可能保持一致,各
种结构化,半结构化
和非结构化数据共存。
大数据蕴含着巨大的价值,但
因其数据量庞大,可能发挥价
值的仅是其中非常小的部分,
价值密度相对较低。
不一定强调对事物因果关系的探求,而是更加注重它们的相关性。
首先
其次
再次
1.5.3 大数据思维
大数据要分析的是全体数据,而不是抽样数据。
对于数据不再追求精确性,而是能够接受数据的混杂性。
1.5.4 大数据对社会的影响
大数据让生活更便利
大数据让决策更精准
大数据带来新的就业需求
大数据带来新的社会问题
如人们可以通过热力图了解一个区域的人流量及拥挤情况。再如,商家可以了解商务平台上行业宏观情况,并据此进行生产等。
大数据支持动态跟踪与全样本采集,为各种决策提供了第一手的材料,可以帮助管理者及时发现问题,进行干预。
如系统研发工程师,
应用开发工程师,
数据可视化工程师和
数据分析师等。高校
也开设相关专业。
信息泄露,数据安全,个人隐私甚至伦理道德等社会问题。
问题与讨论:
大数据为生活带来便利的同时也带来了安全隐患,各种信息泄露事件时有发生。请结合实例,探讨可能引发信息泄露的原因以及由此产生的危害。我们应该如何预防?
1、骚扰电话、垃圾短信会源源不断;
2、有人冒充他人,报出你的个人信息,然后说最近经常发生诈骗案件;
3、不法分子利用公民个人信息调查婚姻、滋扰民众;
4、不法分子利用非法获取的信息实施电信诈骗、网络诈骗等新型的、非接触式犯罪;
5、不法分子利用非法获取的信息、电话、信件敲诈勒索、恐吓威胁。
6、恶意透支你的信用卡,造成个人信用下降。还会向你身边的亲朋好友们下手,进行各种诈骗。
7、私人照片、视频,被他人恶意发布到网上,造成不良影响。
8、你去哪里消费过、你的工作、你家人的信息等等完全透明
信息泄露的危害
1、不要随意连接公共场合的WiFi,不要使用这样的无线网进行网购,最好能使用自己的手机网络。
2、来路不明的软件不要随便下载。
3、平时我们网购的东西,一定要将快递上的电话、姓名、地址等信息处理后再扔掉。
4、除了快递单,日常还会有些票据单、账单等,最好都是先处理掉相关的个人信息再丢弃。
5、平时,我们的手机会收到各种附带链接的短信,你千万不要点开,否则会导致手机中毒等。
6、手机相册里最好不要保存身份证照片这种个人信息,且尽量不要把人脸识别和身份证照片传到网络中。
7、设置高保密强度密码,不同网站最好设置不同的密码。网银、网购的支付密码最好定期更换。
8、登录各大网站,尽量不要使用“记住密码”模式,上网后注意个人使用记录,下线先清理痕迹。
9、手机、电脑等都需要安装安全软件,经常进行对木马程序的扫描,病毒的查杀。
10、不随意打开陌生邮件,若是看到陌生人发来的邮件千万不能轻易打开,尤其是看到中奖信息的内容。
信息泄露的预防
1. 学生学籍系统中存放着大量的学生数据,这些数据是否属于大数据?为什么?
2. 在处理数据时,往往会选择“抽样数据”或“全样本数据”进行分析,请比较这两种分析方式的特点。
思考与练习
参考答案:
1、首先这属于数据,但并不是大数据。大数据一般的定义为:无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。那么学籍系统符合上面那些吗?明显不符合,首先这类信息是完全格式化的,一般的常规软件就可以进行处理的,更不要提什么更强的决策力和洞察力了,而且也不是多样化的信息而是程式化的信息,所以一般来说该系统中的数据不是大数据。但是学籍系统不是大数据,不代表学生系统不是大数据,所谓的学生系统不仅包含学籍信息,也包含其他信息,比如成绩信息,获奖信息,健康信息(可能包括但不限于)等等,这些都算上才能称的上是大数据。
2、首先,大数据要分析的是全体数据,而不是抽样数据。以往对于某项研究中的数据,限于技术等因素,人们无法进行全样本分析,往往会随机抽取部分样本进行研究,以此推论全体情况。抽样数据分析的方式效率较高,经常被人们采用,但这种方式取决于抽取样本的随机性,在某些情况下,不同的样本可能会得出截然不同的结论。在大数据时代,人们不仅可以获得研究所需的直接数据,而且还能对与之有关联的所有数据进行分析。分析数据已经不再依赖于采样,从而带来更全面的认识,也能更清楚地发现抽样数据无法揭示的详尽信息。
谢 谢!
Thanks!
https://www.21cnjy.com/help/help_extract.php