1.5数据与大数据 课件 2022—2023学年浙教版(2019)高中信息技术必修1(29张PPT)

文档属性

名称 1.5数据与大数据 课件 2022—2023学年浙教版(2019)高中信息技术必修1(29张PPT)
格式 zip
文件大小 6.1MB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2022-09-21 14:41:35

文档简介

(共29张PPT)
手机APP希望获得你的哪些信息?
如果有监听,
获得的数据规模巨大已经很难用传统方式进行处理。
大数据技术应运而生
改变生活
数据与大数据
第一章 1.41.5
大数据
时代
2016年,数据科学家将大数据正式定义为:
大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
阅读书本26-27页,思考:
1、什么是大数据?
2、大数据的特征是什么?
学生学籍系统中存放着大量的学生数据,这些数据是否是属于大数据?为什么?
不是。
1、通常指100 TB( 1TB=1024 GB )规模以上的数据量,数据量大是大数据的基本属性;
2、大数据往往包含多种类型数据;
3、大数据超出以往常用的数据采集、组织、管理和加工等软件的处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。
阅读书本26-27页,思考:
1、什么是大数据?
2、大数据的特征是什么?
身边的大数据应用
安心出行
路线规划
精准推送
广告投放
大数据的特征
Volume
数量
Velocity
速度
Variety
多样
Value
价值
数据体量巨大:
以PB、EB或ZB为计量单位
速度快:
数据产生速度快
数据处理速度快
数据类型多:
结构化、半结构化和非结构化数据共存
价值密度低:
价值大、数量大,可能发挥价值的是非常小的部分
阅读书本26-27页,认识大数据的特征
(存储单位从过去的GB到TB,乃至现在的PB、EB级别。)
大数据的特征
数据体量巨大
1 KB = 1024 B (KB - kilobyte)
1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
传统的个人电脑,处理的数据是GB/TB级;
淘宝网近4亿的会员每天产生的商品交易数据约20TB;
脸书约10亿的用户每天产生的日志数据超过300TB。
数据正在快速增长,根据预测,到2024年全世界每年产生的数据总量将会达到143ZB
(数据产生速度快、数据处理速度快)
大数据的特征
速度快
每天处理过百亿条信息;
每秒峰值几百万条;
数据输入、处理与丢弃立刻见效。
数据的生产和传播速度是非常迅速的
(结构化、半结构化和非结构化数据共存)
大数据的特征
数据类型多
结构化数据,如表格、财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;
非结构化数据,如视频、图片、音频等,其特点是数据间没有因果关系;
半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。
(价值大、数量大,可能发挥价值的是非常小的部分)
大数据的特征
价值密度低
以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。
以小组为单位,讨论 “手机APP是否在‘监听’我们的生活?”这一话题,并派代表发言。
课堂活动
要求:
1.确定发言人;
2.明确记录者;
3.完成汇报单;
4.限时5分钟。
以小组为单位,讨论 “手机APP是否在‘监听’我们的生活?”这一话题,并派代表发言。
课堂活动
1.技术上来说,并不存在于二十四小时能记录你每一句话,然后上传分析,还能智能解读的语音技术;
2.监听手机是属于违法行为;
3.APP只需要向你索要定位,读取联系人、WiFi、相册权限就可以对你进行精准的画像和追踪;
4.读取剪贴板是系统赋予每个APP与生俱来的权利,剪贴板中又透漏出大量信息;
……
手机APP有多种途径获取我们的数据,进而起到“认识”我们的效果
大数据对社会的影响
大数据带来新的社会问题
具备信息安全意识
1、正确使用权限管理,如非必要,建议不要对APP开启手机的全部权限。
2、甄别与远离危险APP,通过正规渠道下载软件;
3、重要资料谨慎留存,避免将身份证、银行卡等证件拍照留存在手机相册中;
4、不同软件尽量不要使用同一组账号密码;
5、妥善处置快递单等包含个人信息的单据;
……
大数据对社会的影响
大数据带来新的社会问题
除手机的使用外,计算机数据管理与安全也需注意!!
2020年,各种新型勒索病毒不断涌现。
勒索病毒,是一种新型电脑病毒,主要以邮件、程序木马、网页挂马的形式进行传播。这种病毒利用各种加密算法对文件进行加密,被感染者一般无法解密,必须拿到解密的私钥才有可能破解。
1.4.1数据管理
文本文件
常见的文件格式
图像文件
声音文件
动画文件
视频文件
文件管理
文本文件:txt;doc;wps;html;pdf
图形像文件:jpg;bmp;gif;psd;png
声音文件:wav;mid;mp3;wma
动画文件:fla;gif;swf
视频文件:avi;mpg;flv;mov
1.4.1数据管理
不要随意打开他人发送的网页链接、可执行程序(exe)或安装未知源的软件。
数据库管理
意义:①解决数据冗余的问题。②解决维护、更新数据时需要大量的人工干预的问题。
1.4.1数据管理
数据管理是利用 计算机硬件 和 软件技术 对数据进行有效 收集 、存储、 和 应用 的过程,其目的在于充分、有效地发挥数据的作用。计算机数据的管理已经经历了 人工管理 、文件管理和 数据库管理 三个阶段。
现代社会数据管理的主要方式——传统数据库技术
(1)基础:基于结构化数据开发。
(2)特点:数据独立性、数据可共享
(3)应用领域:政府、军工、教育、电力、金融、农业、卫生、交通、科技等行业。
1.4.1数据管理
2021年6月3日丘市睢(suī)阳区人民法院在裁判文书网,公开了一份刑事判决书,显示一名住在河南商丘市的本科毕业的大学生逯(lù)某自2019年11月起,对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。。
威胁数据安全的因素
硬盘驱动器损坏、操作失误、黑客入侵、感染计算机病毒、遭受自然灾害……
1.4.2数据安全
保护数据安全的方法
(1)做好防护上的安全
保护存储数据的介质。对于政府部门或企业的数据,目前主要采取主动防护的手段,如通过磁盘列阵、数据备份、异地容灾。
(2)提高数据本身的安全
可通过数据加密、数据校验等方法提高数据的保密性和完整性。
(3)个人保护数据的手段
数据备份;定期杀毒;不访问危险网址;
不打开危险邮件、链接;定期升级系统;安装系统补丁
大数据思维
分析的是全体数据,而不是抽样数据
数据不再追求精确性,而是能够接受数据的混杂性
不一定强调对事物因果关系,而是更加注重相关性
大数据是一场变革, 改变的不仅是数据,还有人们的思维。
大数据分析的是全体数据,而不是抽样数据
全样本数据分析
数据太多,无法保存和分析,统计学采用抽样;
抽样数据能否取得重大成功,依赖于采样的“绝对随机性”。
更加科学地得出结论,分析方法精准、全面;
但存在技术门槛高,数据获取要求高等情况。
抽样数据分析
对于数据不再追求精确性,而是能够接受数据的混杂性
对于传统的数据库,数据有严谨的结构,人们追求数据的准确性,通过各种技术或人工手段,来保证每个数据准确无误。
而在大数据处理过程中,数据的来源多种多样,这些数据可以是结构化的、半结构化的,也可以是非结构化的。当数据量大到一定程度时,个别数据的不准确就显得不那么重要。
不一定强调对事物因果关系,而是更加注重相关性
相关关系通过识别有用的关联物来帮助人们分析一个现象,而不是揭示其内部机理。
如果能够知道因果关系固然也好,但如果能够指导我下一步该做些什么,也就足够了。
大数据对社会的影响
大数据带来新的社会问题
大数据已经渗入到社会的各个层面,不断提高工作效率与生活便利性
大数据让决策更加精准
大数据带来新的就业机会
课堂小结
课堂小结
作业
信息技术作业本
《1.4数据管理与安全》及《1.5数据与大数据》的基础训练部分
改变生活
数据与大数据讨论汇报单
汇报人:
记录员:
组员:
内容:
本小组经过讨论,一致认为:手机APP (是/否)在“监听”我们的生活?
证据如下(请简要概括):
1、
2、
3、
我们认为,手机APP是通过以下途径 (“监听”/“了解”)我们的:
1、
2、
3、
4、
手机APP的使用,我们的总体感受是:
对于手机APP在使用中给部分人带来的恐慌,我们的建议是:
我们小组汇报结束。