(共35张PPT)
主题一 任务三
数据分析与处理
(桂科2025版)八年级
下
1
核心素养目标
3
活动目标
5
练习提升
7
拓展延伸
2
新知导入
4
新知讲解
6
开拓视野
活动日志
8
01
核心素养目标
信息意识
计算思维
数字化学习与创新
信息社会责任
知晓数据错误后果,处理时保留备份,可视化避免误导,养成严谨修正习惯。
按数据量选工具(表格/Python),匹配图表类型分析规律,尝试动态可视化。
掌握排序、筛选和函数处理数据,拆解操作步骤,理解编程处理效率优势。
识别数据异常类型(缺失、重复等),理解数据质量影响,主动验证来源可靠性。
02
新知导入
在我看来,计算机计算机依靠传感器来接收外界的信息。就像我们的眼睛和耳朵一样,传感器可以感知光、声音、温度、压力等各种物理量,并将这些信息转化为电信号。例如,摄像头就是一种图像传感器,它可以将外界的图像转化为数字信号,让计算机能够处理和分析。编码就像是一个神秘的密码世界。它虽然看不见摸不着,却在计算机的世界里起着非常重要的作用。
壮壮经过一段时间的数据采集测试,已经在物联网服务平台存储了不少数据。有了基础数据的支持,壮壮准备开始进行数据处理和分析。
02
新知导入
为什么表格里同样的温度值要标记成红色?
这是用‘高亮重复项’功能标记的重复数据,可能是传感器重复上传导致的,需要检查设备是否故障或删除多余数据。
02
新知导入
思考
为什么光照强度要用折线图,不用柱状图?
在我看来,计算机计算机依靠传感器来接收外界的信息。就像我们的眼睛和耳朵一样,传感器可以感知光、声音、温度、压力等各种物理量,并将这些信息转化为电信号。例如,摄像头就是一种图像传感器,它可以将外界的图像转化为数字信号,让计算机能够处理和分析。编码就像是一个神秘的密码世界。它虽然看不见摸不着,却在计算机的世界里起着非常重要的作用。
折线图能清晰展示光照强度随时间变化的趋势,比如早中晚的强弱变化;柱状图更适合对比不同日期的总光照量,根据分析目标选择图表类型。
02
新知导入
在我看来,计算机计算机依靠传感器来接收外界的信息。就像我们的眼睛和耳朵一样,传感器可以感知光、声音、温度、压力等各种物理量,并将这些信息转化为电信号。例如,摄像头就是一种图像传感器,它可以将外界的图像转化为数字信号,让计算机能够处理和分析。编码就像是一个神秘的密码世界。它虽然看不见摸不着,却在计算机的世界里起着非常重要的作用。
物联网传感器采集的数据中,同一时间出现重复温度值可能是设备故障或传输错误导致的异常情况。
电子表格的“高亮重复项”功能可以快速标记出光照强度数据中的重复记录,方便后续清洗。
02
新知导入
讨论
回想一下,你在学习和生活中曾使用过哪些数据处理工具?和同学们交流、分享,并查阅相关资料,将常见数据处理工具的用途和应用场景填入表1-3-1中。
03
新知讲解
工具名称 用途/特点 应用场景
打字机 一种传统的文档输入设备,适用于处理文本数据,如信件、报告、小说等 办公室文档处理、文学作品创作
Excel 电子表格软件,可进行数据计算、图表制作和简单分析。 班级成绩统计、零花钱收支记录。
做中学
从物联网服务平台获取数据
1. 登录物联网服务平台,进入相应的主题管理页面,点击“查看详情”,下载所需数据文件,如图 1-3-1所示。
03
新知讲解
做中学
2. 将数据以“.csv”文件格式下载到本地(见图1-3-2),直接用数据处理软件进行编辑。
03
新知讲解
思考
物联系统的原始数据量通常较大,难免会出现数据异常。结合你从物联网服务平台获取的数据文件,说一说可能会存在哪些数据异常情况。
03
新知讲解
数据缺失:比如温度或湿度数据中出现整行空白,可能因为传感器故障或传输中断,导致无法分析某段时间的变化。
数据重复:同一时间记录了两个相同的温度值(如“25℃”),可能是设备重复上传,若不处理会影响平均值计算。
数据格式错误:日期列既有“2024-03-01”又有“3/1/24”,格式混乱会导致排序错误,把“3/1”当成3月1日或1月3日。
不合理值:光照强度出现负数(如“-500”)或极大值(如“99999”),可能是传感器损坏或数据采集错误。
小贴士
1. 数据缺失数据集中某些记录的某些字段没有值。数据缺失的原因有多种,例如数据收集过程中的遗漏、录入错误,数据存储或传输过程中的损坏等。
2. 数据重复。数据集中存在两条或多条记录完全相同,或者在关键字段上相同。数据重复可能是由于数据收集过程中的重复操作、录入错误,或者是数据处理过程中的错误行为造成的。
03
新知讲解
小贴士
3. 数据格式错误。数据集中的数据没有遵循预定的格式规范。例如,日期可能被记录为“01/02/03”而不是“2003-02-01”;电话号码可能缺少国家代码或分隔符;数字数据被错误地存储为文本格式等。
03
新知讲解
做中学
利用数据处理工具处理文件数据异常
1. 用电子表格软件打开数据文件,选中“数据”列(见图1-3-3)。
03
新知讲解
做中学
2. 先后点击“数据”选项下的“排序”和“重复项”按钮,对“数据”列的数据(温度值)进行升序或降序排列,并将重复的数据设置为高亮显示,如图1-3-4所示。
03
新知讲解
做中学
3. 得到处理后的数据如图1-3-5所示,方便进一步分析温度随时间变化的规律。
03
新知讲解
马上行动
结合你从物联网服务平台获取的其他数据文件,完成下列操作练习,并将练习过程中运用的公式、方法记录下来。
1.使用筛选功能和函数公式选出光照强度大于或等于 1000 的数据。
2.用函数公式求出土壤湿度的平均值。
03
新知讲解
马上行动
1. 选出光照强度≥1000的数据
点击光照强度列的标题(比如B列)。
点击菜单栏的 数据 → 筛选。
点击B列的下拉箭头 → 选 数字筛选 → 大于或等于 → 输入“1000” → 确定。
2. 求土壤湿度的平均值
公式直接计算:在空白单元格(比如E1)输入公式:=AVERAGE(D2:D50)(假设D2到D50是土壤湿度数据)
按回车键,直接显示平均值。
03
新知讲解
思考
在练习过程中,你发现处理数据的操作有哪些共同点?试着进行总结。
03
新知讲解
先整理后分析:都要先排序、筛选或检查数据,把杂乱的信息理顺(比如标出重复值),再计算或画图。
用公式代替手工:像算平均值用AVERAGE、标数据用IF,让电脑自动处理,比手写快还准。
统一规则:处理前先定好标准,比如日期格式统一、筛选条件一致,避免结果混乱。
总结:整理数据→用工具快速处理→按规则检查,保证结果可靠。
讨论
回想以往的学习经历和生活经验,平时常见的数据分析思路有哪些?分别适用于哪些场景?小组成员相互讨论,将讨论的结果记录下来并在班里进行分享。
03
新知讲解
主题:常见数据分析思路及适用场景
比大小(对比分析)场景:运动会排名、班级成绩对比。方法:用柱状图,一眼看出谁高谁低。
看变化(趋势分析):场景:每月零花钱、一周气温记录。方法:用折线图,连线观察升降趋势。
算占比(占比分析):场景:家庭开支分类、时间分配。方法:用饼图,快速看出哪部分最大。
找问题(异常值分析):场景:实验数据误差、传感器异常。方法:排序后检查过大/过小值,判断是否合理。
小贴士
1. 统计分析法:一种通过搜集、整理和分析数据来了解数据特征和规律的方法。它主要关注数据的集中趋势(如平均值)、离散程度(如最大值、最小值、数据的波动范围)等方面。
2. 对比分析法:一种将两个或多个相关的数据集合进行比较,找出它们之间的相同点和不同点的方法。
3. 分组分析法:一种根据某个特定的标准(如位置、时间等)将数据分成不同的组别然后分别对每组数据进行分析的方法。
03
新知讲解
任务拓展
数据处理工具五花八门,除了常用的电子表格软件,编程语言也是高效处理大量数据的工具之一。请你分别通过电子表格软件和编程的方式处理和分析同一个数据文件,比较两种工具处理和分析数据的优缺点。
03
新知讲解
任务拓展
03
新知讲解
电子表格软件 vs 编程语言(Python)
电子表格(如Excel)
优点:简单直观,点鼠标就能排序、筛选、画图,适合小数据(如班级成绩表)。
缺点:数据量太大(如全校1000人成绩)会卡顿,重复操作(如每月整理数据)麻烦。
编程(如Python)
优点:处理超大数据(如全市学生成绩)速度快,能自动批量清洗、分析(如一键修正所有错误格式)。
缺点:要学代码基础,第一次写程序可能报错,不如点鼠标直接。
总结:数据少、任务简单 → 用电子表格(快!)。数据多、任务重复 → 学编程(一劳永逸!)。
例子对比:整理一个班40人的成绩单:Excel 10分钟搞定。
整理全校1000人的数据:Python 1分钟跑完,Excel可能卡死。
04
拓展延伸
数据可视化基础原理
图形语言的力量:
用视觉元素代替数字表格,让人脑快速捕捉数据规律。
图表类型选择法则:
折线看趋势、柱状比大小、饼图显占比,匹配场景是关键。
04
拓展延伸
数据可视化基础原理
颜色与对比的艺术:
通过色阶、明暗区分数据层级,避免花哨配色干扰信息传递。
数据-图形映射逻辑:
将抽象数值转化为具象图形(如温度→颜色深浅),建立直观认知桥梁。
04
拓展延伸
数据可视化基础原理
简洁性原则:
删减冗余元素,聚焦核心信息,避免“过度设计”掩盖真相。
动态交互延伸:
通过筛选、缩放功能,让静态图表变身可探索的数据故事。
07
活动日志
活动日志 班级:XX 姓名:XX 活动名称 数据分析与处理
活动环节 1了解数据处理工具 口 2掌握处理与分享方法 口
(在对应环节画V)
活动完成内容 完成利用数据处理工具处理文件数据异常
活动完成度 口口口口口口口口口(100%)
活动小结 问题与反思:语法错误、编辑错误。
改进的方法:加强对数据异常的理解。
08
板书设计
数据分析与处理
1.进行新知引入
2.了解数据处理工具
3.掌握灵活处理和分析温度数据
4.完成课堂练习
5.进行知识拓展
09
课后作业
01
根据本课内容,和同学们讨论常用分析工具的特点。
09
课后作业
02
学完本节课,尝试对简单的物联网数据进行分析。
09
课后作业
1、物联网传感器采集的数据中,同一时间记录了两个相同的温度值,这属于哪种异常类型?( )
A. 数据重复 B. 数据缺失 C. 数据格式错误 D. 数据篡改
2、用电子表格处理数据时,想要快速找出光照强度≥1000的数据,最适合的操作是( )
A. 手动逐行查找 B. 使用“升序排序”功能 C. 设置筛选条件或输入公式 D. 删除所有小于1000的数据
3、分析一周内温度随时间变化的规律,最合适的图表类型是( )
A. 饼图 B. 折线图 C. 柱状图 D. 散点图
4、数据格式错误的例子是( )
温度值为“25”和“26” B. 日期列为“2024-03-01”和“2024-03-02”
C. 光照强度为“800”和“900” D. 日期列为“2024-03-01”和“March 1, 2024”
C
A
B
D
09
课后作业
6、请描述处理物联网平台下载的温度数据文件时,发现“日期”列格式混杂(如“2024-03-01”和“3/1/24”),应如何修正并说明理由。
7、所有数据缺失的情况都必须删除整行数据。( )
8、柱状图适合展示不同日期的温度对比,折线图适合显示温度变化趋势。( )
9、物联网数据量大时,用电子表格处理比编程语言更高效。( )
统一格式:将日期全部转换为标准格式(如“YYYY-MM-DD”),避免排序或计算错误。
使用电子表格工具:通过“分列”功能拆分混乱格式,或用函数(如TEXT)重新格式化。
检查修正结果:确保转换后所有日期格式一致,无遗漏或转换错误。
错
对
错
https://www.21cnjy.com/recruitment/home/fine