(共10张PPT)
3.1 数据处理的一般过程
3.1.1 数据处理
数据处理一般指对数据进行采集、整理、分析和可视化表达的过程。
数据采集可为数据处理准备必要的数据。
用一定的方法对收集来的数据进行整理、分析,提取有用信息,形成结论,可以指导决策。
借助数据可视化呈现方式能够更好地表达数据所蕴含的信息。
3.1.2 数据处理的过程
1.数据采集
2.数据整理
3.数据分析
4.数据呈现
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
1.下列关于数据整理的说法,正确的是( )
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
习 题
C
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
2.以下关于数据整理,错误的是( )
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
习 题
D
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
3.在数据整理中2020/2/30属于数据问题中的( )
A.数据缺失
B.数据事复
C.逻辑错误
D.格式不一致
习 题
C
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
4.数据处理的一般过程是明确目标数据采集、数据加工、数据分析及数据可视化。( )
5.随着时代的发展,各行各业需要处理的的数据量快速增长,人工处理大量数据的效率与用计算机处理大量致据相比较,人工处理效率正变得( )。
A.更高 B.更低 C.一样 D.无法比较
习 题
×
B
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
6.下列关于数据整理目的的描述,错误的是( )
A.减少数据量
B.检测和修正错漏的数据
C.整合数据资源
D.提高数据质量
习 题
A
1.下列关于数据整理的说法,正确的是()
A.数据集中的缺失值一般用任意值填充
B.数据集中的异常数据须直接删除或忽略
C.数据集中的重复数据可进行合并或删除
D.数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
2.以下关于数据整理,错误的是()
A.数据的重复值会导致数据分布变化
B.数据的缺失值会导致样本信息减少
C.数据的异常值增加了分析的难度
D.数据整理的科学与否对数据分析的影响不大
P90 练习提升
第1题:本习题旨在帮助学生熟悉数字化学习工具并了解数据处理的一般过程,因此调查方案中应涉及数据采集、整理、分析和呈现等环节,并体现每个环节可能用到的数字化学习工具等。例如,调查方案中可以设计数据采集方面的任务,用于调查学生对实现数据采集的网络爬虫工具的了解情况。
第2题:①需要处理的网络学习行为数据包括“人与人”的交互,“人与内容”的交互等方面的数据。例如,浏览教学资源、电子笔记、下载保存、实时交流、提交作业、作品发布等网络学习行为数据。②可以通过保护个人网络学习账号的安全来保护个人隐私数据。例如,设置安全性较强的密码,不要将个人账号转借他人等。