08 大数据及处理应用 巩固练习 浙教版(2019)高中信息技术选考(学考)一轮复习(含答案)

文档属性

名称 08 大数据及处理应用 巩固练习 浙教版(2019)高中信息技术选考(学考)一轮复习(含答案)
格式 zip
文件大小 56.7KB
资源类型 教案
版本资源 浙教版(2019)
科目 信息技术(信息科技)
更新时间 2022-09-21 17:44:04

文档简介

数据处理与应用大单元
——大数据处理与应用巩固练习
班级 姓名
1.下列关于大数据思维的说法,错误的是( )
A.大数据要分析的是全体数据 B.大数据追求数据的精确性
C.大数据注重事物之间的相关性 D.大数据能够接受数据的混杂性
2.下列关于大数据的说法错误的是( )
A.更注重事物的相关性而不是因果关系
B.不再追求个别数据的精确性,允许数据混杂
C.速度快是大数据的特征之一,仅指数据的产生速度快
D.大数据要分析的是全体数据,而不是抽样数据
3.下列关于大数据的描述中,不正确的是( )
A.某学校的高考报名数据属于大数据
B.处理大数据时,一般采用分治思想
C.大数据的速度快不仅指数据产生的速度快,还指数据处理的速度快
D.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构
4.同一小区中发现有新冠病例,其他住户的健康码马上会变色,这主要得意于( )
A.数据体量大 B.价值密度高 C.数据处理的速度快 D.数据产生的速度快
5.谷歌开发了一个名为“谷歌流感”的工具,其原理为,对所有使用搜索引擎搜索如温度计、流感症状、肌肉疼痛、胸闷等关键词的用户展开追踪分析,创建大数据流感地图,进行相关性预测。综合上述事例,大数据分析注重的是( )
A.精确性 B.相关性 C.必然性 D.因果关系
6.有关部门使用大数据技术,进行疫情防控,有关大数据的说法不正确的是( )
A.相关机构实时采集各地相关数据,每天发布疫情数据,用到了大数据技术
B.大数据要分析的是全体数据
C.超市、商场、医院等场所,使用手持设备测量入场人员体温,使用了大数据技术
D.有群众没有去过疫情中高风险地区,也未接触过确诊病例,但健康码变色了,说明大数据允许个别不准确数据存在
7.关于大数据思维的描述,下列不正确的是( )
A.大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值
B.价值密度低是大数据特征之一,价值密度的高低与数据总量的大小成正比
C.大数据要分析的是全体数据,而不是抽样数据
D.大数据更关注事物的相关性而不是因果关系
8.关于大数据处理,下列说法不正确的是( )
A.处理大数据时,一般采用分治思想
B.数据的可视化可以帮助用户更快捷观察与追踪数据
C.文本数据处理时需要将非结构化的文本原始状态转化成结构化数据
D.对图结构的数据一般采用流计算模式进行处理
9.有关部门使用大数据技术,进行疫情防控,有关大数据的说法不正确的是( )
A.相关机构实时采集各地相关数据,每天发布疫情数据,没有用到大数据技术
B.大数据要分析的是个别具体数据
C.超市、商场、医院等场所,使用手持设备测量入场人员体温,使用了传感技术而没有用到大数据技术
D.部分群众没有去过疫情中高风险地区,也未接触过确诊病例等,但健康码变色了,说明大数据处理技术还十分不成熟
10.下列关于大数据的描述,正确的是( )
A.处理大数据的基本思路是分治的思想
B.Hadoop、Spark 适用于实时数据的流计算
C.大数据蕴含巨大价值,故价值密度相对较高
D.大数据因数据体量大,只能抽样处理
11.下列关于大数据的说法,正确的是( )
A.大数据包括静态数据、流数据两种类型
B.大数据蕴含着巨大的价值,但其价值密度较低
C.分布式数据库 HBase 主要用来存储结构化数据
D.大数据给生活带来便利,也让用户的个人隐私受到更好的保护
12.在抗击疫情的战斗中,大数据充分发挥了其数据量大、速度快、类型多等优势,特别是在对密切接触者的判断和查找中发挥了巨大的作用,下列发现密切接触者的场景中没有体现大数据的是( )
A.利用手机基站获取的定位信息
B.利用药店纸质登记的个人信息
C.利用购票、乘车信息获取的出行信息
D.利用人脸识别获取进出商店的人员信息
13.下列应用的数据属于图计算处理的是( )
A.某传染病的传播路径
B.高速公路每时每刻的车流量
C.购物网站的广告推荐
D.已经搜集的某商品的月成交额
14.下列选项中,哪个不是大数据的典型应用( )
A.基于交易大数据分析用户的购买习惯
B.基于搜索引擎的搜索关键词分析社会热点
C.基于道路摄像头、地感线圈等数据分析城市交通情况
D.基于科技文献数据库检索某一领域研究进展
15.下列有关大数据及其处理的说法,错误的是( )
A.大数据的四个特征:数据规模大、处理速度快、数据类型多、价值密度低
B.对大数据进行处理时,必须保证每个数据都准确无误
C.批处理计算适合处理静态数据
D.流计算适合处理实时更新的数据
16.下列关于Hadoop架构的描述正确的是( )
A.不能运行于大规模计算机集群上
B.采用NTFS文件系统管理数据文件
C.是一个对大数据进行聚合式处理的基础软件框架
D.采用MapReduce编程模型处理大规模数据集
17.无人驾驶汽车能够收集周围地形的相关信息,并能快速作出行驶决策,主要体现了大数据的哪一特征( )
A.大数据收集和分析的数据量非常大 B.数据处理的速度快
C.大数据的数据来源多 D.大数据的价值密度相对较低
18.关于大数据与人工智能,下列说法正确的是( )
A.大数据的体量越大,价值密度就越高
B.深度学习是对原始数据所蕴含和特征模式进行学习的算法模型
C.大数据实现商品个性化推荐的过程中,首先需要从数据中分析出人们购买商品的原因
D.Hadoop的设计初衷是面向实时处理的流数据
19.目前,云盘和网盘的底层一般采用( )实现
A.分布式并行计算模型 MapReduce B.分布式文件系统 HDFS
C.分布式数据库 Hbase D.流计算
20.有关大数据的文本数据处理,下列说法正确的是( )
A.jieba 模块的分词算法属于基于统计的分词方法
B.大数据文本情感分析是电脑将自己的情感表现出来
C.文本处理过程中一般先进行数据分析,再分词、提取特征,最后呈现结果
D.标签云一般根据词频表现文本特征,以文字大小代表词语的重要性
21.下列关于中文分词方法的描述中,属于基于统计的分词方法的是( )
A.在分析句子时与词典中的词语进行对比,词典中出现的就划分为词
B.依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词
C.让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词
D.依据词语与词语之间的空格进行分词
022 年的北京冬奥会,我国取得了历史最好成绩,人工智能技术也以科技手段助运动员们一臂之力。研究团队利用基于深度学习原理的人工智能技术,建立神经网络模型,实现对动作视频中人体关节点的计算机自动识别,进而建立起适用于竞技体育和一般生物力学研究的计算机系统——无反光点人体运动自动捕捉人工智能系统。目前该系统已应用在国家速度滑冰和越野滑雪项目的训练中,获得超过 8000 人次的赛时动作技术数据,使机器深度学习越发"得心应手",对于滑冰与滑雪运动员的动作捕捉与技术分析,既能精准到具体细节,又能快速反馈分析结果。
请回答第22和23题。
22.根据以上描述,下列说法不正确的是( )
A.随着获取的动作数据逐渐增加,该技术对于数据的反馈会更有效
B.该技术主要体现动作与结果的关系,说明大数据更注重事物之间的相关性
C.该技术捕捉到的每一个数据都来自于真实数据,体现了大数据价值密度高的特点
D.能根据动作自动捕捉进行分析,并快速反馈分析结果,体现了大数据速度快的特点
23.根据以上描述,人工智能技术助力运动员主要基于以下哪种方法( )
A.符号主义 B.联结主义 C.行为主义 D.建构主义
24.下列对关于大数据和人工智能的说法正确的是( )
A.大数据肯定可以用Hadoop来处理
B.对图结构的数据,一般采用流计算模式进行处理
C.扫地机器人在运动中不断从环境学习,属于行为主义人工智能
D.达芬奇外科手术机器人,属于领域人工智能
25.下列说法正确的是( )
A.HDFS 是一个容错性较低的系统,适合部署在廉价的机器上
B.MapReduce 是一种聚合式的并行编程模型
C.Twitter 架构实现了批处理系统与流计算在一个平台架构下的整合
D.标签云是通过给特征词赋予权重进行统计分析
26.下列说法正确的是( )
A.文本数据处理时可以通过特征提取提高文本处理的速度和效率
B.学生选课系统中存放的大量数据属于大数据
C.大数据要求所有处理的数据都是精确的
D.领域人工智能指智能系统从一个领域快速跨越到另外一个领域数据处理与应用大单元
——大数据处理与应用巩固练习
班级 姓名
1.下列关于大数据思维的说法,错误的是( B )
A.大数据要分析的是全体数据 B.大数据追求数据的精确性
C.大数据注重事物之间的相关性 D.大数据能够接受数据的混杂性
2.下列关于大数据的说法错误的是( C )
A.更注重事物的相关性而不是因果关系
B.不再追求个别数据的精确性,允许数据混杂
C.速度快是大数据的特征之一,仅指数据的产生速度快
D.大数据要分析的是全体数据,而不是抽样数据
3.下列关于大数据的描述中,不正确的是( A )
A.某学校的高考报名数据属于大数据
B.处理大数据时,一般采用分治思想
C.大数据的速度快不仅指数据产生的速度快,还指数据处理的速度快
D.Hadoop是一个可运行于大规模计算机集群上的分布式系统基础架构
4.同一小区中发现有新冠病例,其他住户的健康码马上会变色,这主要得意于( C )
A.数据体量大 B.价值密度高 C.数据处理的速度快 D.数据产生的速度快
5.谷歌开发了一个名为“谷歌流感”的工具,其原理为,对所有使用搜索引擎搜索如温度计、流感症状、肌肉疼痛、胸闷等关键词的用户展开追踪分析,创建大数据流感地图,进行相关性预测。综合上述事例,大数据分析注重的是( B )
A.精确性 B.相关性 C.必然性 D.因果关系
6.有关部门使用大数据技术,进行疫情防控,有关大数据的说法不正确的是( C )
A.相关机构实时采集各地相关数据,每天发布疫情数据,用到了大数据技术
B.大数据要分析的是全体数据
C.超市、商场、医院等场所,使用手持设备测量入场人员体温,使用了大数据技术
D.有群众没有去过疫情中高风险地区,也未接触过确诊病例,但健康码变色了,说明大数据允许个别不准确数据存在
7.关于大数据思维的描述,下列不正确的是( B )
A.大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值
B.价值密度低是大数据特征之一,价值密度的高低与数据总量的大小成正比
C.大数据要分析的是全体数据,而不是抽样数据
D.大数据更关注事物的相关性而不是因果关系
8.关于大数据处理,下列说法不正确的是( D )
A.处理大数据时,一般采用分治思想
B.数据的可视化可以帮助用户更快捷观察与追踪数据
C.文本数据处理时需要将非结构化的文本原始状态转化成结构化数据
D.对图结构的数据一般采用流计算模式进行处理
9.有关部门使用大数据技术,进行疫情防控,有关大数据的说法正确的是( C )
A.相关机构实时采集各地相关数据,每天发布疫情数据,没有用到大数据技术
B.大数据要分析的是个别具体数据
C.超市、商场、医院等场所,使用手持设备测量入场人员体温,使用了传感技术而没有用到大数据技术
D.部分群众没有去过疫情中高风险地区,也未接触过确诊病例等,但健康码变色了,说明大数据处理技术还十分不成熟
10.下列关于大数据的描述,正确的是( A )
A.处理大数据的基本思路是分治的思想
B.Hadoop、Spark 适用于实时数据的流计算
C.大数据蕴含巨大价值,故价值密度相对较高
D.大数据因数据体量大,只能抽样处理
11.下列关于大数据的说法,正确的是( B )
A.大数据只包括静态数据、流数据两种类型
B.大数据蕴含着巨大的价值,但其价值密度较低
C.分布式数据库 HBase 主要用来存储结构化数据
D.大数据给生活带来便利,也让用户的个人隐私受到更好的保护
12.在抗击疫情的战斗中,大数据充分发挥了其数据量大、速度快、类型多等优势,特别是在对密切接触者的判断和查找中发挥了巨大的作用,下列发现密切接触者的场景中没有体现大数据的是( B )
A.利用手机基站获取的定位信息
B.利用药店纸质登记的个人信息
C.利用购票、乘车信息获取的出行信息
D.利用人脸识别获取进出商店的人员信息
13.下列应用的数据属于图计算处理的是( A )
A.某传染病的传播路径
B.高速公路每时每刻的车流量
C.购物网站的广告推荐
D.已经搜集的某商品的月成交额
14.下列选项中,哪个不是大数据的典型应用( D )
A.基于交易大数据分析用户的购买习惯
B.基于搜索引擎的搜索关键词分析社会热点
C.基于道路摄像头、地感线圈等数据分析城市交通情况
D.基于科技文献数据库检索某一领域研究进展
15.下列有关大数据及其处理的说法,错误的是( B )
A.大数据的四个特征:数据规模大、处理速度快、数据类型多、价值密度低
B.对大数据进行处理时,必须保证每个数据都准确无误
C.批处理计算适合处理静态数据
D.流计算适合处理实时更新的数据
16.下列关于Hadoop架构的描述正确的是( D )
A.不能运行于大规模计算机集群上
B.采用NTFS文件系统管理数据文件
C.是一个对大数据进行聚合式处理的基础软件框架
D.采用MapReduce编程模型处理大规模数据集
17.无人驾驶汽车能够收集周围地形的相关信息,并能快速作出行驶决策,主要体现了大数据的哪一特征( B )
A.大数据收集和分析的数据量非常大 B.数据处理的速度快
C.大数据的数据来源多 D.大数据的价值密度相对较低
18.关于大数据与人工智能,下列说法正确的是( B )
A.大数据的体量越大,价值密度就越高
B.深度学习是对原始数据所蕴含和特征模式进行学习的算法模型
C.大数据实现商品个性化推荐的过程中,首先需要从数据中分析出人们购买商品的原因
D.Hadoop的设计初衷是面向实时处理的流数据
19.目前,云盘和网盘的底层一般采用( B )实现
A.分布式并行计算模型 MapReduce B.分布式文件系统 HDFS
C.分布式数据库 Hbase D.流计算
20.有关大数据的文本数据处理,下列说法正确的是( D )
A.jieba 模块的分词算法属于基于统计的分词方法
B.大数据文本情感分析是电脑将自己的情感表现出来
C.文本处理过程中一般先进行数据分析,再分词、提取特征,最后呈现结果
D.标签云一般根据词频表现文本特征,以文字大小代表词语的重要性
21.下列关于中文分词方法的描述中,属于基于统计的分词方法的是( B )
A.在分析句子时与词典中的词语进行对比,词典中出现的就划分为词
B.依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词
C.让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词
D.依据词语与词语之间的空格进行分词
022 年的北京冬奥会,我国取得了历史最好成绩,人工智能技术也以科技手段助运动员们一臂之力。研究团队利用基于深度学习原理的人工智能技术,建立神经网络模型,实现对动作视频中人体关节点的计算机自动识别,进而建立起适用于竞技体育和一般生物力学研究的计算机系统——无反光点人体运动自动捕捉人工智能系统。目前该系统已应用在国家速度滑冰和越野滑雪项目的训练中,获得超过 8000 人次的赛时动作技术数据,使机器深度学习越发"得心应手",对于滑冰与滑雪运动员的动作捕捉与技术分析,既能精准到具体细节,又能快速反馈分析结果。
请回答第22和23题。
22.根据以上描述,下列说法不正确的是( C )
A.随着获取的动作数据逐渐增加,该技术对于数据的反馈会更有效
B.该技术主要体现动作与结果的关系,说明大数据更注重事物之间的相关性
C.该技术捕捉到的每一个数据都来自于真实数据,体现了大数据价值密度高的特点
D.能根据动作自动捕捉进行分析,并快速反馈分析结果,体现了大数据速度快的特点
23.根据以上描述,人工智能技术助力运动员主要基于以下哪种方法( B )
A.符号主义 B.联结主义 C.行为主义 D.建构主义
24.下列对关于大数据和人工智能的说法正确的是( C )
A.大数据肯定可以用Hadoop来处理
B.对图结构的数据,一般采用流计算模式进行处理
C.扫地机器人在运动中不断从环境学习,属于行为主义人工智能
D.达芬奇外科手术机器人,属于领域人工智能
25.下列说法正确的是( C )
A.HDFS 是一个容错性较低的系统,适合部署在廉价的机器上
B.MapReduce 是一种聚合式的并行编程模型
C.Twitter 架构实现了批处理系统与流计算在一个平台架构下的整合
D.标签云是通过给特征词赋予权重进行统计分析
26.下列说法正确的是( A )
A.文本数据处理时可以通过特征提取提高文本处理的速度和效率
B.学生选课系统中存放的大量数据属于大数据
C.大数据要求所有处理的数据都是精确的
D.领域人工智能指智能系统从一个领域快速跨越到另外一个领域
同课章节目录