5.1认识大数据
一、选择题
1.在当前社会中,最为突出的大数据环境是( )
A.互联网 B.物联网 C.综合国力 D.自然资源
2.下列属于大数据特征的是( )
①数据体量大 ②产生速 度快 ③处理速度慢 ④数据类型多 ⑤价值密度高
A.①②③ B.①②④ C.①②⑤ D.②③④
3.下图为某患者血液化验单,针对该化验单的分析不正确的是( )
A.红色框内的信息表明患者血红蛋白测定数据低于参考值
B.该医院近年来的患者血液化验结果就可以构成医疗大数据
C.蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义
D.医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验
4.下列关于大数据的说法,正确的是( )
A.大数据分析的是抽样数据
B.用大数据进行数据处理时,必须保证每个数据都准确无误
C.大数据的数据来源主要还是人力
D.大数据采集的数据有结构化、半结构化和非结构化的数据类型
5.某大型购物网站收集了用户浏览网站的数据用于广告个性化实时推荐,下列处理方式中合理的是( )
A.应当使用统计分析软件进行数据分析
B.应当选用针对流数据的实时计算
C.应当选用针对图结构数据的图计算
D.应当选用针对静态数据的批处理计算
6.下列关于大数据在电子商务方面的应用,说法错误的是 ( )
A.在交易、营销、供应链、仓储等环节产生了大量数据
B.通过电商平台提供的精准营销服务是基于用户购买行为的大数据
C.在供应链管理中,根据商品销售情况和市场预期数据,依靠推断模型,实现商品自动补货
D.购物网站基于大数据挖掘和分析,变得越来越智慧
7.下列关于大数据处理的说法,错误的是 ( )
A.处理大数据一般采用分治思想 B.数据采集只能收集结构化数据
C.图计算主要针对图数据 D.并行处理能节省复杂问题的处理时间
8.王明用邮箱绑定了某购物平台账号,发现只要在该购物平台浏览过某些商品,邮箱会不定期收到该购物平台推介相关商品。精准推送的实现是基于( )
A.虚拟现实技术 B.微电子技术 C.大数据技术 D.自然语言理解技术
9.下列论据中,能够支撑“大数据无所不能”的观点的是( )
A.互联网金融打破了传统的观念和行为 B.大数据存在泡沫
C.大数据具有非常高的成本 D.个人隐私泄露与信息安全担忧
10.大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征( )
A.种类多(Variety) B.体量大(Volume)
C.风险大(Venture) D.速度快(Velocity)
11.下列关于大数据的描述中,不正确的是( )
A.大数据专指Excel软件收集、加工的数据
B.物联网、云计算、手机、电脑都是数据的来源
C.互联网生成的数据量正以爆发性的速度不断增长
D.在科学实验中,各种传感器每时每刻的速度不断增长
12.从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然( )的计算机进行处理,必须采用分布式架构。
A.单台计算机 B.超运算 C.无法用超运算 D.无法用单台计算机
13.下面属于数据处理方式的是( )。
A.存储 B.挖掘 C.分析 D.以上都是
14.关于大数据在社会综合治理中的作用,以下理解不正确的是( )。
A.大数据的运用能够维护社会治安
B.大数据的运用能够加强交通管理
C.大数据的运用能够杜绝抗生素的滥用
D.大数据的运用有利于走群众路线
15.大数据不是要教机器像人一样思考。相反,它是( )
A.把数学算法运用到海量的数据上来预测事情发生的可能性。
B.被视为人工智能的一部分。
C.被视为一种机器学习。
D.预测与惩罚。
二、判断题
16.微信支付、支付宝支付、滴滴打车等都包含着大数据在生活中的应用。(______)
17.贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术。(______)
18.高德地图根据用户实时上报的交通信息,通过大数据平台整合各种信息,给出相应的路线。 (_____)
19.大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。 (____)
三、填空题
20.大数据是以________大、________多、________快、________高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行________、________和________,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
试卷第2页,共2页
参考答案
1.A
【详解】
本题主要考查大数据的描述。在当前社会中,最为突出的大数据环境是互联网,故本题选A选项。
2.B
【详解】
本题主要考查大数据特征。大数据特征有:数据体量大 、产生速度快、数据类型多、价值密度低,故本题选B选项。
3.B
【详解】
本题考查的是大数据。大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。该医院近年来的患者血液化验结果不属于大数据。故本题应选B。
4.D
【详解】
本题主要考查大数据的描述。在数据基础上倾向于全体数据而不是抽样数据;在分析效果上更追究效率而不是绝对精确;大数据的数据来源主要是互联网;大数据采集的数据有结构化、半结构化和非结构化的数据类型,故本题选D选项。
5.B
【详解】
本题主要考查大数据分析。流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。用于广告个性化实时推荐,应当选用针对流数据的实时计算,故本题选B选项。
6.C
【详解】
本题主要考查大数据的应用。在交易、营销、供应链、仓储等环节产生了大量数据;通过电商平台提供的精准营销服务是基于用户购买行为的大数据;在供应链管理中,根据商品销售情况和市场预期数据,依靠预测模型,实现商品自动补货;购物网站基于大数据挖掘和分析,变得越来越智慧,故本题选C选项。
7.B
【详解】
本题主要考查大数据处理。处理大数据一般采用分治思想;大数据采集的是规模巨大的数据,不局限于结构化数据;图计算主要针对图数据;并行处理能节省复杂问题的处理时间,故本题选B选项。
8.C
【详解】
本题考查的是大数据技术应用。大数据技术是指大数据的应用技术,涵盖各类大数据平台、大数据指数体系等大数据应用技术。精准推送的实现是基于大数据技术。故本题应选C。
9.A
【详解】
本题主要考查大数据。互联网金融打破了传统的观念和行为,使得“大数据无所不能”,在“大数据”的浪潮中,基于社交网络大数据的应用,将会为企业带来更多的收益,推动大数据分析在各行各业中的应用和推广,将会为企业和社会带来“大价值”,故本题选A选项。
10.C
【详解】
本题主要考查大数据特征。大数据的4V特征分别是Volume(大量性)、Velocity(高速性)、Variety(多样性)、Value(价值性),故本题选C选项。
11.A
【详解】
本题主要考查大数据的描述。大数据是指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合,是需要新处理模式才能具有更佳的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产;物联网、云计算、手机、电脑都是数据的来源;互联网生成的数据量正以爆发性的速度不断增长;在科学实验中,各种传感器每时每刻的速度不断增长,故本题选A选项。
12.D
【详解】
本题主要考查大数据相关知识点。技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台计算机的计算机进行处理,必须采用分布式架构。故本题选D选项。
13.D
【详解】
本题考查的是数据处理。数据处理是对数据的采集、存储、检索、加工、变换和传输。常见的数据处理方式有:存储、挖掘、分析。故选项D正确。
14.C
【详解】
本题考查大数据的运用
大数据的运用能够维护社会治安、能够加强交通管理、有利于走群众路线,但不能够杜绝抗生素的滥用。故本题选C选项
15.A
【详解】
本题考查的是大数据。数据或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。把数学算法运用到海量的数据上来预测事情发生的可能性,选项A正确;大数据不是人工智能的一部分,故选项B错误;不是一种机器学习,故选项C错误;大数据不能惩罚,故选项D错误。
16.正确
【详解】
本题考查的是大数据在生活中的应用。微信支付、支付宝支付、滴滴打车等都包含着大数据在生活中的应用。题干描述正确。
17.正确
【详解】
本题主要考查大数据分析。贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术,表述正确。
18.对
【详解】
本题主要考查大数据的应用。高德地图根据用户实时上报的交通信息,通过大数据平台整合各种信息,给出相应的路线,这正是大数据的优势。因此本题说法正确。
19.对
【详解】
本题考查的是大数据。大数据指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据对我们的意义在于,我们有可能从如此庞大的数据中挖掘出有价值的数据,并运用于管理、农业、金融、医疗和教育等各个社会领域,为社会发展服务。题干中的说法正确。
20.容量 类型 存取速度 应用价值 采集 存储 关联分析
【详解】
本题考查的是大数据相关知识。大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
答案第4页,共4页
答案第3页,共4页