第1章 认识数据与大数据
一、选择题
1.十进制数124转换成二进制数是( ) 。
A.1111010 B.1111100 C.1011111 D.1111011
2.十进制正整数n转换为二进制数,该二进制数末位是“1”。下列说法正确的是( )
A.无法确定n是奇数还是偶数
B.若该二进制数的位数是4,转换为十六进制后n的最小值是A
C.n与n+1分别转换为二进制数,这两个二进制数的位数可能不同
D.该二进制数末位的“1”去掉后,再转换为十进制数,所得的值是(n/2)-1
3.某大型购物网站收集了用户浏览网站的数据用于广告个性化实时推荐,下列处理方式中合理的是( )
A.应当使用统计分析软件进行数据分析
B.应当选用针对流数据的实时计算
C.应当选用针对图结构数据的图计算
D.应当选用针对静态数据的批处理计算
4.关于数制的说法,正确的是( )
A.二进制数1111001转换为十六进制数是F1
B.最大的7位二进制数转换为十进制数是128
C.若十六进制数n末位为9,则十六进制数n+1末位是0
D.若在一个十六进制数的末尾补1个0,则新数是原数16倍
5.大数据改变的不仅是数据,还有人们的思维。针对于此,以下描述正确的是( )。
A.大数据要分析的是抽样数据 B.不接受数据的混杂性
C.强调对事物因果关系的探究 D.更加注重事物的相关性
6.将下列的数转换为二进制,包含“1”的个数最多的是( )
A.32H B.31D C.A0H D.256D
7.下列有关数据、信息的描述不正确的是( )
A.“0.618”是数据
B.数据的价值往往取决于其所承载的信息
C.信息是不能独立存在的,必须依附于一定的载体
D.数据是指所有能输入到计算机并被计算机程序处理的符号总称
8.在ASCII码表中,字符“a”的ASCII码值是97,字符“A”的ASCII码值是( )。
A.65 B.97 C.102 D.107
二、简答题
9.一篇文章有1024个汉字组成(不包括空格、标点符号等),每个汉字均采用24×24点阵的汉字字形码表示,本篇文章全部的汉字字形码将占用多少KB?
10.什么是ASCII码和Unicode码?
三、操作题
11.哈夫曼编码:哈夫曼编码(Huffman Coding),又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,也称霍夫曼(Huffman)编码。
霍夫曼编码的基本方法是先对数据(如:文章)扫描一遍,计算出各数据元素(文字)出现的概率,按概率的大小指定不同长度的唯一码字,由此得到的一张霍夫曼码表。
如:某文章只包含了“我”、“爱”、“中”、“国“四个字,它们出现的概念分别为0.125、0.125、0.2、0.3,那么它们的编码可以分别设为1000、1001、101和11。
问题:
(1)计算机科学中,数据编码是将数据转换为几进制数?
(2)如果不采用哈夫曼编码,你知道还有哪些汉字编码系统?
(3)你能把四个汉字的哈夫曼码转换为十进制数吗?
四、判断题
12.向新冠肺炎防疫人员出示健康码,属于信息的发布。(_______)
13.图结构中数据元素是多对多的关系。(_____)
14.计算机模拟实验也称作“干式实验”,不但节约器材费,而且更为有效,并能解除进行某些真正实验所具有的危险性和不可能性。(______)
15.关于新冠肺炎疫情的信息,由疫情实时大数据报告(如图为部分数据截图)获知,其中用汉字、数值、加减符号描述疫情确诊、治愈、死亡等情况;还可以用颜色、数据表、图描述疫情地区分布、境外输入确诊趋势等情况。请运用数据信息、知识与智慧之间的相互关系完成下列判断。
(1)同一客观事物(如新冠肺炎疫情)可以用不同的数据描述。(_____)
(2)在计算机科学中,仅有文字数字、数值、字符、颜色、表、图可作为数据。(_____)
(3)疫情实时数据记录的形式有汉字、颜色、图等,因此数据具有二进制性特征。(_____)
(4)图21-1中用深红色突出显示确诊人数在10000以上的地区,深红色是数据,也是载体,它所承载的信息是“新冠肺炎确诊人数≥10000”。(_____)
(5)信息是经过加工处理的,具有意义的数据,所以信息和数据是等价的。(_____)
(6)由图21-2可获知“新型冠状病毒肺炎国外新增确诊人数呈上升趋势”。(_____)
(7)由图21-1中“数据更新至2020.10.21 15:26”表明信息具有时效性,一旦超过其“生命周期”就失去原有的效用,成为历史记录。(_____)
(8)从图中获取新冠疫情数据和信息,不仅能帮助我们了解疫情情况,还能帮助我们解决个人防护问题。(_____)
(9)知悉新冠肺炎具有传染性后,我们需要学习新冠肺炎预防知识进行个人防护。(_____)
(10)疫情爆发后,钟南山院士赶赴武汉,以其在病理学、流行病学等领域渊博的知识和智慧,指导抗疫工作,危难之中显身手,为全国医疗界战胜疫情增添了信心和力量。(_____)
16.1个字节可以存放2个0~255之间的整数。(______)
17.分别使用44.1kHz和22.05kHz的采样频率对同一段声音进行数据编码,前者的声音保真度更高。(______)
五、填空题
18.将一个田字格的一格或几格涂上黑色或不涂色,可以代表0~15这16个数.请你根据下面前4个图形表示数的规律,写出后面2个图形表示的数,则最后两个图形分别表示_________ 、________。
19.在微型计算机系统中,一个英文字符占1个字节,一个汉字占______ 字节
20.二进制数10111011.0101对应的八进制数表示为__________。
21.字符“f”的ASCII码值的十进制为102,ASCII码值十进制为98的字符的二进制______。
22.1GB=______ B, 1TB=______ GB。
23.通常先对模拟声音信号按给定的时间间隔进行(______),然后对采样数据进行(_______),最后将量化后的数据用计算机能够存储和处理的(________)表示,即(_________)。
试卷第1页,共3页
试卷第1页,共3页
参考答案
1.B
2.C
3.B
4.D
5.D
6.B
7.D
8.A
9.72KB
10.参考:
ASCII码:美国信息交换标准代码,是用8位二进制码为所有英文字母52、阿拉伯数字10、不可见控制符33以及标点符号、运算符号33等字符提供的编码。
Unicode:又称统一码、万国码、单一码,是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求
11.(1)二进制
(2)GB2312 GBK1.0
(3)(1000)2=8 (1001)2=9 (101)=5 (11)=3
12.错
13.正确
14.对
15.正确 错误 错误 正确 错误 正确 正确 错误 正确 正确
16.错误
17.正确
18.6 13
19.2
20.273.24
21.1100010
22.1024*1024*1024 1024
23.采样 量化 二进制数值 编码
答案第1页,共2页