必修一 《数据与计算》
第一章 数据与信息
信息技术涵盖了获取、表示、传输、存储和加工信息在内的各种技术。自电子计算机问世以来,信息技术沿着以个人计算机为核心、到以互联网为核心、再到以数据为核心的发展脉络,深刻影响着社会的经济结构和生产方式,加快了全球范围内的知识更新和技术创新。信息技术与社会的交互融合引发了数据量的迅速增长,数据对社会生产和人们生活的影响日益凸显,并具有重要价值。
本章通过“体验多媒体作品的数据与信息处理”项目,组织学生进行自主、协作、探究学习,让学生在在具体感知数据与信息的基础上,能够描述数据与信息的特征,知道数据编码的基本方式,从而将知识建构、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中,促进本章对应课标的学科核心素养水平的达成,完成项目学习目标。
项目范例:
体验庆祝国庆多媒体作品的数据与信息处理
情境
自古以来,科学技术就以一种不可逆转、不可抗拒的力量推动着人类社会向前发展。纪录片《创新中国》集中呈现了党的十八大以来中国的最新科技成就,科技创新让人民生活更为便捷,让企业发展更具活力,让国家实力更加强大。2016年8月16日,世界首颗量子科学试验卫星“墨子号”发射升空;2016年9月25日,500米口径球面射电望远镜——“中国天眼”正式落成启用;2017年5月5日,装配超过20个系统、数百万个零件、攻克100多项核心关键技术的国产商用大飞机C919首飞成功;2019年1月3日,我国月球探测器“嫦娥四号”成功在月球背面着陆,这是人类探测器首次造访月球背面……一项项成就,都实现了一次次历史性的飞跃,创新科技铸造的中国正成为世界瞩目的国度(图1-1)。党的十九大让全世界都再次聚焦到中国新时代的宏伟蓝图上来。
国庆节快到了,学校百灵创意社团通过网络、报纸和书籍进一步 了解(创新中国》中介绍的伟大成就,并对获得成就的数据和信息进行相应的处理,创作庆祝国庆的多媒体作品。
主题
体验庆祝国庆多媒体作品的数据与信息处理
规划
根据项目范例的主题,在小组中组织讨论,利用思维导图工具,制订项目范例的学习规划,如图1-2所示。
探究
根据项目学习规划的安排,通过调查、案例分析、文献阅读和网上资料搜索,开展“体验庆祝国庆多媒体作品的数据与信息处理”项目学习探究活动,如表1-1所示。
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}对应章节
探究活动
学习内容
知识技能
1.1 数据及其特征
数据采集
认识数据,了解各种数据的记录方式。
知道数据的概念,了解数据记录方式发展的基本例程,学会数据采集的基本方法和过程。
具体感知数据。
描述数据的基本特征。
分析数据应用实例。
描述数据的特征。
1.2 数据编码
数据编码
比较模拟信号与数字信号。
知道模拟信号与数字信号的含义及其相互关系。
知道数据编码的基本方式。
开展模拟信号的数字化实验活动。
体验数据编码的基本方法和过程,了解数据编码的作用。
列举常见数据的编码方式。
了解文本、图像等多种类型数据的编码方式。
1.3 信息及其特征
信息呈现
列举信息的不同定义,分析事例中的信息。
知道信息的概念、信息的价值,了解信息呈现的基本方法和过程。
具体感知信息。
描述信息的特征。
分析信息应用实例。
描述信息的基本特征,分析现实生活事例的信息特征。
实施
实施项目学习各项探究活动,进一步体验庆祝国庆多媒体作品数据与信息的处理。
成果
在小组开展项目范例学习过程中,利用思维导图工具梳理小组成员在"头脑风暴”活动中的观点,建立观点结构图,运用多媒体创作工具(如演示文稿、在线编辑工具等),综合加工和表达,形成项目范例可视化学习成果,并通过各种分享平台发布,共享创造、分享快乐。例如,运用在线编辑工具制作的“体验庆祝国庆多媒体作品的数据与信息处理”可视化报告,可以在教科书的配套学习资源包中查看,其目录截图如图1 -3所示。
评价
根据教科书附录2的“项目活动评价表”,对项目范例的学习过程和学习成果在小组或班级上进行交流,开展项目学习活动评价。
项目选题
同学们以3~6人组成一个小组,选择下面一个参考主题,或者自拟一个感兴趣的主题,开展项目学习。
1.体验庆祝国庆录音作品的数据与信息处理
2.体验庆祝国庆摄影作品的数据与信息处理
3.体验庆祝国庆视频作品的数据与信息处理
项目规划
各小组根据项目选题,参照项目范例的样式,利用思维导图工具,制订相应的项目方案。
方案交流
各小组将完成的方案在全班进行展示交流,师生共同探讨、完善相应的项目方案。
1.1 数据及其特征
1.1 数据及其特征
互联网、大数据时代,人们可以通过计算机和移动终端,随时随地获取信息、了解社会。例如,《创新中国》系列纪录片对收集的大量数据)[包括图形、图像、视频、音频、文本(文字、数字、数值、字符)]进行存储、挖掘和分析后,以多媒体记录新闻事件,满足人们对信息直观化、可视化的需求。
1.1.1 数据
数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。
在日常生活中,人们常使用符号来表达客观事物。例如,180 cm,70kg、36.5CC可以分别表示人体的身高、体重、体温情况,200m600m120km/h可以分别表示物体的面积、体积、速度情况。 世界任何客观事物在人脑中的反映(意识)离不开符号的表达和基于符号的逻辑推理。
在计算机科学中,数据是对所有输入计算机并被计算机识别、存储和处理的符号的总郴,是联系现实世界和计算机世界的途径。 即现实世界的各种符号,包括图形、图像、视频音频、文本(文字,数字,数值,字符)等数值性和非数值性符号,都可以被计算机特化为二进制数(如数字“180”在计算机中表示为10110100,字符“cm”在计算机中表示为0110001101101101),进行各种逻辑运算,处理成有意义的数据; 然后将计算机运算的二进制数转换成现实世界的视、听、触等各种感觉的信息,如图1-4所示。
大数据时代,数据不仅是信息的载体,也是人们提取信息、做出决策的重要依据,成为人们认识和理解现实世界客观事物的重要资源
探究活动
体验
请同学们欣赏庆祝国庆多媒体作品。图1-5是该作品的截图。
1.1.2 数据的基本特征
人们在探索现实世界时,用数据记录自然现象与社会的发展。 寻找数据的基本特征和规律,就是探察与揭示自然和社会的发展规律。在计算机科学中,数据具有如下基本特征:
(1)二进制。在计算机中,数据以二进制的形式存储、加工。
(2)语义性。语义是将数据符号解释为客观世界的事物。
(3)分散性。数据是分散的记录,分别记录不同客观事物的运动状态。
(4)多样性与感知性。 数据记录的形式是多样的、可看的、可听的、可感知的,如图形图像,视频、音频、文本等。
讨论
以小组为单位,查阅并分享体现数据基本特征的例子,同时讨论数据还有哪些特征。
项目实施
各小组根据项目选题及拟订的项目方案,结合本节所学知识,开展以下活动。
1. 完成相应作品录音、录像或扫描图像等数据的采集和分析。
2. 总结与记录数据采集和分析的方法。
1.2 数据编码
将现实世界的事物现象符号化、数据化,需要有一个理解、抽象、推理的过程,这个过程由计算机来完成。计算机将它们处理转换成0和1组成的二进制编码,进而采用基于二进制的算术运算和逻辑运算进行处理。
1.2.1 模拟信号与数字信号
众所周知,声、光信号是人的感官所能识别和接收的信号,而计算机是一种采用电信)(号进行运作的机器。 要将人的感官所能识别的信号转换为计算机能够识别的信号,实现人机交互,就必须清楚计算机是如何处理这些信号的。
1.模拟信号
模拟信号是指用连续变化的物理量所表达的信息。其信号的幅度、频率或相位随时间作连续变化,如声音信号、图形信号等。
模拟信号的波形可以是简单的,也可以是复杂的。例如,由单一钢琴定音器产生的声波,就是简单波形,仅仅包括一个单一频率(图1-6); 人类或管风琴的声音产生的声波,就是复杂波形,包含了许多不同频率的组合(图1-7)
模拟信号是传导能量的一种方式。例如,声波通过空气等介质来向远处传送能量,在传播的过程中,能量会不断被损耗而逐渐衰减,如图1-8所示。
无论是有线相连的电话,还是无线发送的广播电视,都是通过模拟信号来传递信息的。
2.数字信号
数字信号数字信号是离散时间信号的数字化表示。信号的自变量、因变量都是离散的。例如,开关电路中输出电压和电流脉冲就是离散的信号,如图1-9所示。
在计算机中,数字信号的大小常用有限位的二进制数表示。例如,字长2位的二进制数可表示00、01、10和1四种数字信号。
尽管基于数字信号的数据通信才出现几十年,但因其抵抗电路本身干扰和环境干栊的能力强,且数字信号有利于存储、加密与纠错,从而具有较强的保密性和可靠性。因此在现代技术的信号处理中,数字信号发挥的作用越来越大,覆盖的范围越来越广。
探究活动
分析
分析、比较模拟信号与数字信号在通信应用中的优劣,用间接的文字将结论填入表1-2中。
{5C22544A-7EE6-4342-B048-85BDC9FD1C3A}名称
有点
缺点
模拟信号
数字信号
进行远距离传送时用哪种信号比较好?
实验
在航海灯语系统中,灯语是一种通信手段,用灯光一明一暗的间歇做出长短不同的信号来传递信息。在古代,灯语对人们之间的交流起到很大的作用。随着科技的发展,灯语已经通过计算机网络实现了灯光信号的自动发送、获取和识别。
1. 实验名称:用手电筒传递信息。
2. 实验目的:了解灯语的使用场景,理解数据编码的必要性。
3.实验步骤:
(1)两人一组,一人控制手电筒开关,按照莫尔斯码发送一组字母,另一人观察手电筒发出的光信号,记录数据,并使用莫尔斯码译出这组字母。
(2)双方核对信息,多次重复实验。
(3)通过分析实验数据,总结该方法传递信息的利弊,提出改进方法。
(4)设计一套自己的灯语,用“密码”传送信息。
1.2.2 编码的基本方式
在现代技术的信号处理中,数据基本上是通过编码经模拟信号转换为数字信号进行存储和传输,文字、图像、声音等类型的数据都可经过编码进行存储和传输。
1.文字编码
文字(字符)编码是效率相对较低的编码方式,有单字节码和双字节码两种。其中,ASCII码、莫尔斯码属于单字节码,国标码(GBK)、统一码(Unicode)属于双字节码。( 1 ) ASCII码。1960年,香农创立了数字计算机的基本字符编码系统,简称ASCII码(AmericanStandard Code for Information Interchange),用7位二进制码为所有的英文字母(大小写52个)、阿拉伯数字( 10个)和常用的不可见控制符(33个)以及标点符号、运算符号等(33个)建立了转换码,第一次将符号转换为“0”和“1”构成的编码。从表1-3可知,英文字母A和a的编码分别为01000001(十进制数65)和01100001(十进制数97)。
思考
在计算机中,英文字母、数字、符号等都可用ASCII码来表示,如大写字母“C”的编码为8位二进制01000111,数字“9”的编码0001001等。可是,中文却难以用ASCII码来表示。如果要设计一套汉字的编码系统,可以如何进行?仿照ASCII编码系统的方法,描述大致的设计思路,并在小组内交流。
仿照ASCI码,描述设计思路:
(2)国标码。
由于ASCII码只包含英文、数字和一些控制符号,并不能表示汉字,因此,我国设计了用于处理汉字的简体中文的GB码和用于繁体中文的BIG5码(大五码)。
1980年发布的《信息交换用汉字编码字符集》(GB 2312)一共收录了7445个字符,包括6763个汉字和682个其他符号。GB 2312主要分为两部分:编号127之前的符号跟ASCII码所表示的意义相同,属于单字节码;编号127之后的符号统一用两个字节表示,包含了几乎所有的简体中文字(中文编码高字节的最高位不为0)。
1995年公布的《汉字内码扩展规范》(GBK 1.0)收录了21 886个符号,分为汉字区和图形符号区,汉字区包括21003个字符。
2.图像编码
图像编码是指在满足一定保真度的条件下,对图像数据进行变换、编码和压缩,以较少比特数表示图像或图像中所包含的信息的技术。
我们以位图(Bitmap)为例来说明图像的编码原理与方法,以及图像文件的大小计算方法。
(1)位图图像编码。
位图,最小单位为光栅点(或称像素),因而也叫作点阵图(或像素图)。
位图采用位映射存储格式,即将每一个像素映射为一个数据,存放在以字节为单位的矩阵中。例如,在如图1-10所示的黑白图像中,共有32×2个像素,如果将黑、白像素分别映射为1和0,就表示为11111111,00000110,10000110,11111111,10000001,01100011,01111100,10000001,这就是该黑白图像的二进制编码。通常图像编码采用16进制编码,因而图1-10的编码为“FF,06,86,FF,81,63,7C,81”。
(2)位图文件大小。
在计算机二进制数系统中,每个0或1就是一个位( bit,数据存储的最小单位),8个位就称为一个字节( Byte ) 。
黑白图像,每一个像素有2种可选颜色(黑、白),称为1位图像。因此,图1-10中所包含的图形数据为32×2÷8=8个字节。
16色图像,每一个像素有16种可选颜色,称为4位图像(24=16) ; 256色图像称为8位图像( 28=256) ;24位图像的可选颜色更丰富,为224种。
实际上,一个位图文件除了包含图形数据,还包括文件头、位图信息头、颜色信息、图形数据等几部分。
①文件头:包含文件的类型、大小和位图起始位置等信息,共14个字节。
②位图信息头:用于说明位图的尺寸等信息,占40个字节。
③颜色信息:用于说明位图中的颜色,有若干个表项,每一个表项定义一种颜色。当图像量化位数为1、4、8时,分别有2、16、256种颜色,每个颜色表项占4个字节;当图像量化位数为24时,没有颜色表项。
④图形数据:记录位图的每一个像素值,其记录顺序先从左到右,再从下到上。
一般情况下,位图文件所占用的空间可按以下公式计算:
文件的大小=文件头+信息头+颜色表项+图像分辨率×图像量化位数÷8
其中,图像分辨率=图像x方向的像素数×图像y方向的像素数。图像量化位数,也叫图像深度,是指图像中每个像素点记录颜色所用二进制数的位数,如8个字节的灰度图像和索引图像的颜色数为256种。
3.声音编码
对声音进行数据编码,必须经过前期的数据采样和数据量化。
(1)采样。采样就是把输入的模拟信号按适当的时间间隔得到的各个时刻的样本值,使其转换为时间上离散、幅度上连续的脉冲信号。
根据奈奎斯特采样定理,若果一定时间间隔对某个信号f(t)进行采样,并且采样频率高于该信号最高频率的两倍,则采样值包含了原信号的全部信息,如下图。对于音频信号,常用的采样频率有三种:44.1kHz、22.05kHz和11.025kHz。
(2)量化。量化是把样值信号的无限多个可能的取值,近视地用有限个数值来表示。首先是将采样信号幅度划分为若干量化等级(国标声音量化等级分为256个,即2^8个),然后将采样后的信号幅度与所划分的各个量化等级进行比较,向下取最接近的量化等级的数值,如图1-12所示。
(3)编码。编码足将量化后的采样值用二进制数码表示,并转换为由二进制编码0和1组成的数字信号。模拟信号采样后可用8位二进制数表示,最高位表示符号,正数为,负数为1。例如,采样值48的 二进制编码为001 1000 - 10的二进制编码为1100100,如表1-4所示:
编码时采用的二进制位数越多,数据量越大。古用的存储空间也越大。以声音信息为例,其存储空间遵循如下公式:
声音存储空间=采样频率x量化位数x声道数x时间/8
例如。采样频率为44.1kHz.量化位数为16位的立体声,1秒声音所需字节数为44.1x1000x16x2x1/8=176.4 (KB )
编码后的信号可以实现无差错的数据传输,如图1-13所示。
讨论
各小组讨论如何减少声音信号还原时的失真,提高声音的保真度。提出改进方案后,继续实验探索,直到得出结论。
实践
1. 有一幅24位的位图图像,像素为1024X8002试确定其数据文件的大小。
2若将上述图像另存为256色位图围像,则文件大小为多大?
3. 试上网查询有关视频编码的知识,了解视频是如何被编码的。
实际上,不仅文字,图像。声音等类型的数据可以被编码,视频等数据也都可以被编码成数据文件。
程序设计,简称编程,也属于编码,是运用程序设计语言,实现人机交互,提高计算机应用效率,为实现操作程序化要求所进行的编码。有关程序设计的内容将在后续章节中学习。总之,编码是数据存储及其表现的基础,也是人们认识世界的基础。
拓展:布尔代数与图灵机
现实世界的任何事物,如果用计算系统进行识别、存储和计算,首先需要将其符号化。所谓符号化,是指将现实世界的任何事物用符号表达,进而进行基于符号的计算的一种思维方式。将事物表达为不同的符号,便可采用不同的工具(或数学方法)进行计算;将符号赋予不同事物的意义,则能计算不同的现实世界问题。
所谓逻辑,是指事物因果之间所遵循的规律,是现实中普遍的思维方式。布尔在汲取亚里士多德和莱布尼茨形式逻辑符号化思想的基础上,创立了用O和1表达、处理现实中命题判断与推理(1表示真/0表示假)的基于二进制逻辑的代数系统,为电子计算机的开关电路设计提供了重要的数学方法和理论基础。二进制由0和1两个数码组成,逢2进1,借1当2,第i数位的权值为2。之所以青睐二进制,是因为:①二进制算术运算规则简单;②二进制算术运算可以与逻辑运算实现统一,或者说可以用逻辑运算实现算术运算;③能表示两种状态的元器件容易找到,如继电器开关、灯泡、二极管或三极管等。因此,计算机硬件存储和处理的是二进制数。
20世纪30年代,图灵提出了图灵机模型,直观且形象地说明了通用计算机器的工作机理,建立了指令、程序及通用机器执行程序的理论模型,奠定了计算理论的基础。图灵认为,所谓计算就是计算者(人或机器)对一条两端可无限延长的纸带上的一串0或1执行指令,一步一步地改变纸带上的0或1,经过有限步骤,最后得到一个满足预先规定的符号串的变换过程,如图1-14所示。数据被制成一串0和1的纸带送入机器中,作为输入,如0001000001000011…机器可对输入纸带执行的基本动作包括翻转O为1,或翻转1为0,前移一位,停止。机器对基本动作的执行是由指令来控制的,机器是按照指令的控制选择执行哪个动作,指令也可以用0和1来表示:01表示翻转0为1(当输入为1时不变),10表示翻转1为0(当输入0时不变),11表示前移一位,00表示停止。输入如何变为输出的控制可以用指令编写一个程序来完成,如011110110111011100。机器能够读取程序,按程序中的指令顺序读取指令,读一条指令执行一条指令,由此实现自动计算。因此可以说,图灵机就是一个最简单的计算机模型,图灵机将控制处理的规则用0和1表达,将待处理的信息及处理结果也用0和1表达,处理即是对0和1的变换,这样可以用机械或电子系统实现。
项目实施
各小组根据项目选题及拟定的项目方案,结合本节所学知识,掌握数据的编码过程。
1.分析常见编码方式与相应作品数据的编码过程。
2.总结与记录数据编码的方法和步骤。
1.3 信息及其特征
在互联网时代,数据正以越来越快的速度不断增长。移动电话、社交媒体和用于医疗诊断的影像技术等新业务,每天都会产生大量新数据。从这些数据中分析并提炼出有用的信息,将为人们的日常生活带来便利,并对推进科技,生产和社会的发展有重大意义。
1.3.1 信息
信息是经过加工处理的,具有意义的数据。信息是时客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征。人们通过获得、 识别自然界和人类社会的不同信息来区别不同事物,得以认识和改造世界,
探究活动
交流
结合生活实际中的例子,在小组内交流信息和数据的区别与联系。
1.3.2 信息的基本特征
信息在人类社会活动中发挥着重要的作用,因而受到人们高度重视。那么,信息具有哪些特征?对人类活动又产生了什么影响?
(1)普遍性。信息不是虚无绿野的事物,只委有事物运动, 有数据存在,就会有信息存在。信息普遍存在于自然界和人类社会发展的始终,可以被人们感知,获取、传递和利用。
(2)传递性。信息的传递打破了时间和空间的限制。例如, 我们可以借助计算机。网络、手机等工具了解发生在世界各地的许多事情。
(3)共享性。信息作为-种资源,通过交流可以在不同个体或群体间共享。信息交道与实物交流有本质上的不同:实物交流,一方有所得, 另-方必有所失。例如,两个人交换手中的一个苹果,每人得到的是对方的那一一个苹果。 面信息交流则不然。两个人交换则都拥有了两份信息。因此,人们悟出以下道理:分享,沟通与行动是将知识转化为智慧的关键。
(4)依附性和可处理性。各种信息必须依附一定的图像, 文字。声音等符号才能够表现出来,为人们所接收,井按照某种需要进行处理和存储。信息经过分析和处理,往往会产生新的信息,使信息得到增值。
(5)时效性。 信息不是: .成不变的东西,会随者客现事物的变化而变化。如果信息不能反映事物的最新变化状态,它的效用就会降低,一且超过其“生命周期”,信息就失去原有的效用,成为历史记录。
(6)真伪性。人们接收到的信息,并不都是对事物的真实反映,因此,信息具有真伤性。产生伪信息的原因很多:有些是出于某种目的,被人故意采用窜改、捏造、欺骗、夸大等手段人为制造的:有些是由于人们的认识能力或表达能力不足导致的:有些则是传道过程中的失误造成的。因而,对信息的真伪性需要加以整别。
(7)价值相对性。信息作为种特殊的资源,具有相应的使用价值,能够满足人们某些方面的需要。但信息使用价值的大小是相对的,取决于接收信息者的需求及其对信息的理解、认识和利用的能力。
我国发现的兵马俑,发现时有不同的人到现场去, 新闻记者,历史学家,商人,工程师,需要不同的信息,这就是信息相对性。
拓展:香农与信息论
关于文字、数字、图形、声音的知识已有几千年历史了。但是它们的总称是什么,如何统一地计量,直到19世纪末还没有被正确地提出来,更谈不上如何去解决了。20世纪初期,随着电报、电话、照片、电视、无线电、雷达等技术的发展,如何计量信号中信息量的问题被隐约地提上日程。
克劳德·艾尔伍德·香农(Claude Elwood Shannon , 1916—2001)是美国数学家、信息论的创始人。他先后发表了论文《通信的数学原理》和《噪声下的通信》,系统论述了信息的定义、怎样数量化信息、怎样更好地对信息进行编码等通信的基本问题,给出了信息嫡的概念和通信系统的模型,提出了信息量的数学表达式,并解决了信道容量、信源统计特性、信源编码、信道编码等一系列基本技术问题,为信息论和数字通信奠定了基础。香农被誉为“信息论之父”。
香农在引入嫡(指体系的混乱的程度)的概念进行信息的定量计算的时候,明确地把信息量定义为随机不确定性程度的减少。这就表明了他对信息的理解,即信息是用来减少随机不定性的东西,或信息是确定性程度的增加。
项目实施
各小组根据项目选题及权订的项目方案,结合本节所学知识,了解信息及其基本特征,进一步完善该项目方案中的各项学习活动,并参照项目范例的样式,撰写相应的项目成果报告。
成果交流
各小组运用数字化学习工具,将所完成的项目成果,在小组或班级上进行展示与交流,共享创造、分享快乐。
活动评价
各小组根据项目选题、拟订的项目方案、实施情况以及所形成的项目成果,利用教科书附录2的“项目活动评价表”,开展项目学习活动评价。
本章扼要回顾
同学们通过本章学习,根据“数据与信息”知识结构图,扼要回顾、总结、归纳学过的内容,建立自己的知识结构体系。
本章学业评价
同学们完成下列测试题(更多的测试题可以在教科书的配套学习资源包中查看),并通过“本章扼要回顾”以及本章的项目活动评价,综合评价自己在信息技术知识与技能、解决实际问题的过程与方法,以及相关情感态度与价值观的形成等方面,是否达到了本章的学习目标。
1.单选题
(1)数据是现实世界原始事物现象的( ) ,是信息的载体。
A.符号记录B.还原C.反映D.提升
(2)下列编码方式中,属于图像编码的是()。
A. ASCI码 B. GBK C.图像压缩 D.统一码
(3)有人写了一个数制转换的式子: 70-25=41。 若要使该等式成立,则70、25、 41有可能分别为()。
A.十进制、十进制、十六进制 B.十进制、十六进制、八进制
C.十六进制、八进制、十进制 D. 八进制、八进制、十六进制
2.思考题
在信息时代如何判别信息的真伪?谈谈你的方法或经验。
3.情境题
数据压缩。
RLE ( Run-Length Encoding,行程长度编码)是一种编码方式,也是一种简单的无损压缩法,压缩和解压缩效率高。
RLE压缩法:利用控制字节的最高位来标识是否进行了压缩。当最高位为1时, 则后面7位表示的是数据的重复次数;当最高位为0时,则后面7个位的数是被压缩的数据。
例如,如果有15个十六进制数都是30,那么,压缩后的编码为8F 30。
说明:十六进制数8F转换为二进制是00111最高位是1,后面的7位0001111表示字节的重复次数15;十六进制数30转换为二进制是0010000最高位是0,30是被重复的数据。采取这种方法,一个字符只有重复两次以上,才能被压缩。即使一个数据只重复3次,也可以获得30%的压缩比。
问题1:如果经过RLE方法压缩后的数据为8A 6F,那么解压缩前的数据是什么?
问题2:根据RLE压缩方法,下列字符数据经过压缩后的数据是什么?
20,30,30,30,35,35, ... ,35,64。 其中,十六进制数30共有3个,35共有60个。
END