信息技术必修一第三单元《认识数据》
知识点回顾
数据编码
模拟信号与数字信号
按照取值的特征,可将信号分为模拟信号和数字信号。
用传感器直接获取的信号一般模拟信号,如声音、温度、压强、亮度等。
模拟信号的值是随时间连续变化的,波形光滑。模拟信号的值称为模拟数据。
数字信号随时间的变化是非连续的。数字信号可以由模拟信号转换得来,数字信号只有(0/1)两个数值,是计算机能直接识别的信号。
声音模拟信号转变为数字信号的方法:采样、量化、编码三个步骤。
例如将麦克风采集到的声音模拟信号存储在计算机中,需要先对模拟声音信号按给定的时间间隔进行采样,然后对采样的数据进行量化,最后将量化后的数据用计算机能够存储和处理的二进制数值表示,即编码。
2.二进制与数制转换 ☆
计算机中所有数据都是以二进制形式存储的,二进制只有0、1两个字符,其特点是“逢二进一”,即1+1=10。计算机中存储的最小单位是二进制位,即比特(bit)表示。计算机中存储数据的基本单位是字节(Byte,简称B),8 bit=1 Byte,即8b=1B。
还有KB、MB、GB、TB等单位。其进制关系是:1 TB=1 024 GB,1 GB=1 024 MB,1MB=1 024 KB, 1 KB=1 024 B。
在二进制中,每个数字在不同的位置上具有不同的权值。对于一个二进制数从右侧开始向左计数K,最右侧第一位计做K=0,向左依次加1,那么各位上权值就是2k.比如二进制数10010, 5个数位上的权值从右向左依次为20、21、22、23、24.二进制转十进制时只需将该二进制每个数位上的数值乘上相应权值,然后相加求和即可。
比如:(10010) 2=1x24+0x23+0x22+1x21+0x20=18。
把十进制非负整数转换成二进制数,可使用短除法,即“除二取余”法。例如把十进制整数34转换成二进制数的过程如下图:
同样的位数二进制存储的数据量太少,不便于人们使用,因此常用的进制还有八进制、十六进制,分别是“逢八进一”和“逢十六进一”。八进制里面只有0~7八个数字,即7+1=10;十六进制里面有0~9、A~F共16个字符,即F+1=10。
总结:十进制非负整数转换成R进制数(R≥2)采用“除R取余法”,把R进制非负整数转换成十进制数采用“按权展开求和法”。
3.文本数据的编码
文本数据是用来表示一定意思的一系列字符,包括字母、数字、标点符号、汉字等。文本数据的编码通过对其中每一个字符进行编码实现。
用于文本数据字符编码的方案有多种类型,其中ASCII码和Unicode码是最为典型的两种编码方案。标准ASCII码用7位,扩展ASCII码用8位二进制数表示一个字符。
Unicode码用两个字节表示一个符号。计算机要处理汉字也必须进行编码,每个汉字用两个字节,编码方案很多,常用的为GB2312-1980码。
数据与结构 ☆
数据类型
数据类型用来定义一系列值及对应于这些值上的一系列操作。
大多数的程序设计语言都定义了两类数据类型:简单数据类型和复合数据类型。简单数据类型不能分解成更小的数据类型,复合数据类型由简单数据类型或者复合数据类型组成。
在Python中简单数类型有:整数、浮点数、字符串、布尔等。复合数据类型有:列表、字典、元组等。
例如:orderList=[”张三”,16,34.66] 列表名为orderList,第一项是字符串类型,第二项是整数类型,最后一项是浮点数类型。
数据结构
数据结构是存在特定关系的数据元素的集合。
线性数据结构
线性数据结构又称为线性表。在线性数据结构中,除首元素无前趋元素、尾元素无后继元素外,其他元素都有唯一一个前趋元素和一个后继元素。线性表中数据元素之间是一对一的关系。
队列
队列是一种有限制的线性结构,它的数据元素只能在一端依次添加(进队),在另一端依次删除(出队)。
比如Python中的listque是列表类型的数据,存放一些字符串类型的数据,表示订单编号。可以用pop(0)方法删除列表的首元素,用append方法在列表尾部添加一个数据元素。
树结构
树结构是一种具有层次关系的非线性结构。
树是由n(n≥0)个节点组成的有限集合。若n=0,则称为空树。任何一个非空树均满足以下两个条件:(1)仅有一个称为根的节点;(2)当n>0时,其余节点可分为m(m≥0)个互不相交的有限集合,其中每个集合又是一棵树,并称为根的子树。在树结构中,数据元素之间是一对多的关系。如图:
图结构
图结构是由一组节点(称为顶点)和一组节点间的连线(称为边或弧)构成的一种数据结构。
图结构中的每个顶点都可以与其他顶点有边相连,图结构中数据元素之间是多对多的关系。比如生活中城市之间的交通网络、物流网络都可以看成图结构。
数据与系统
1.图形用户界面(GUI)又称图形用户接口,是指采用图形方式显示的计算机操作用户界面。目前绝大多数的程序都是采用图形用户界面。
2.文件
在解决问题的时候,我们可以将数据以文件的形式存储到外存储器设备中,应用时用程序调用文件即可。
3.数据库
数据库是以一定的组织方式存储在计算机中的相互关联的数据集合。数据库中最常见的数据组织形式是二维表,也称表。
常见的数据库管理系统有Sybase、ORACLE、MySQL、Access等。
用数据库管理系统开发的数据管理系统成为数据库应用系统。
利用Python 访问 ACCESS数据库的一般步骤可以分为以下5步:
①建立与数据库的连接;
②根据需要产生记录集;
③访问记录集,处理数据;
④根据需要把处理好的数据更新到数据库中;
⑤断开与数据库的连接。
加密与解密
密码用户在网络上的账号等个人信息需要保密,保密最常用的方法是设置密码,除此之外还可以采用指纹、人脸、手机扫描验证等方式进行保密。
①不要使用的密码:电话号码、身份证号码、生日等信息作为密码;
②不要使用重复数字、重复字母等简单重复的字符作为密码;
③不用使用整个用户ID或者用户ID的一部分作为密码;
原始信息(数据)称为明文,加密后的信息(数据)称为密文,将明文变成密文的过程称为加密,将密文还原成明文的过程称为解密。
常用加密算法:加法密码,又被称为移位密码,比如凯撒密码。
章节练习
选择题
汉字的编码多种多样,如输入码、输出码和机内码,功能各异,其中用于存储汉字的编码称为( )
A.输出码 B.拼音码 C.输入码 D.机内码
2.按照国际通用标准,“同一个世界,同一个梦想”在计算机内存储时采用的编码是( )
A.ASCII码 B.GB2312 C.字型码 D.处理码
3.下列选项中不属于汉字输入码的是( )
A. 全拼 B. 智能ABC C.国际码(GB2312-80) D. 五笔字型
4.用某软件查看jyx@这几个字符的ASCII码,如下表所示。推断“xcbjya”这几个字符对应的ASCII码是( )
字符 j y x @ c a b . c o m
对应ASCII码 6A 79 78 40 63 61 62 2E 63 6F 6D
A.78 63 59 60 6E 63
B.78 40 59 61 6E 63
C.78 63 62 6A 79 61
D.78 63 59 61 6E 63
将模拟声音信号转换为数字声音信号的过程中不包括的是( )
A. 采样 B. 取值 C. 量化 D. 编码
6.一般来说,计算机存储一个汉字占用( )个字节
A.4 B.3 C.2 D.1
7.二进制(1011)2+(0111)2的结果用十进制表示是( )
A.15 B.16 C.17 D.18
8.下列四个数中,最大的一个是( )
(1010)2 B.(16)8
C.18 D.(1E)16
在图书馆管理系统的数据表中,用户搜索《西游记》的信息,其中的一行称为一条( )
记录 B.字段 C.消息 D.数据
参考答案:
D C C C B C D D A