信 息 技 术 综 合 复 习
目 录
第一章:数据与信息 1
1.1数据及其特征 1
1.2数据编码 1
1.3信息及其特征 1
第二章:知识与数字化学习 2
2.1知识与智慧 2
2.2数字化学习与创新 2
第三章:算法基础 3
3.1计算机解决问题的过程 3
3.2算法及其描述 3
3.3计算机程序与程序设计语言 4
第四章:程序设计基础 4
4.1程序设计语言基础 5
4.2顺序结构 7
4.3选择结构 8
4.4循环结构 9
第五章:数据处理和可视化表达 11
5.1认识大数据 11
5.2数据的采集 12
5.3数据的分析 12
5.4数据的可视化表达 12
第六章:人工智能及其应用 12
6.1人工智能 12
6.1人工智能的应用 13
第一章:数据与信息
1.1数据及其特征
数据是现实世界客观事物的符号记录,是信息的载体,是计算机加工的对象。(图形、图像、视频、音频、文本)
数据是对所有输入计算机并被计算机识别、存储和处理的符号的总称,是联系现实世界和计算机世界的途径。
现实世界的各种符号都可以被计算机转化为二进制数。
数据的基本特征:
(1)二进制:在计算机中,数据以二进制的形式存储、加工。
(2)语义性:语义是将数据符号解释为客观世界的事物。
(3)分散性:数据是分散的记录,分别记录不同客观事物的运动状态。
(4)多样性与感知性:数据记录的形式是多样的、可看的可听的、可感知的,如图形、图像、视频、音频、文本等。
1.2数据编码
计算机可以将现实世界的事物符号化、数据化,并将它们转换成0和1组成的二进制编码。
数据通过编码将模拟信号转换为数字信号进行存储和传输。
数据基本上是通过编码将模拟信号转换为数字信号进行存储和传输,文字、图像、声音等类型的数据都可经过编码进行存储和传输。
编码的基本方式分为:文字编码、图像编码、声音编码。
文字编码效率较低,有单字节码和双字节码,其中ASCII码、莫尔斯码属于单字节码,国标码(GBK)、统一码(Unicode)属于双字节码。
(1)ASCII码:美国设计,只包含英文、数字和一些控制符号,由8位二进制码进行转码,将符号转换为“0”和“1”构成的编码。如英文字母A和a的编码分别为01000001(十进制数65)和01100001(十进制数97)
(2)国标码(GB-2312):中国设计,处理汉字的简体中文和用于繁体中文。
图像编码是指对图像数据进行变换、编码和压缩。如位图(Bitmap)也叫作点阵图(或像素图)
位图文件所占用的空间可按以下公式计算:
文件的大小=文件头+信息头+颜色表项+图像分辨率 × 图像量化位数 ÷8
声音编码对声音进行数据编码,必须经过前期的数据采样和数据量化。
步骤:采样、量化、编码
声音存储空间遵循如下公式
声音存储空间=采样频率 ×量化位数 ×声道数 ×时间 ÷8
1.3信息及其特征
信息是经过加工处理的、具有意义的数据,在人类社会活动中发挥着重要作用。
信息是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征。
信息的基本特征
普遍性:只要有事物运动,有数据存在,就会有信息存在。
传递性:信息的传递打破了时间和空间的限制。
共享性:通过交流可以在不同个体或群体间共享。
依附性和可处理性:信息必须依附图像、文字、声音等符号才能够 表现出来,为人们所接收,并按照某种需要进行处理和存储。
时效性:信息不是一成不变的东西,会随着客观事物而变化。
真伪性。
(7)价值相对性:信息使用价值的大小是相对的,取决于接收信息者的需求及其对信息 的理解、认识和利用的能力。
第二章:知识与数字化学习
2.1知识与智慧
知识是人们运用大脑对获取或积累的信息进行系统化地提炼、研究和分析的结果。
智慧是应用知识解决问题的实践创新能力。
数据、信息、知识和智慧的相互关系
数据、信息、知识和智慧是逐渐递进的概念,前者是后者的基础和前提,后者是前者的抽象与升华。
2.2数字化学习与创新
数字化资源与学习工具,可以有效地管理学习过程和学习资源。
数字化资源与工具
(1)数据采集工具。 如:声卡、视频卡、数码照相机、数码录像机、手 写板、扫描仪等。
(2)信息获取工具。如:台式电脑、笔记本电脑、平板电脑和手机等。
(3)信息检索工具。如:搜索引擎和电子词典等。
(4)数字化可视化表达工具。如:思维导图和演示文稿等。
(5)信息通信交流与传输工具。如:电子邮件、博客、社交软件和视频会议系统等。
(6)信息存储工具。如:光盘、U盘、硬盘和服务器等。
(7)信息加工工具。如:编程软件、多媒体制作软件、网站制作工具和信息系统制作工具等。
(8)三维设计工具。如3D制作软件、3D打印机、虚拟现实和增强现实制作系统等。
数字化工具与资源的优势
①获取的便捷性 ②形式的多样性
③资源的共享性 ④平台的互动性 ⑤内容的扩展性
数字化学习的特点
问题化、合作性、个性化、创造性和再生性 、开放性
第三章:算法基础
3.1计算机解决问题的过程
计算机解决问题更高效、更便捷。
计算机程序解决问题要经过分析问题、设计算法、编写程序、调试运行程序等若干个步骤。
3.2算法及其描述
算法是指在有限步骤内求解某一问题所使用的一组定义明确的规则。
算法是计算机解决问题的核心。
算法的特征
有穷性:算法所包含的计算步骤是有限的。
确定性:算法执行的每一个步骤必须有确切的定义。
数据输入:一个算法可以有零个或多个数据输入
数据输出:没有输出的算法是毫无意义的。
可行性:每个步骤都可以在有限时间内完成。
算法的描述方法
自然语言:人们日常所用的语言,如汉语、英语等来描述算法;
流程图:用程序框图来描述算法;
伪代码:介于自然语言和计算机语言之间的文字和符号来描述算法。
图形 名称 功能
开始/结束 表示算法的开始或结束。
输入/输出 表示算法中变量的输入或输出。
处理 表示算法中变量的计算与赋值。
判断 表示算法中的条件判断。
流程线 表示算法中的流向。
连接点 表示算法中的转接。
三种方法对比
优势 劣势
自然语言 常用语言,容易掌握 具有歧义性导致算法存在不确定性
流程图 清晰、简洁 不依赖于计算机
伪代码 方便书写,格式紧凑,易理解,便于向代码过渡
三种基本控制结构
顺序结构表示程序中的各步操作按出现的先后顺序执行。
选择结构表示程序的处理步骤出现了分支,需要根据某一特定的条件选择其中的一个分支执行。选择结构有单选择、双选择和多选择三种。
循环结构表示程序反复执行某个或某些操作,直到判断条件为假(或为真)时才可终止循环。
3.3计算机程序与程序设计语言
计算机程序就是值计算机可以识别运行的指令集合。
计算机主要包括运算器、控制器、存储器、输入设备和输出设备五大基本部 件。
计算机内部采用二进制形式表示和存储指令或数据,工作过程实际上是周而复 始地获取指令、执行指令的过程。
计算机程序设计语言的发展,经历了从机器语言、汇编语言到高级语言的发展历程。
机器语言是由 “0”和“1”表示的二进制代码指令组表示的,可以直接被计算机接收和执行。
汇编语言由英文缩略词替代二进制串,需转为机器语言后被计算机识别。
高级语言接近于数学语言和人的自然语言,并且不再过度地依赖某种特定的机器或环境。如:C、VC、VB、Java、Python等。
第四章:程序设计基础
4.1程序设计语言基础
Python的常量和变量
常量是指在程序运行过程中其值始终不发生变化的量。如45、-11.29、'Hello'。
变量是指在程序运行过程中其值可以发生变化的量。如A=3,A为变量。
变量的命名规则:
不能以数字开头;
区分大小写;
不能由特殊符号;如!、@、#....
可以下划线开头”_”
Python的数据类型
计算机能处理的远不只数值数据,还可以是文本、图形、音频、视频、网页等各种 各样的数据。
Python能够直接处理的常用数据类 型有Number(数值)、String(字符串)、List(列表)、Tuple(元组)、Sets(集合)、 Dictionary(字典)等。
整型(int):通常被称为整型或整数。如:2024、01、05
浮点型(float):浮点型由整数部分与小数部分组成。如:1.5、19.3
String(字符串):单、双引号括起来的任意文本。如:'abc'、"中国"、'2024'
List(列表):数据项不需要具有相同的类型,写在方括号“[ ]”之间、用逗号分隔开的元素列表。
如:list1=['Good', 'Run', 1997, 2000]和list2=[1, 2, 3, 4, 5, 6, 7 ]
Tuple(元组):元组的元素不能修改。元组使用小括号()。
Sets(集合):集合是一个无序不重复元素的序列。
Dictionary(字典):字典是无序的对象集合。
Python的运算符与表达式
Python是一种面向对象的解释型计算机程序设计语言。
对常量或变量进行运算或处理的符号称为运算符,参与运算 的对象称为操作数。
由运算符、操作数连接而成的式子称为表达式。
操作数可以是常量、 变量、函数等。
常用的运算符有算术运算符、逻辑运算符、关系运算符、赋值运算 符、成员运算符等。
算术运算符包括:“+”“-”“* ”“/”“%”“** ”和“//”;
%:求余数 如:7%3 结果为1
/ /:取整数 如:7//3 结果为2
逻辑运算符包括:“and”(与)、“or”(或)、“not”(非);
假设变量a 为0, b为1,c为2
运算符 逻辑表达式 描述 示例
and x and y “与”。若 x为 False, x and y返回 False,否则它返回 y值。 (a and b) 返回0。 (c and b) 返回1。
or x or y “或”。若 x 是 True,它返回 x的值,否则它返回 y的值。 (a or b) 返回1。 (c or b) 返回2。
not not x “非”。若 x 为True,返回 False;若 x为False,它返回 True。 not(a and b) 返回 True。
关系运算符包括:“>”(大于)、“>=” (大于等于)、“<”(小于)、“<=”(小于等于)、“==”(等于)、“!= ”(不等于);
对变量的赋值通过赋值运算符“=”来完成。赋值号不是等号,具有方向性,由右边赋给左边。赋值号左边只能是变量,右边是常量或表达式。
赋值运算符 描述 示例 赋值运算符 描述 示例
= 直接赋值。 x=y。 /= 除法赋值。 x/=y相当于x=x/y。
成员运算符判断序列中是否有某个成员。
成员运算符 描述 示例
in x in y。如果x是序列y的成员,则计算结 果为True,否则为False。 3 in [1,2,3,4],计算结果为True。 5 in [1,2,3,4],计算结果为False。
not in x not in y。如果x不是序列y的成员,则计 算结果为True,否则为False。 3 not in [1,2,3,4],计算结果为False。 5 not in [1,2,3,4],计算结果为True。
运算符的优先级
算符运算>关系运算>赋值运算
not>and>or
优先级 运算符 功能及说明 优先级 运算符 功能及说明
1 ** 指数运算 6 =、%=、/=、//= -=、+=、*=、**= 赋值运算
2 *、/、%、// 乘、除、求余、整除 7 is、is not 标识运算符
3 +、 - 加运算、减运算 8 in、not in 成员运算符
4 >、>= 大于、大于等于 9 not 逻辑非运算
<、<= 小于、小于等于 10 and 逻辑与运算
==、!= 等于、不等于 11 or 逻辑或运算
Python的函数
函数是基石,是组织好的、可重复使用的、用来实现单一或相关联 功能的代码段。
函数名称 使用说明
abs(x) 返回x 的绝对值。如:abs(4) 结果:2
len(x) 计算变量x 的长度,但x必须是可以计算长度的类型。如:len(2024) 结果:4
min(x) 返回变量x 的最小值。如:min(‘1’,‘22’,‘42’,‘3’) 结果:1
max(x) 返回变量x 的最大值。如:max(‘1’,‘22’,‘42’,‘3’) 结果:22
int(x) 把变量x转换成整型。如:int(4.5) 结果:4
float(x) 将变量x转换成浮点型。如:float(4) 结果:4.0
input(x) 显示出信息x ,并要求输入数据。
print( ) 输出函数。
4.2顺序结构
4.2.1数据的输入与输出
数据的输入输出是最基本的操作之一。
数据输入通过input( ) 函数来实现,格式为:< 变量 > =input('提示信息:')。
如:日期=input(‘请输入今天的日期’)
不论用户输入什么类型的数据,input( )函数的返回结果都是字符串;
可输入数字、字符串和其他任意类型对象。
数据输出可通过print( )函数来实现,格式为:
print( [object, …][, sep=' '][,end='\n'] )。如:print(‘hello world!’)
方括号中的项是可选的,可以省略
object是要输出的对象,可以是常量、变量或表达式等。
sep表示每个输出对象之间的分隔符,若省略则默认为空格。
如:print(4,5,6,sep='***'),则输出结果为 4***5***6
end的字符串含义为输出文本尾的一个字符串,若省略则默认值是一 个\n换行符。
4.2.2顺序结构的应用
顺序结构是最常用、最简单的程序结构,其语句执行顺序是自上而下依次执行的。
4.3选择结构
4.3.1 if语句的应用
条件语句(if语句)来实现判断和选择。if语句在使用中包括单分支if语句和双分支if语句。
单分支if语句的格式:
if 条件表达式:
语句A
双分支if语句的格式:
if 条件表达式:
语句A
else:
语句B
功能:
条件表达式的值为真,即条件成立,执行语句A。否则执行语句B。
注意:
①if后面空一格;
②if条件表达式后面加冒号“:”;
③所有语句严格遵循相同的缩进(一个Tab或4格空格);
④语句组可以是一句也可以是多句;
⑤else后面只接冒号“:”。
如:
如果明天不下雨,就举行运动会,否则就正常上课。
单分支: if 不下雨: 双分支: if 不下雨:
举行运动会 举行运动会
else:
正常上课
if语句允许嵌套,即if语句中的语句A和语句B还可以是if语句。
4.3.2 if...elif...else语句的应用
if条件语句可以快速地实现程序的分支选择,但当分支比较多时,用if...elif...else 语句来实现比较简便。
if...elif...else语句格式如下:
if 表达式1:
语句1
elif 表达式2:
语句2
elif 表达式N:
语句N
else:
语句N+1
功能:
判断每个分支的条件表达式,当某条件满足,则执行相应语句,其余分支不再执行。若条件都不满足,有else语句,则执行该语句块,否则什么也不执行。
注意(参照单双分支语句注意事项):
①elif使用方式与if相同;
②各表达式之间应做到不重不漏。
如:判断身体质量指数BMI值,指数小于18.5偏瘦;在18.5和25之间正常;在25和30之间属于偏胖;大于30属于肥胖。
4.4循环结构
4.4.1 for循环的应用
循环是让计算机自动完成重复工作的常见方式。
for循环、while循环、循环嵌套、循环控制等都是程序循环结构的主要内容。
for循环是次数循环,在既定次数内进行循环。
for循环语句的一般格式如下:
for 循环变量 in 列表:
语句或语句组
功能:
for语句每次从列表中取出一个元素赋值给循环变量(循环变量是初值,即列表的第一个元素),当依次访问完列表的所有元素后,循环结束。
注意:
①for循环依次把列表中的每个元素逐个迭代出来;
②冒号“:”代表下一行是循环的第一 行;
③for循环所包含的语句是以缩进为标志的。
如:计算从1到10的累加值。
列表的表现方式:
表现方式 示例代码 示例结果
直接罗列
先定义后使用
range()函数
range()函数是从指定的第一个值开始数,并在到达所指的第二个值时停止,因而不包含第二个值。(左闭右开区间)
range()函数基本格式
4.4.2 while循环的应用
while循环是当型循环,只要条件满足,就不断循环;否则,退出循环。
while循环语句的格式:
while 表达式 :
语句或语句组
功能:
当表达式的值为真时,执行循环体语句;当表达式的值为假时,退出循环,执行循环体外的下一条语句(即while后面没有缩进的第一条语句)。
注意:
①while表达式后面的冒号“:”不能省略;
②表达式是一个关系表达式或逻辑表达式,条件的值应该是逻辑值真(True)或假(False)。
③每次循环都是执行完循环体语句后回到表达式处重新开始判断,重新计算表达式的值。
④循环体中必须有改变条件表达式值的语句,否则将成为死循环。
如:某次募捐活动上,第一个人募集20元,第二个募集25元……后一个比前一个多募捐5元,求第几个人募捐后,总费用累计超过500元?
4.4.3循环嵌套的应用
一个循环结构可以包含另一个循环,这样的结构成为循环嵌套,也成为多重循环。
for循环或while循环之间可以相互嵌套。
循环嵌套的执行过程是要首先执行外层循环,外循环每执行一次,内循环则需执行一个完整循环。
如:九九乘法表
4.4.4 循环控制的应用
实现控制循环的跳转需要用到break和continue两个关键字。
break是中断循环,continue是跳出本次循环体的执行。
break:强制退出循环,不在执行循环体内的语句,使程序跳到该循环结构之外的第一个可执行语句。
continue:结束本次循环,即跳过循环体内还未执行的语句,接着进行循环条件的判断,以决定是否继续执行循环。
第五章:数据处理和可视化表达
5.1认识大数据
大数据:
大数据是指在承受的时间范围内使用通常的软件工具捕获和管理的数据集合。
大数据是一种大规模的数据集合,在过去的存储和管理分析中远远超过传统软件,因此称为大数据。
大数据应用概括为两个方向,一个是正确的定制,另一个是预测。
大数据成为人们提取信息、做出决策的重要依据,是推动信息社会发展的重要资源。
大数据的特征(三角度九特征):
三角度 九特征
互联网产生大数据的角度 (“4V”特征:大量(Volume).多样(Variety).低价值密度(Value).高速(Velocity)) 1.数据体量巨大 2.数据类型繁多 3.价值密度低 4.变化速度快
互联网思维的角度 1.样本渐趋于总体 2.精确让位于模糊 3.相关性重于因果
大数据存储与计算的角度 1.分布式存储 2.分布式 并行计算
大数据带来的影响
使日常生活更为便捷:方便支付、出行、购物与产品推介、看病与诊病。
产生的负面影响:个人信息泄露、信息伤害与诈骗。
5.2数据的采集
数据采集的基本方法包括系统日志采集法、网络数据采集法和其他数据采集法。
存储数据主要有两种方式:①把数据存在本地内部,②把数据放在第三方公共或私有的“云端”存储。
数据的存储采用分布式文件存储或NoSQL数据库存储。
分布式文件存储:将大任务分解为多项小任务,通过让多个处理器或多个计算机节点并 行计算来提高解决问题的效率。
数据的保护分为数据安全保护技术与数据的隐私保护。
数据安全保护技术:数据安全保护指数据不被破坏、更改、泄露或丢失。
隐私泄露的问题解决办法:
①技术手段;
②是提高自身的保护意识;
③对数据使用者进行道德和法律上的约束
5.3数据的分析
数据分析一般包括特征探索、关联分析、聚类与分类、建立模型和模型评价等。
特征探索:对数据进行预处理;
关联分析:分析并发现大量数据之间的关联性或相关性;
聚类分析:探索性的分析,从样本数据出发,自动进行分类;
数据分类:数据分析处理中最基本的方法。
5.4数据的可视化表达
数据可视化以丰富的视觉效果呈现数据所反映的本质问题,有效提升数据分析的效率。
数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律。
数据分析类型及其对应的可视化呈现
数据分析类型 可视化呈现类型
有关趋势的分析 分组柱形图、堆叠柱形图、折线图、柱线混合图
有关比例的分析 百分比圆环图、饼图、圈图、堆叠面积图
有关关系的分析 逻辑关系 散点图、雷达图、网络关系图、词云
空间关系 数据地图、动态热力图、3D动态显示图
第六章:人工智能及其应用
6.1人工智能
人工智能是计算机科学的一个分支,是研究计算机模拟人的某些感知能力、思维过 程和智能行为(如学习、推理、思考、规划等)的学科。
人工智能是通过智能机器延伸、增强人类改造自然和治理社会能力的新兴技术。
人工智能发展历程大致分为三个阶段
第一阶段(20世纪50年代—80年代):人工智能诞生、成长、发展遇瓶颈;
第二阶段(20世纪80年代—90年代末):专家系统得到快速发展,数学模型有重大突破,多方面不足有一次进入低谷期。
第三阶段(21世纪初至今):在多应用领域取得了突破性进展,迎来了又一个繁荣时期。
6.1人工智能的应用
人工智能的飞速发展,为制造、家居、教育、交通、安防、医疗、物流等各行各业的发展和社会服务带来前所未有的变化。
智能医疗在辅助诊疗、疾病预测、医疗影像辅助诊断、药物开发等方面发挥了重要作用