(共35张PPT)
高中信息技术
项目一 探秘鸟类研究
认识数据、信息与知识
数据
数据(data): 是对客观事物属性的描述, 是记录下来的某种可以识别的符号。
在计算机科学中 ,数据是指所有能输入到计算机中并能被计算机程序处理的符号的总称。数据的形式可以是数值, 也可以是文本、 图形、 图像等。
信息(information):是数据中所包含的意义,是对数据进行加工的结果。把数据有组织、有规律地采集在一起就形成了信息。数据一方面承载着信息,另一方面也产生着信息。
大数据(big data):是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据通常具有 4V 特征,也就是 Volume(数据量)、Velocity(处理速度)、Variety (多样性)、Value(价值性)。
大数据的应用:生活服务、智慧城市、医疗健康、社区管理、把握社会舆论情况等。
数据和信息的不同特征及相同特征
l 从数据到信息 ,再到知识 ,是一个从低级到高 级的认知过程。
l 数据是信息和知识的来源。无论信息还是知识, 都来自于数据 ,都是以数据为载体而存在的。
l 信息是经过加工的数据 ,知识是经过人类归纳 整理和反复验证后沉淀下来而呈现的规律。
数据、信息与知识的关系
数据和信息的不同特征:
(1)数据的载体性与信息的依附性
(2)数据的孤立性与信息的联系性
(3)数据的客观性与信息的主观性
数据和信息的共同特征
(1)普遍性 (2)可处理性 (3)传递性与共享性 (4)价值相对性与时效性
1. 体育老师根据学生体质健康数据优化课堂教学,这主要体现的信息特征是( )
A. 真伪性 B. 依附性 C. 传递性 D. 价值性
2. 气象员观测卫星云图,将采集的数据与有关气象资料进行分析处理后发布天气预报信息,这说明信息具有( )
A. 可处理性 B. 传递性 C. 价值相对性 D. 时效性
3. 小秦记错了语文直播课的上课时间,遗憾地错过了这节精彩的网课。这件事体现了信息特征中的( )
A. 时效性 B. 真伪性 C. 依附性 D. 价值性
4.大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理
的数据集合,下列哪一个特征是它独有的。( )
A.“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)
B.共享性
C.传递性
D.相对性
5.以下关于数据与信息,说法不正确的是( )。
A.数据是现实世界对原始事物及现象的符号记录。
B.信息是对数据的解释,是经过加工处理,具有意义的数据。
C.数据和信息都可处理,所以数据就是信息,信息就是数据。
D.数据是原始的记录,具有分散性;信息是对数据的解释,具有主观性。
项目二 探究计算机中的数据表示
认识数据编码
数据的编码
1.编码(encoding):是指用预先规定的方法将文字、 数字或其他对象转换成规定的符号组合,或将信息、数据转换为规定的脉冲电信号。在计算机中,编码一般是指用预先规定的方法将数字、文字、图像、声音、视频等对象编成二进制代码的过程。
2.编码的功能和意义:(1)鉴别 (2)排序 (3)专用含义
3.进制转换
二进制转十进制:口诀“数位乘权相加”例1101=1*23 + 1*22 + 0*21 + 1*20 = 13
十进制转二进制:口诀“除二取余,直到商为0,倒取排列”。
例如:(37)10=(100101)2
数值数据编码
计算机中数值数据的编码分为原码、反码和补码。通常情况下,计算机用一个数的最高位存放符号,即用0、1表示正负符号,正数为0,负数为1,这个二进制位称为符号位。(以十进制数+21和-21的8位编码为例)
+21
0 1 0 1 0 1
1 1 0 1 0 1
-21
1. 西文字符的编码
目前,国际上普遍采用的西文字符编码标准是ASCII 码,由美国信息国家标准学会制定的通用单字节字符编码方案。
标准ASCII码是用7个二进制位表示一个字符,只能表示128个字符,无法满足西文字符编码的需求,后来又扩充了128个字符,称为扩展ASCII码。
字母、数字、标点符号等,称为西文字符。计算机在存储和处理这些西文字符 时,需要为每个字符规定一个由 0 和 1组 成的代码。
例如:字母A:100 0001 数字9:011 1001
2. 汉字的编码
常用汉字有近 5000 个,这种信息容量要用 2 个字节长即 16 位二进制编码才能满足。
1980 年,中国国家标准总局发布了中华人民共和国国家标准 GB2312—1980《信息交换用 汉字编码字符集——基本集》 ,又称为国标码。国标码用 2 个字节表示一个汉字,其中每个 字节的最高位为 0。
3. Unicode
Unicode 是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。
文本数据的编码
现实世界的声音是一种连续的波 ,称为声波。声音有两个参数:幅度和频率。要用计算机处理声音数据 ,必须把连续变化的波形信号转换成为离散的数字信号 ,将幅度和频率以 0 和 1 编码的形式表示出来 ,这一过程称为声音数字化。
声音(图像)数字化的过程包含采样、量化、编码三个步骤。
声音和图像的数字化
数据量(单位:字节)=数据率× 持续时间 =(采样频率 × 量化位数 × 声道数)÷8× 持续时间。
例:一张CD-ROM 中存放了1小时的数字音乐(未经压缩),则其数据量可按以下方法计算: 数据量=(44100×16×2)÷8×60×60B = 635040000B = 620156.25KB ≈ 606MB
标准CD 格式的采样频率为 44.1kHz,量化位数为16位,声道数为2(双声道)。 数据量计算公式中的“÷8”是将位数转换成字节,一个字节由8个二进制位组成。1MB=1024KB,1KB=1024B。
图像数字化
未经压缩的位图图像的数据量(单位:字节B)= 图像分辨率 × 颜色深度 ÷8
注:一幅图像所包含的横向和纵向的像素点的数目称为图像分辨率(宽度×高度)。
数据的编码
计算机中常见存储单位及换算关系 B(Byte)字节 1B=8b(bit)位
KB 千字节 1KB=1024B
MB 兆字节 1MB=1024KB
GB 吉字节 1GB=1024MB
TB 太字节 1TB=1024GB
计算机存储和处理的最小信息单位:位或比特(bit),即一个二进制0或1
存储容量的最基本单位:字节(Byte),由8个二进制位组成,如:11001010
一个英文字母占一个字节,中文汉字占两个字节
1. 模拟信号(波形)的特性是( )。
A. 离散的 B. 脉冲序列 C. 间断的 D. 连续变化的
1.在计算机内部,一切信息的存取、处理和传送都是以( )形式进行的。
A、GB2312码 B、ASCII 码 C、十六进制 D、二进制
3.二进制数10111转换成十进制数是( )。
A、53 B、32 C、23 D、46
2.十进制数124转换成二进制数是( ) 。
A、1111010 B、1111100 C、1011111 D、1111011
124÷2=62.....0
62÷2=31..0
31÷2=15..1
15÷2=7...1
7÷2=3..1
3÷2=1..1
1÷2=0..1
0 0 0 1 0 1 1 1
128 64 32 16 8 4 2 1
项目三 调查中学生移动学习现状
数据处理的一般过程
数据处理(data processing):是对数据进行采集、存储、加工、分析和表达的过程。
数据采集方法和工具:传统方式和网络方式
数据可视化是指将数据分析的结果通过表格、图表、图形等形式显示出来,条形图、柱状图、饼图、折线图
数据处理
明确目标
数据处理的一般过程
数据采集
数据加工
数据分析
数据可视化
报告撰写
1. 李军同学在做研究性学习时,想通过问卷调查了解人们垃圾分类的情况,遇到了以下难题,请你帮他完成。请根据以上情境,完成此题。
问卷的发放、填写、回收的过程主要属于数据处理的什么阶段( )
A. 数据采集 B. 数据分析 C. 数据呈现 D. 数据整理
2. 当今社会,数据体现出了前所未有的价值。每时每刻都有数据被人们发现、分析、利用,创造出巨大的财富,数据改变着我们生活的方式。随着大数据时代的发展,我们也会面临新的挑战,这些挑战不包括( )
A. 对个人隐私的挑战
B. 对社会监督的挑战
C. 对国家立法的挑战
D. 对世界历史的挑战
3. 下列关于信息的获取途径的描述,不恰当的是( )
A. 通过电视可以收看体育赛事
B. 通过电话可以获取气象信息
C. 通过收听广播可以了解时事
D. 通过网络一定能获取到最新的信息
项目四 认识智能停车场中的数据处理
体验数据处理的方法和工具
数据采集的方法和工具
数据的采集
自动采集
人工采集
物联感知采集(传感器)
视频监控采集(摄像机)
网络平台采集(采集软件、网络爬虫、移动APP)
调查 访谈(问卷)
观察 实验(表格)
文献调研(文献检索工具)
数据的保护:数据备份、数据的隐私保护
数据的组织和存储
数据以文件或数据库的形式永久存储在外存储器中,结构化数据通常存储在关系型数据库或表格文件中。
表格数据的加工方法
(1)数据的计算(求和 SUM 求平均 AVERAGE) (2)数据的排序 (3)数据的筛选 (4)数据的分类汇总
1. 下列选项中,不属于人工数据采集方法的是( )
A. 访谈 B. 观察 C. 视频监控 D. 实验
2. 同学们想将报纸上的一篇冬奥会的纪实报道的图文信息作为电子素材,
需要使用( )设备最为快捷
A. 扫描仪 B. 录音笔
C. 绘图仪 D. 打印机
项目五 描述洗衣机的洗衣流程
了解算法及其基本控制结构
算法:算法是解决“做什么”和“怎么做”的具体步骤的描述。在有限的步骤内解决某一个问题所使用的方法。
算法的特征:(1)有穷性(2)确定性(3)有零个或多个输入
(4)有一个或多个输出(5)可行性
算法的评价:正确性、可读性、高效性。
算法的描述方法:(1)自然语言 (2)流程图 (3)伪代码。
算法的基本控制结构:顺序结构、选择结构、循环结构。
认识算法
1. 下列关于算法的说法中,不正确的是( )
A. 算法必须有一个或多个输出
B. 算法是解决问题的方法和步骤
C. 算法具有不确定性,可以有无限步骤
D. 算法可以用流程图、伪代码、自然语言等来描述
2. 以下对算法叙述,错误的是( )
A. 算法结果不唯一
B. 实现算法的语言可以是多样的
C. 算法具有确定性
D. 解决同一问题的算法可以有多种
项目六 七 八
认识程序和程序设计语言
一、了解程序及程序设计语言
汇编
语言
高级
语言
类似英语
缩略词并带有 助记符号的编 程语言。
程序(program):一组能被计算机理解并执行的指令序列,是计算机执行算法的操作步骤。
程序设计语言(programming language):人们编制程序所使用的计算机语言。
程序设计及其一般过程:分析问题→设计算法→编写程序→运行调试
由二进制
代码指令组表 示的编 程语言 。
接近于人
类自然语言的 编程语言。
机器 语言
二、程序设计语言Python
数据类型
基本数据类型
整型 int 整数 可任意大 如2,-99
浮点型 float 小数 如 7.98,2.318E+6
布尔类型 bool 逻辑判断 True False
复数类型 complex
组合数据类型
字符串 str “中国” “Hellow world” “1”
元组 tuple
列表 list 数据序列 如[1,1,2,3,5,6,23]
集合类型 set
字典类型 dict
编写程序为了更好的解决问题,程序设计语言提供了多种数据类型,python语言中常见的数据类型有:整型,浮点型,字符串型、布尔型、列表等。
二、程序设计语言Python
常量:程序运行过程中不能改变的量
变量:程序运行过程中,其值可以改变的量
例如:f=102 (等号用来赋值)
变量名:f
变量值:102
数据类型:整型
变量与常量
公式由算术表达式构成,其中包含常量、变量、运算符等要素。公式中的“*” “-” “+”/是算术运算符,注意它们与数学中的符号在书写上的差异。
“=”表示赋值运算,在 Python语言中表示将“=”右边的数据对象绑定到其左边的变量,根据数据对象的类型确定变量的类型。
变量的命名规则
由字母、数字或下划线组成,其中不能以数字开头
变量名区分大小写 SAB sab Sab
但不能与Python的关键字同名。print if input等
9. 某算法的流程图如下图所示,若输入a和b的值分别为18和20,则输出的值为( )
数值数据及其运算
运算符 含义 示例 运算结果
+ 加法 53+21 74
- 减法 63.1-2.2 60.9
* 乘法 300*1.5 450.0
/ 除法 1/8 0.125
// 整除 1//8 0
** 次幂 2**3(23) 8
% 求余数 17%3(17/3=5...2) 2
1、算术运算符(P102)
数值数据分为整数(int)和浮点数(float)。浮点数是带小数的数值。
2、逻辑运算符 (P107)
与(and) 或(or) 非(not)
数值数据及其运算
2、关系运算符(P106)
Python运算符 数学符号 名称 示例(dist=0.87) 结果
< < 小于 Dist<1 True
<= ≤ 小于等于 Dist<=1 True
> > 大于 Dist>1 False
>= ≥ 大于等于 Dist>=1 False
== = 等于 Dist==1 False
!= ≠ 不等于 Dist!=1 true
条件表达式:由关系运算符或者逻辑运算构成,执行结果为布尔值:True或Fasle
例如:判断一个数X是否为100到200之间的一个数。条件表达式为:100<=x<=200
字符的比较对应字符ASCII码值的大小;字符串的比较则按照字典顺序进行。
3、逻辑运算符 (P107)
与(and) 或(or) 非(not)
成绩>=90 and 身高>=170 成绩>=90 or身高>=170
二、程序设计语言Python
input() 接收键盘输入的字符串 得到的是一个字符串型数据 输入
print() 输出结果
数据类型转换函
float() 例:float(x)将x转换为浮点型数据
int() 例:int(x)将x转换为整型数据
str() 例:str(x)将x转换为字符串型数据
函数
常见的数据类型有:整型int ,浮点型float,字符串型 str、
布尔型bool、列表list等。
if 条件表达式1:
语句块1
elif条件表达式2:
语句块2
……
else:
语句块n
if 条件表达式:
语句块1
if 条件表达式:
语句块1
else:
语句块2
x=5
if x>0:
print(“x是正数”)
password="ab123456"
pw1=input("请输入密码:")
if password==pw1:
print("密码正确")
else:
print("密码错误")
cj=int(input("请输入你的成绩:"))
if cj>=90:
print("优秀")
elif cj>=80:
print("良好")
elif cj>=60
print("合格")
else:
print("不合格")
单分支
双分支
多分支
选择结构语句格式
循环结构的语句
确定次数循环
for 循环控制变量 in 遍历结构 :
语句块
s=1
for i in range(1,51):
s=s*i
print(s)
确定次数循环指循环结构对循环次数有明确定义,循环次数采用遍历结构中元素的个数来体现。
不确定次数循环
while 条件 :
语句块
s=1
i=1
while i<=50:
s=s*i
i=i+1
print(s)
不确定循环次数循环会一直保持循环操作,直到特定循环条件不被满足时结束。
1. while循环属于什么循环( )
A. 结合循环 B. 条件循环 C. 复合循环 D. 计数循环
2. 某算法的流程图如右图所示,若输入a和b的值分别为18和20,则输出的值为( )A. a B. b C. 18 D. 20
3. 下列关于顺序控制结构的程序执行过程描述正确的是( )
A. 自上而下依次执行
B. 自下而上依次执行
C. 顺序控制结构中不能包括其他程序控制结构
D. 顺序控制结构必须有一个输入和一个输出
4. 下列不属于算法表示方法的是( )
A. 自然语言 B. 流程图 C. 伪代码 D. 数据结构
1. 下列程序采用的是哪种算法结构( )
a=3
b=5
s=a+b
print(s)
A. 循环结构 for while B. 选择结构if C. 顺序结构 D. 分支结构
2. 已知a=[1.2,3.4.5],那么a的数据类型是( )
A. 整型 B. 字典 C. 列表 D. 字符串
3. 在Python语言中,已知x=[1,2]和y=[3,4],那么x+y的结果是( )
A. [1,2,3,4] B. 7 C. [4,6] D. 3
4. 在 Python 语言中,已知列表color=['红色','橙色','黄色','绿色','青色','蓝色','紫色’],则color[3:5]的值为( )
A. ['紫色','红色'] B. ['橙色',黄色']C. ['蓝色','紫色'] D. ['绿色',青色]
项目九 了解手写数字识别
体验人工智能
人工智能(AI):
是利用计算机或者计算机控制的机器,模拟、延伸和扩展人的智能,感知环境、获
取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能的发展阶段:
从技术角度,通常把人工智能的主要发展阶段分为运算智能、感知智能和认知智能。
机器学习(machine learning):
机器学习是人工智能的核心研究领域之一 , 它研究计算机怎样模拟或实现人类的学
习行为 , 以获取新的知识或技能 , 重新组织已有的知 识结构 ,从而不断改善自身
的性能。
机器学习的一般过程:采集数据→建立模型→验证模型→评估模型→应用模型
当前人工智能的主要应用领域:主要集中在个人助理、安防、自动驾驶、医疗健康、电商零售、金融、教育等方面。
一、了解人工智能的概念及机器学习
1. 以下不属于模式识别的是( )
A. OCR(光学字符识别) B. 机器翻译 C. 手写输入识别 D. 语音识别
2. 以下选项中不属于医疗健康大数据的是( )
A. 健康档案数据 B. 公共安全数据 C. 诊疗数据 D. 个人健康管理数据
3.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫( )
A. 机器感知 B. 机器学习 C. 自动化 D. 机器思维
4.下面选项中不是人工智能的主要发展阶段的是( )
A、运算智能 B、存储智能 C、感知智能 D、认知智能