(共38张PPT)
选择性必修1《数据与数据结构》
第一章 数据与数据结构
1.2 数据的组织
情境导入——QWERTY键盘
打印机刚发明时,键盘左上角的字母顺序是“ABCDEF”。这个排列顺序让打字员打起来飞快,但是相邻字母频繁敲击长杆和字锤可能会卡在一起。为了解决卡键这个难题,打印机发明者肖尔斯请他的妹夫——一位数学家来帮忙。
这位数学家建议肖尔斯把键盘上那些英文字母中最常用的字母分开,以避免故障的发生。肖尔斯采纳了这个建议,将字母重新排列,形成了我们现在看到的“QWERTY”的布局。打字员使用这个键盘的时候,打字速度明显下降,也因此很少发生卡键的情况了。
至今很多人质疑“QWERTY”键盘布局的字频统计的科学性,这里我们可以使用Python语言赋值我们展开字频统计研究,下面是老师的一个程序样例,但数据样本比较小,分析结果存在一定局限。
情境导入——QWERTY键盘
运行程序样例,得到字频统计
瑞士计算机科学家沃斯(N.Wirth)曾指出“算法+数据结构=程序”
数据结构的概念
数据元素是数据的基本单位。有些情况下,数据元素也称为元素、结点、顶点、记录等。
图1.2.1 数据元素及其包含的数据项
图1.2.1所示二维表中,每一行实际内容(也称为一条记录)就是数据元素,而每个元素又由5个数据项(“代码”“名称”“最新价格”“动态市盈”“流通股本”)组成。
1. 数据元素(Data Element)
数据结构的概念
2. 数据类型(Data Type)
数据类型指的是具有相同性质的计算机数据的集合及在这个数据集合上的一组操作。
数据类型可以分为基本数据类型(也称为原子数据类型)和结构数据类型。
基本数据类型由计算机编程环境提供,编程者可以在编程时直接用系统提供的标识符进行定义,如Python编程语言中的整型、实型、布尔型等。
结构数据类型是在程序设计时利用基本数据类型构造出的、复合的新类型,这种新类型由用户根据实际需要定义,能较好地描述数据元素数据项组成以及数据元素之间的逻辑关系,方便用户根据数据之间逻辑关系的特点进行数据处理,如很多编程语言中提供的记录类型、集合等。
基本数据类型
结构数据类型
数据结构的概念
3. 数据结构(Data Structure)
数据结构指的是数据之间的相互关系,即数据的组织形式。
它包括了以下三个方面的内容:
①数据元素之间的逻辑关系,也称为数据的逻辑结构。
②数据元素及其关系在计算机存储器内的表示,也称为数据的存储结构或物理结构。
③数据的运算,即对数据施加的操作。
常见的数据结构——数组
李彤 张强 胡洁 杜刚
第1个 第2个 第3个 第4个
这批数据序列可用数组
“a(1)="李彤"、a(2)="张强"、a(3)="胡洁"、a(4)="杜刚"”来表达。
常见的数据结构——链表
吴坚知道自己排在首位,王林知道排在自己前面的是吴坚,黄刚知道排在自己前面的是王林,李丰知道排在自己前面的是黄刚。有了这些相邻人员之间的链接关系,即使休息时大家分散在各处,一旦需要集合,大家可以根据链接关系快速地按照原顺序排成队伍。虽然整队前后每个人员的站位地点发生改变,但相互之间排队的顺序关系是不变的。
常见的数据结构——链表
游戏体验“排排队”
1.准备2组1-6的数字
2.一组1-6随机贴在6位志愿者的胸前,一组1-6随机贴在志愿者的背后(每位自愿者两个数组不同)
3.确定一位同学站在队首,然后每位志愿者根据胸前数字与排定同学背后数字配对完成排队。
常见的数据结构——链表
抽象化后的排队链接关系
组织、处理一批数据时,若不关心数据实际所处的具体位置,而只需知道数据之间相互链接的顺序时,可以借鉴上面的方法。在计算机科学中,这种方法的具体实现形式就是链表。
常见的数据结构——链表
单向链表
双向链表
基于单向链表的循环链表
问题与讨论
高铁站信息显示
车站或者机场为了方便旅客了解最新出乘信息,会在电子屏上滚动显示最近的班次信息(如图1.2.9所示)。该系统内部程序控制滚动显示可以采用怎样的数据结构?主要算法又是怎样的?
常见的数据结构——队列
有序排队上车的乘客
有序排队接客的出租车
乘客排队时先到的总是从队伍的头部出去(出队)上车,而后到的乘客则必须在队伍的尾部加入(入队)。同时,为了确保有序,人们总是规定不能从队伍的中间部位插队。
常见的数据结构——队列
用计算机程序处理数据时,有时也需要将数据进行“排队”,并遵循现实中排队的规律,对数据进行“先进先出” FIFO(First In First Out)且中间不能“插队”的组织和操作,计算机科学家由此发明了“队列”这种数据结构。
常见的数据结构——栈
弹匣的装弹过程(入栈)
子弹进出弹匣的过程具有下列特点:
①整个装置只有一端开放(最上端),而且进、出只能在这一端进行。
②弹匣中的子弹成一纵队排列。
③任何子弹进出弹匣的规律是“先进后出、后进先出”,即最先装入弹匣的子弹最后才能被弹出,而最后装入弹匣的子弹则最先被弹出。
问题与讨论
在文字处理软件Word中输入若干文字,然后删除其中部分文字,再输入若干文字。然后进行“撤消”操作(按Ctrl+Z键,或者单击撤消操作快捷按钮“ ”)。
观察各个操作后的现象,回答下列问题。
(1)根据“撤消”操作所产生的结果,说明Word中符号输入及撤消操作中,内部所依托的数据结构是哪种数据结构?为什么?
(2)结合自己的经历,谈谈哪些信息系统中也采用了栈这种数据结构。
常见的数据结构——树
常见的数据结构——树
问题与讨论
分小组讨论,举出在生活和信息系统中用树组织数据的例子,并用树结构描述数据之间的关系特征。
数据结构的作用
姓名 班级 滚铁圈 打弹子 拍纸板 竹蜻蜓 跳绳 踢毽子
陈 涛 9 3 2
杨 琼 3 5 1
金 凯 2 4 5
吴 敏 1 6 1 3
朱刚强 6 5 1 7
… … … … … … … …
1. 设计算法解决问题离不开数据结构
数据统计前,需要先收集数据并将数据按照既有的逻辑关系进行结构化组织,可以用一张表格来组织数据并表示数据之间的逻辑关系。
数据结构的作用
2. 不同数据结构会导致处理效率的不同
xm(i) bj(i) d1(i) d2(i) d3(i) d4(i) d5(i) d6(i) sum(i)
陈 涛 9 3 0 2 0 0 0
杨 琼 3 0 0 0 0 5 1
金 凯 2 0 4 5 0 0 0
吴 敏 1 6 1 0 3 0 0
朱刚强 6 5 0 1 0 7 0
… … … … … … … …
其中的bjdf(j)表示第j班的总分
(1)用一维数组组织数据
程序代码:
数据结构的作用
2. 不同数据结构会导致处理效率的不同
xm(i) a(i,1) a(i,2) a(i,3) a(i,4) a(i,5) a(i,6) a(i,7) a(i,8)
陈 涛 9 3 0 2 0 0 0
杨 琼 3 0 0 0 0 5 1
金 凯 2 0 4 5 0 0 0
吴 敏 1 6 1 0 3 0 0
朱刚强 6 5 0 1 0 7 0
… … … … … … … …
(1)用二维数组组织数据
程序代码:
其中的bjdf(j)表示第j班的总分
数据结构的作用
2. 不同数据结构会导致处理效率的不同
二维数组程序实现:
一维数组程序实现:
不同数据结构会导致处理效率的不同
数据合并案例
生产厂家总会根据各地产品销量的数据分析来预估市场情况,并为后续调整生产规划、完善营销策略提供依据。
由于数据量巨大,为了充分运用分布式处理的优势,总部会要求各下属地区上报数据时,按各产品销量进行从大到小的排序。总部收到数据后的第一件事是将所有数据合并并按照销量进行降序排序(从大到小),为了完成数据合并和整理工作,总部数据分析员小刚需要设计合适的数据结构和算法。
不同数据结构会导致处理效率的不同
分析
小刚可以用一个二维数组存储所有下属地区的产品销量数据,然后直接运用排序算法进行降序排序。如果利用既有数据已是分块有序的特点,设计新的数据结构和算法,则处理效率可以得到相应的提升。
各个地区的数据合并问题可以简化为2个地区的数据合并问题,当2个地区的数据合并完成后,剩余各地区的数据合并就可以按照同样方式完成。因此,接下来着重分析2个地区的数据合并问题。
不同数据结构会导致处理效率的不同
第一步 抽象与建模
设第1个地区共有n个产品销量数据,第2个地区共有m个产品销量数据。为了简化描述,突出核心部分的分析,考虑将问题抽象为n个有序整数和m个有序整数的合并问题,具体的问题模型如下:
已知一个降序排列的整数数列A :a1,a2,a3,…,an以及一个降序排列的整数数列B:b1,b2,b 3,…,bm ,将两个数列合并形成一个新的有序数列C,使新数列仍按降序排列,即c1≥c2≥c3≥…≥ck≥ck+1≥…≥cn+m(其中ck ∈A或者ck ∈B)。请完成解决该问题的数据结构和算法的设计。
不同数据结构会导致处理效率的不同
第二步 设计、描述算法
1. 基于数组的算法设计与描述
(1)将数组a中所有元素存储到数组c的前n个位置中;
1 2 3 4 5
19 16 12 8 5
a
19
16
12
8
5
1 2 3 4 5
19 16 12 8 5
b
20
15
14
10
4
1 2 3 4 5 6 7 8 9 10
c
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
第二步 设计、描述算法
1. 基于数组的算法设计与描述
(2)将数组c右边的m个元素赋值为–1(c(n+1)直到c(n+m));
1 2 3 4 5
19 16 12 8 5
a
19
16
12
8
5
1 2 3 4 5
19 16 12 8 5
b
20
15
14
10
4
c
-1
-1
-1
-1
-1
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
第二步 设计、描述算法
1. 基于数组的算法设计与描述
(3)变量p赋值为0,将表示数组c中有效元素总个数的变量tot赋值为n ;
1 2 3 4 5
19 16 12 8 5
a
19
16
12
8
5
1 2 3 4 5
19 16 12 8 5
b
20
15
14
10
4
c
-1
-1
-1
-1
-1
0
i
p
tot
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
(4)将数组b中元素b(i)逐个插入到数组c中(1≤i≤m):
19
16
12
8
5
1 2 3 4 5
20 15 14 10 4
b
20
15
14
10
4
c
-1
-1
-1
-1
-1
0
i
p
tot
①p值增加1;
②如果c(p)>b(i),那么使p值增加1;
③如果c(p)=–1,那么直接将b(i)存储到c(p)中,同时tot值增加1;
④ 如果c(p)≤b(i),那么依次将c(tot),c(tot–1),…,c(p)向右移动一个位置,然后将b(i)存储到c(p)中,同时tot值增加1。
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
(4)将数组b中元素b(i)逐个插入到数组c中(1≤i≤m):
19
16
12
8
5
1 2 3 4 5
20 15 14 10 4
b
20
15
14
10
4
c
-1
-1
-1
-1
0
i
p
tot
①p值增加1;
②如果c(p)>b(i),那么使p值增加1;
③如果c(p)=–1,那么直接将b(i)存储到c(p)中,同时tot值增加1;
④ 如果c(p)≤b(i),那么依次将c(tot),c(tot–1),…,c(p)向右移动一个位置,然后将b(i)存储到c(p)中,同时tot值增加1。
p
p
②如果c(p)>b(i),那么使p值增加1;
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
(4)将数组b中元素b(i)逐个插入到数组c中(1≤i≤m):
19
16
12
8
5
1 2 3 4 5
20 15 14 10 4
b
20
15
14
10
4
c
-1
-1
-1
0
i
tot
①p值增加1;
②如果c(p)>b(i),那么使p值增加1;
③如果c(p)=–1,那么直接将b(i)存储到c(p)中,同时tot值增加1;
④ 如果c(p)≤b(i),那么依次将c(tot),c(tot–1),…,c(p)向右移动一个位置,然后将b(i)存储到c(p)中,同时tot值增加1。
p
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
(4)将数组b中元素b(i)逐个插入到数组c中(1≤i≤m):
19
16
12
8
5
1 2 3 4 5
20 15 14 10 4
b
20
15
14
10
4
c
-1
-1
0
i
tot
①p值增加1;
②如果c(p)>b(i),那么使p值增加1;
③如果c(p)=–1,那么直接将b(i)存储到c(p)中,同时tot值增加1;
④ 如果c(p)≤b(i),那么依次将c(tot),c(tot–1),…,c(p)向右移动一个位置,然后将b(i)存储到c(p)中,同时tot值增加1。
p
p
1 2 3 4 5 6 7 8 9 10
不同数据结构会导致处理效率的不同
(4)将数组b中元素b(i)逐个插入到数组c中(1≤i≤m):
19
16
12
8
5
1 2 3 4 5
20 15 14 10 4
b
20
15
14
10
4
c
-1
0
i
tot
①p值增加1;
②如果c(p)>b(i),那么使p值增加1;
③如果c(p)=–1,那么直接将b(i)存储到c(p)中,同时tot值增加1;
④ 如果c(p)≤b(i),那么依次将c(tot),c(tot–1),…,c(p)向右移动一个位置,然后将b(i)存储到c(p)中,同时tot值增加1。
p
p
p
不同数据结构会导致处理效率的不同
第二步 设计、描述算法
2. 基于链表的算法设计与描述
19
16
12
8
5 ^
链表a:
head_a
指针p1
指针p
20
15
14
10
5 ^
链表b:
head_b
指针q1
指针q
课堂小结
学习评价
对自己和同伴的表现进行客观的评价,并思考后续完善的方向。(5=优秀,4=超出一般水平,3=满意,2=有待改进,1=不太理想)
评分项 自我评价 同学互评
能理解数据结构的概念及其作用 5 4 3 2 1 5 4 3 2 1
了解常见数据结构的特点及其操作特征 5 4 3 2 1 5 4 3 2 1
能针对简单的具体问题明确数据需求、确定问题模型,并抽象出数据结构 5 4 3 2 1 5 4 3 2 1
能对数据结构的合理性进行简单评估 5 4 3 2 1 5 4 3 2 1
课堂作业