第1章 信息与计算机基础知识[上学期]

文档属性

名称 第1章 信息与计算机基础知识[上学期]
格式 rar
文件大小 4.3MB
资源类型 教案
版本资源 通用版
科目 信息技术(信息科技)
更新时间 2006-09-24 16:24:00

图片预览

文档简介

(共388张PPT)
第1章 信息与计算机基础知识
§1 信息与计算机
§2 信息的数字化方法与技术
§3 计算机硬件系统
§4 计算机软件系统
§5 微机系统的安装与维护
§1 信息与计算机
信息与信息技术
信息化与信息社会
信息处理的历史与计算机
信息系统及其应用
信息技术的发展趋势
§1 信息与计算机
虽然人们很早就开始自觉或不自觉地使用和处理信息,也产生了一些原始简单的信息处理技术,但真正意义上的信息技术,即现代信息技术,却是在最近几十年内迅速发展起来的。众所周知,现代信息技术的发展彻底改变了人们工作、学习和生活的方式。在这一改变中,计算机起了举足轻重的作用,无论是从信息的获得和存储,还是从信息的加工、传输和发布看,计算机都是最主要的处理工具。本节主要讨论信息的基本概念以及计算机的发展和主要应用领域。
1.信息与信息技术
什么是信息?
人们由于研究目的和角度不同,对信息的理解和解释也不尽相同。控制论的创始人维纳认为,信息是人们在适应外部世界并且将这种适应反作用于世界的过程中,同外部世界进行交换的内容的名称,接收信息和使用信息的过程,就是我们适应外部偶然性的过程。信息论的创始人香农说,信息是用以消除不确定性的东西。决策学的代表人物西蒙则提出,信息是影响人们改变对决策方案的期待或评价的外界刺激。
在信息技术应用领域,一般认为信息是经过加工、具有一定涵义的且对决策有价值的数据。由此也可看出,信息的表达是以数据为基础的。例如,“42%”是一项数据,但这一数据除了数字上的意义外,并不表示任何内容,而“张三得到42%的选票”对接收者是有意义的,接收者知道“42%”是表示客观实体张三的得票率这一属性值。因此,“张三得到42%的选票”不仅仅有数据,更重要的是给数据以解释,从而使接收者得到了客观实体张三的得票率信息。若再加一条信息“得票率大于40%,即可当选委员”,则综合以上两条信息之后可以得出一条抽象程度更高的信息,即“张三当选委员”。由此可见,数据和信息是密不可分的,而信息之间的联系又可以得到抽象层次更高的信息。
信息的基本特征
普遍性和无限性
寄载性
时效性
可处理性
共享性
层次性
传递性
(1)普遍性和无限性
由于信息反映的内容主要是事物的状态和特征,而这两者都是普遍存在的,这就决定了信息的普遍性。人类认识、接收和利用信息是无止境的,这又决定了信息的无限性。
(2)寄载性
寄载性有两个层次的涵义,一是信息必须借助于某种特定的“符号”来表示,如文字、图形和图像等;二是信息符号必须寄载于一定的物理介质上,如纸张、磁盘等。信息的这一特征要求我们设计和选择恰当的信息载体,并对其进行科学的编码,才能使信息的传递、保存、加工与利用更加方便有效。
(3)时效性
客观事物(或系统)都是在不断发展变化的,信息只有及时、新颖才有价值,才能发挥巨大的作用。换句话说,一条信息在某一时刻可能有很高的价值,但过了这一时刻它的价值可能大大降低,甚至没有价值。
(4)可处理性
可处理性是指信息的内容是可以被识别的,信息的形式是可以转换或变换的。信息可以被各种方法多环节地加工和处理,而经过某些处理(如分析、综合和提炼)后的信息可以比原始信息更具有价值。
(5)共享性
信息可无限扩散,信息本身不会因为知道的人数增加而减少。但却可能会因信息被分享,而使信息的所有者蒙受损失。例如,企业的技术专利、军事动态等就有这种共享性。为了避免信息共享给信息的所有者造成损失,信息共享往往是有范围(区域上、时间上)和有条件的。
(6)层次性
信息的层次性,表现在三个方面:一是一般信息与重要信息;二是上层信息与下层信息;三是表层信息与深层信息。不同层次的信息,其作用是不同的。收集不同层次信息目的是能够准确、深入地把握信息所反映的事物的真实内涵。只有合理地确定层次,才能正确地确定信息需求的范围和信息的价值,并有效地进行信息处理。
(7)传递性
信息在时间和空间上都具有传递性。从时间的延续性讲,信息可以借助于各种载体而被代代相传,信息在时间上的传递叫做信息的存储;从空间转移的角度讲,信息也可以从一个位置传递到另一个位置,信息在空间上的传递叫做通信。
除了以上特征外,信息还有许多其他特征,如主观性、抽象性、整体性、滞后性和不完全性等。
信息技术
信息技术,最简单的理解就是人们处理信息的相关技术。它是随着人类的出现而出现,随着人类文明的进步而不断发展起来的。尤其是在最近二三十年,科学技术得到了有史以来最迅猛的发展,各种高新技术如雨后春笋般纷纷出现。借助于这些高新技术,信息技术也得到了前所未有的发展,而且已经成为当代新技术革命最活跃的领域。
我们现在所讲的信息技术一般是指最近几十年刚刚发展起来的现代信息技术,它是指利用电子计算机和现代通信手段实现信息的获取、传递、存储、处理、显示和分配等相关技术。
具体来讲,信息技术主要包括以下几方面。
(1)感测与识别技术
感测技术包括传感技术和测量技术,它的作用是扩展人类获取信息的感觉器官功能,尤其是由传感技术、测量技术和通信技术相结合而产生的遥感技术,更使人感知信息的能力得到进一步的加强。信息识别包括文字识别、语音识别和图形识别等,识别技术的实现通常要借助于一种叫做“模式识别”的方法。
(2)信息传递技术
它的主要功能是实现信息快速、可靠、安全的转移。各种通信技术都属于这个范畴。广播技术也是一种传递信息的技术。由于存储、记录可以看成是从“现在”向“未来”或从“过去”向“现在”传递信息的一种活动,因而也可将它看作是信息传递技术的一种。
(3)信息处理与再生技术
信息处理包括对信息的编码、压缩、加密等。在对信息进行处理的基础上,还可形成一些新的更深层次的决策信息,这称为信息的“再生”。信息的处理与再生都有赖于现代电子计算机的超凡功能。
(4)信息施用技术
它是信息过程的最后环节。包括控制技术、显示技术等。
从以上分析可以看出,现代信息技术是一种综合性技术,它的支柱技术主要包括计算机(Computer)技术、通信(Communication)技术和控制(Control)技术,即“3C”技术。
当今时代,各个领域处理的信息量越来越大,处理的信息形式越来越复杂,这就要求各类专业技术人员能利用信息技术开发出各种实用的信息产品应用于这些领域,加快这些领域信息处理的效率,而信息技术的发展又为它的全面应用铺平了道路。目前信息技术的应用领域主要包括:办公、工业、科研教育、医疗保健、军事和家庭等。
2. 信息化与信息社会
信息化
信息社会
信息化
信息化是近年来世界各国都非常关注的并具有深远影响的战略课题。与此相应,有关未来信息社会的种种构想与预测也在不同的媒体中出现,以不同的方式被公众所了解。
信息化也称国民经济和社会信息化,是指在国民经济和社会各个领域,不断推广和应用计算机、通信、网络等信息技术和其他相关智能技术,达到全面提高经济运行效率、劳动生产率、企业核心竞争力和人民生活质量的目的。信息化是工业社会向信息社会的动态发展过程。在这一过程中,信息产业在国民经济中所占比重上升,工业化与信息化的结合日益密切,信息资源成为重要的生产要素。
信息化的内容包括信息的生产和应用两大方面。信息生产要求发展一系列高新信息技术及其产业,既涉及微电子产品、通信器材和设施、计算机软硬件、网络设备的制造等领域,又涉及信息和数据的采集、处理、存储等领域。信息技术的应用主要表现在用信息技术改造和提升农业、工业、服务业等传统产业上。
信息化已经成为当今世界经济和社会发展的趋势,这种趋势主要表现在:(1)信息技术突飞猛进,成为新技术革命的领头羊;(2)信息产业高速发展,成为经济发展的强大推动力;(3)信息网络迅速崛起,成为社会和经济活动的重要依托。目前,世界各国正在积极应对信息化的机遇和挑战。
信息社会
信息社会也称为信息化社会,一般是指信息产业高度发达且在产业结构中占据优势,信息技术高度发展且在社会经济发展中广泛应用,信息资源充分开发利用且成为经济增长的基本资源。
信息社会是信息化的必然结果,但信息社会与工业社会并没有一个严格的界限,应该是一个渐进的、逐步的演化过程。尽管如此,信息社会还是会表现出一些与工业社会不同的地方,这些特征主要包括:(1)由于人类脑力劳动的相当部分可以由计算机信息系统来代替,从而极大地增强了人类处理信息的能力;(2)社会信息交换将很大程度上围绕信息网络及其服务中心展开;(3)信息产业将成为社会的主要支柱产业之一;(4)专业技术阶层成为社会的主导阶层和中坚力量;(5)在社会生产中,体力劳动和资源的投入相对减少,脑力劳动和科学技术的投入相对增加。
3. 信息处理的历史与计算机
信息处理的历史
计算机的发展和应用
信息处理的历史
信息作为一种社会资源自古就有,一直以来人类也在不断地利用各种信息资源。要利用信息资源,就需要对它进行加工和处理。我们可以把人类处理信息的历史大致分为四个阶段。
(1)信息处理的原始阶段
在这一阶段,人类主要是通过语言来传播和继承知识及信息。除此以外,人类也已通过结绳记事、筹码计算等手段,开始超出大自然所赋予的器官与功能,借助各种“身外之物”来帮助自己处理信息。因此,可以说信息技术的萌芽在这里已经显现。原始的人类在利用工具延长自己的手臂,利用钻木取火获取能量的同时,也已经开始利用各种原始的技术协助自己处理信息。
(2)信息处理的手工阶段
信息处理手段的第一次质的飞跃是文字的产生与使用。文字的出现使人们在信息的存储方面有了重大的突破。作为一个整体、一个民族、一个部落有了独立于个别人的头脑之外的、可靠稳定的、不受时间与空间限制的、共同的信息存储形式。这与只靠语言来传播和继承知识与信息的时代相比,无疑是一个极大的进步。与此同时,信息的存储、加工、传递和显示等方面,在这一阶段也有了相应的进步与发展。如纸张的产生与印刷术的进步使信息的存储和传递有了很好的载体;同样,从古代的筹算到流传至今的算盘,也是早期信息处理技术的典型例子;遍布全国的烽火台系统和驿道系统同样表现出我们的祖先为加快信息传递速度而做出的巨大努力;我国古代发明的指南针则是原始的感测技术和显示技术。
(3)信息处理的机电阶段
以蒸汽机的出现为标志,工业革命在物质和能量的使用方面开创了一个全新的时代。在信息处理方面,工业革命的思想与技术同样产生了一系列成果。例如,帕斯卡发明的机械计算机,这种设备可以在一定程度上帮助人们从事大量数据的累加、乘除等运算。以其为原形发展起来的手摇计算机直到60年代初还在许多地方使用。在信息的加工与传递上,由于电的使用,人类又发明了一系列新的技术,如电报(包括有线的与无线的)和电话。这些技术与设备使人类信息处理能力有了进一步的提高。这个时期可以称之为机械与电气为主要手段的机电时代。
(4)信息处理的现代阶段
上个世纪中叶,由于生产社会化程度的空前提高,人类在信息处理方面也进入了一个全新的阶段,我们可以称之为信息处理的现代阶段,或信息处理的电子时代。所谓现代信息技术,就是指在这几十年内迅速发展起来并迅速普及的一系列技术(其核心是计算机技术、现代通信技术和控制技术)。正是这些技术构成了现代信息处理的基础。
2. 计算机的发展和应用
计算机技术作为现代信息技术的核心之一,它的发展和应用从根本上改变了人类收集、加工、处理和利用信息的方式方法。要理解信息技术和信息处理的实质,必须首先对计算机有一个完整而全面的了解,下面首先介绍一下电子计算机的发展历史和主要应用领域。
计算机的发展
1946年2月15日,世界上第一台通用电子数字计算机ENIAC(Electronic Numerical Integrator And Calculator)宣告研制成功。ENIAC的研制成功,是人类信息技术发展史上的一座里程碑,是在发展计算技术的历程中达到的一个新的高度,同时也是一个新的起点。如图1.1所示。
图1.1 第一台电子计算机
ENIAC计算机的最初设计方案,是由36岁的美国工程师莫奇利于1943年提出的。总工程师由年仅24岁的埃克特担任。ENIAC共使用了18000个电子管,1500个继电器以及其他器件,安装在面积为9×15米2的室内。ENIAC的存储量很小,只能存放20个10位的十进制数,运算速度为5000次/秒加法运算。虽然ENIAC的能力根本无法与现在的计算机相比,但它开启了人类用计算机处理信息的崭新一页。
计算机从最初用电子管作为元器件,发展到今天用超大规模集成电路作为元器件,已走过了近60年的历程。习惯上,人们根据计算机所用的逻辑元器件的种类不同对计算机进行了分类,大致上分成4个发展阶段。
(1)第一代计算机
世纪40年代末和50年代初获得重大发展。除ENIAC外,大多数计算机都是依照“存储程序和程序控制”原理设计制造的,其主要代表机型有IBM-701和UNIVAC-1等。其实,后来(直到现在)的计算机也一直是用“存储程序和程序控制”原理设计制造的,由于这一原理是由美籍匈牙利数学家冯·诺依曼提出来的,所以习惯上把这一类计算机叫做“冯·诺依曼机”。电子管体积大、功耗高、反应速度慢且寿命短,导致第一代计算机体积大、耗电量大、可靠性差、维护困难且计算机速度慢。这个时期的计算机采用延迟线或磁鼓作为内存储器,外存储器开始使用磁带机,存储容量有限。在软件方面,这个时期的计算机只使用机器语言和符号语言,没有高级语言,更没有操作系统等系统软件。
(2)第二代计算机
第二代电子计算机于20世纪50年代中期问世,以晶体管代替电子管,并增加了浮点运算。第二代计算机的运算速度和工作可靠性都较第一代有明显改善。内存储器采用磁芯,磁盘开始作为外存储器使用,容量较第一代计算机有较大增加。在软件方面,产生了如FORTRAN、COBOL和ALGOL60等高级程序设计语言,也有了操作系统的雏形—系统管理软件。
(3)第三代计算机
一个晶体管、两个电阻和一个电阻与电容的组合。后来集成电路工艺日趋完善,1964年4月IBM360系统问世,它成为使用集成电路的第三代电子计算机的著名代表。发展到20世纪70年代初期,大部分电路元件都已经以集成电路的形式出现,甚至在约1cm2的芯片上,就可以集成上百万个电子元件。因为它看起来只是一块小小的硅片,因此人们常把它称为芯片。与第二代相比,第三代计算机的速度和稳定性有了更大程度的提高。内存储器普遍采用半导体器件,存储容量进一步提高,可靠性和存取速度也有了明显的改善。高级程序语言进一步发展,产生了标准化的高级程序设计语言和人机会话式的BASIC语言,系统管理程序上升为操作系统。
(4)第四代计算机
在1967年和1977年,分别出现了大规模集成电路和超大规模集成电路,并于20世纪70年代中期在电子计算机上得到了应用。由大规模和超大规模集成电路组装成的计算机,就被称为第四代电子计算机。第四代计算机体积更小,可靠性更强,寿命更长。计算机软件的配置空前丰富,软件系统开始工程化、理论化,程序设计部分自动化。
早在上个世纪70年代,人们就开始研制第五代计算机,设想中的第五代计算机应该是具有高智能的,它不仅具有存储和记忆功能,而且应该有学习和掌握知识的机制,并能模拟人的感觉、行为和思维等。尽管至今没有出现真正意义上的第五代计算机,但计算机技术并没有停止不前。这一时期,计算机的硬件性能不断得到提高,软件也得到了空前的发展。
计算机的分类
计算机按用途可分为专用计算机和通用计算机。
专用与通用计算机在其效率、速度、配置、结构复杂程度、造价和适应性等方面是有区别的。
专用计算机针对某类问题能显示出最有效、最快速和最经济的特性,但它的适应性较差,不适于其它方面的应用。我们在导弹和火箭上使用的计算机很大部分就是专用计算机。但这些计算机就是再先进,你也不能用它来玩游戏。
通用计算机适应性很强,应用面很广,但其运行效率、速度和经济性依据不同的应用对象会受到不同程度的影响。
通用计算机按其规模、速度和功能等又可分为巨型机、大型机、中型机、小型机、微型机及单片机。这些类型之间的基本区别通常在于其体积大小、结构复杂程度、功率消耗、性能指标、数据存储容量、指令系统和设备、软件配置等。
一般来说, 巨型计算机的运算速度很高,可达每秒执行几亿条指令甚至更高,数据存储容量很大,规模大结构复杂,价格昂贵,主要用于大型科学计算。它也是衡量一国科技实力的重要标志之一。 单片计算机则只由一片集成电路制成,其体积小,重量轻,结构十分简单。性能介于巨型机和单片机之间的就是大型机、中型机、小型机和微型机。它们的性能指标和结构规模则相应地依次递减。
计算机的特点
计算机之所以在信息处理中起了至关重要的作用,是与其处理问题的特点分不开的,计算机的主要特点包括:
处理速度快
存储容量大,存储时间长久
计算精确度高
具有逻辑判断能力
应用领域广泛
计算机的应用领域
随着计算机硬件性能的不断提升和软件产品的不断丰富,计算机的应用变得越来越普及,它已经从最初单纯的科学计算,逐渐渗透到人们工作、学习和生活的各个领域,其中最主要的应用有以下几个方面。
(1)科学计算
计算机最早是应用于科学计算方面,世界上第一台计算机就是用于研制原子弹而制造的。除了在解决科学实验和工程技术中所提出的数学问题之外,计算机在物理、化学、生物、材料等领域的数据测算方面的作用也非常明显,在航天技术中卫星轨道的计算更是离不开计算机。我们每天收看到的天气预报,也要通过计算机来对大量的数据作快速的计算处理,用巨型计算机计算,就能快速、及时、准确地获得计算结果。
(2)信息处理
信息处理主要是指非数值形式的数据处理。计算机信息处理在社会和经济发展中的作用越来越为人们所重视。信息处理包括对数据资料的收集、存储、加工、分类、排序、检索和发布等一系列工作。计算机信息处理包括办公自动化(OA)、企业管理、情报检索、报刊编排处理等。计算机数据处理的特点是信息处理及时、数据量大、处理速度快,并能给出各种形式的输出格式。目前计算机应用已深入到经济、金融、保险、商业、教育、档案、公安、法律、行政管理、医疗、社会普查等各个方面。目前计算机在信息处理方面的应用已经远远超过它在其它方面的应用,已占所有应用的80%左右。
(3)过程控制
在科学技术、军事、工业、农业以至于我们的日常生活的各个领域都应用到过程控制。用于过程控制的计算机,先将模拟信息如压力、速度、电压、温度等模拟量转换成数字量,然后再由计算机进行处理。计算机处理后输出数字量结果,再将其转换成模拟量去控制对象。过程控制一般都是实时控制,有时对计算机运算速度的要求不高,但要求可靠性高、响应及时,这样才能保证被控制对象的准确动作。
(4)计算机辅助系统
计算机辅助系统有:
计算机辅助教学(CAI)、
计算机辅助设计(CAD)、
计算机辅助制造(CAM)、
计算机辅助测试(CAT)、
计算机集成制造(CIMS)等系统。
4. 信息系统及其应用
信息系统是一种专门的系统,它对各种数据进行采集、处理、传播,产生能解决某方面问题的数据和信息,并按照一定的要求产生决策信息,以实现预期目标的有组织的应用工程。信息系统一般分为三种:事务处理系统(Transaction Processing System)、管理信息系统(Management Information System)和决策支持系统(Decision Support System)。
事务处理系统
事务处理系统是用来记录完成某商业交易中的人员、过程、数据以及设备的人机系统。如证券实时交易系统就是一个事务处理系统。过去,证券交易只能通过手工填单或电话委托方式将委托数据报给交易所,这种人工报单方式速度慢,容量小,实时性差,功能少。现在,用户可以直接在系统的客户端进行交易委托,完成交易。另外,系统还可以提供资金存取、成交交割和查询功能,从而大大提高了证券交易的效率。其它常见的事务处理系统还有航空订票系统、高校招生录取系统和图书借阅系统等。
管理信息系统
管理信息系统主要是一个以人为主导,利用计算机、网络通信设备和其他办公设备,对数据进行收集、传输、加工、存储、更新和维护,支持企事业中高层决策、中层控制、基层运作的集成化的人机系统。以办公室信息管理系统为例,过去由人工管理职工的档案、工资明细等,工作量大,查找麻烦,易出错。而通过办公室管理系统管理职工档案、工资信息,则大大方便了查询、修改和更新,简化了公办手续,提高办公效率。现在已经有许多企事业单位开发出了针对本单位的管理信息系统,如企业单位的职工管理系统,事业单位的效能监督系统,各类学校的学生管理系统等。
决策支持系统
决策支持系统是一种以计算机为基础和工具,应用决策科学和其他有关的理论和方法,辅助决策者进行决策的信息系统。如证券分析系统就是一个决策支持系统,过去,股民通过手工记录每日股票行情或凭经验买卖股票,这样盲目操作,投资风险大、收益低。现在,各种证券分析系统将每日行情写入决策数据库,根据历史数据以及相关决策理论和方法来分析和预测未来股票走势。投资人可以根据决策系统提供的种买卖指示信息,及时买卖股票,减少了投资的盲目性,降低了投资风险,提高了投资回报。其它常见的决策支持系统还有企业客户资源分析系统、政府部门各类预警决策系统等。
除了以上三种,还有一种非常重要的信息系统叫做专家系统,它是由知识库、推理引擎及接口为基础组成的信息系统,其目的在于对某一特定领域的问题作出判断、解释及认知。医院专家系统是应用最为广泛的一种专家系统,目前已经开发出的一些针对疑难疾病的专家系统,记录了以往各个专家对某一种疾病的临床经验,它可以为那些需要向专家咨询的医生提供帮助,帮助他确定病人所患何种疾病以及如何治疗种疾病。
5. 信息技术的发展趋势
回顾二十世纪,信息技术的迅猛发展,推进了世界信息化的进程,也推动着信息产业的持续高速发展,创造出了众多的新产品、就业机会和新的财富,改变了人们的工作、生活、消费以及思维方式,提供了经济增长的新模式。展望21世纪,一个全新的信息社会的形态给信息技术的应用提供了无限的创造和发展空间。特别是由于信息技术和信息产业主要依靠知识、高技术的投入,具有技术含量高、增长率高、附加值高的特点,随着世界经济由投资拉动型向知识、技术推动型转换,信息技术的发展将成为推动世界经济高速增长的强大动力,信息产业也将成为全球最大的产业。以下就几个主要的方面,简单谈谈信息技术发展的趋势。
(1)电话网、有线电视网、计算机网(主要指Internet)“三网合一”将成为信息技术发展的必然。目前已经发展的IP电话就是基于Internet的数字通信进行的,人们购买了IP电话卡就可以利用普通的电话机以更便宜的价格进行通话,这时通信的信道主要是Internet,传输的是数字信号。将来的发展将是集电视、录放、计算机和Internet数据接收等综合功能于一体的独特电视—IP电视。IP电视将打破电视机、录放机与计算机之间的界限,实现在宽带网上同时进行数据、图像、语言多媒体信息的高速互动传播和处理,并使各种业务活动都可以在网上方便快捷地进行。因此有人预言:在二十一世纪,IP电视将会成为各种政治、社会、经济、文化的信息平台。
(2)数字化将是信息技术发展的又一个必然趋势。一方面数字化设备便于大规模生产,生产一台模拟设备需要花很多时间,模拟电路每一个单独部分都需要进行单独设计单独调试,而数字设备是单元式的,设计非常简单,便于大规模生产,可以大大降低成本。另一方面数字化有利于综合,每一个模拟电路其电路物理特性区别都非常大,而数字电路由二进制电路组成,非常便于综合。
(3)集成电路技术、软件技术、计算机技术、通信技术、广播电视技术等多专业技术彼此联系、相互结合、互为支撑的趋势日渐明显。
(4)信息技术发展将导致更加高速、更大容量的信息化产品不断出现。无论是计算机的核心CPU,还是各种存储设备和网络通信设备的速度都将越来越快,容量也将越来越大。
(5)计算机软件将更加开放。各种软件将遵循统一的标准,不同的软件之间可以相互访问,异构数据库也可以互联互访。大量的软件被开发成软件构件形式,从而可以象工业产品一样随意组装。
(6)信息技术的发展将进入后PC时代。也即将微电子技术、微处理器技术等应用到所有的家用电器上,使家用电器进一步智能化,同时还可在家庭内部建立局域网,使所有的家电都上网。如使家里的空调、冰箱、洗衣机、电视机、移动电话、电话、电饭煲、微波炉等均联网。这样不仅方便调控,而且还可以在异地通过联网遥控使用自己家里的电器,使人们可以更高效地利用时间。
§2 信息的数字化方法与技术
数值信息的表示
文本信息的表示
图像与图形信息处理技术
声音信息的处理技术
视频信息的处理技术
§2 信息的数字化方法与技
由于二进制编码具有运算简单、电路实现方便、成本低廉等优点,所以无论是什么类型的信息,在计算机内部都是以二进制编码形式表示的。这些信息包括数值、文本、图形图像、声音和视频等。本节主要介绍这些信息如何在计算机中被表示及一些相关技术。
1. 进位计数制
所谓进位计数制,就是按进位的方法进行计数。下面只介绍我们习惯使用的十进制以及与计算机比较相关的二进制和十六进制。
(1)十进制
十进制中使用0、1、2、3、4、5、6、7、8、9这十个符号来计数,称为十个数码,采用的计数规则是:逢十进一。由此可见,各相邻位之间的“权”之比都是10。所谓“权”是指在进位数制中,为了确定一个数位的实际值而需乘上的一个因子。如3468.795这个数中的4就表示4×102=400,这里把102称作位权(即我们所说“百”位),简称为“权”,十进制数权的一般形式为10 n(n = ……, 2, 1, 0, -1 ,-2, ……)。每个十进制数都可以表示成按“权”展开的多项式。例如:3468.795=3×103+4×102+6×101+8×100+7×10-1+9×10-2+5×10-3
(2)二进制
计算机中的数据是以二进制形式存放的,二进制数的数码是用0和1这两个符号来表示的。权为2n(n=……,2,1,0,-1,-2,……),二进制数的计数规则是:逢二进一。
对于一个二进制数,也可以表示成按权展开的多项式。例如:
10110.101=1×24+0×23+1×22+1×21+0×20+1×2-1+0×2-2+1×2-3
(3)十六进制
十六进制数的数码是用0、1、……、 9、A、B、C、D、E、F十六个符号来表示的。权为16n(n=……, 2,1,0,-1,-1,……),十六进制数的计数规则是:逢十六进一。十六进制同样可以表示成按权展开的多项式。例如:
1CB.D8=1×162+12×161+11×160+13×16-1+8×16-2
为了区分一个数是几进制表示的数,可以使用两种方法。一种方法是在数的后面加一个大写字母,其中,B表示二进制数,D表示十进制数,H表示十六进制数,O表示八进制数。如101B表示二进制数101,而101H表示十六进制数101。另一种方法是将要表示的数用小括号括起来,然后用一个下标表示该数是几进制数,如(10110.101)2表示一个二进制数,而(10110.101)10表示一个十进制数。
数制之间的转换
(1)二进制、十六进制转换为十进制
要将一个二进制数或十六进制数转换为十进制数,可以统一将这个数按权位展开成多项式,然后计算该多项式的值即为十进制数。
例1.1 将二进制数(1011.101)2转换成等值的十进制数。
(1011.101)2 = 1 23+0 22+1 21+1 20 +1 2-1 + 0 2-2+1 2-3 =(11.625)10
例1.2 将十六进制数(3D.B)16转换成等值的十进制数。
(3D.B)16=3×161+13×160+11×16-1=(61.6875)10
(2)十进制数转换为二进制数
要将一个十进制数转换为二进制数,首先要把这个十进制数分为整数部分和小数部分,然后对整数部分采用“除2取余”法得到相应二进制数的整数部分,小数部分则采用“乘2取整”法得到相应的二进制数的小数部分,最后将两部分合起来就得到了与原十进制数等值的二进制数。具体的转换可以参考下面的例子。
例1.3 将十进制数26.8125转换为等值的二进制数。
如图1.2所示,整数部分26采用“倒除法”转换为二进制数是11010,这里“取余值”要从下往上取,小数部分0.8125转换为二进制数是0.1101,这里“取整值”则要从上往下取,最后将两部分合起来得到的结果是(26.8125)10 = (11010.1101 )2
同理,十进制数转换为十六进制数可以用整数部分“除十六取余”法和小数部分“乘十六取整”法求得。
图1.2 十进制数转换为二进制数
(3)二进制数与十六进制数之间的相互转换
将二进制数转换为十六进制数的方法是:将要转换的二进制数从小数点开始分别向左(整数部分)和向右(小数部分)每4位二进制数码分成一组,在最左或最右不足四位的用0补足,补0的方法是:整数部分补在左边,小数部分补在右边。分别将4位二进制数码转换成一位十六进制数码后,将这些十六进制数码连接起来就是相应的十六进制数了。
例1.4 将二进制数11010011010.11101010011转换为等值的十六进制数。
图1.3 二进制数转换为十六进制数
如图1.3所示,此二进制数对应的十六进制数为69A.EA6 。将一个十六进制数转换为二进制数的方法是:每位十六进制数码用对应的4位二进制数替换,并去掉整数部分最左边的0和小数部分最右边的0。
二进制数的运算
在计算机中,对二进制数可作两种基本运算:算术运算和逻辑运算。其中二进制数的算术运算包括加、减、乘、除,具体规则如下:
加法:0+0=0 1+0=1 0+1=1 1+1=0 (有进位)
减法:0–0=0 0–1=1(有借位) 1–0=1 1–1=0
乘法:0×0=0 0×1=0 1×0=0 1×1=1
除法:0÷1=0 1÷1=1
二进制数的逻辑运算包括与、或、非三种基本运算,它们的具体运算规则如下:
与运算:0∧0=0 0∧1=0 1∧0=0 1∧1=1
或运算:0∨0=0 0∨1=1 1∨0=1 1∨1=1
非运算:
数据单位
位(bit)也称为比特,是计算机存储数据的最小单位,是二进制数据中的一个位,一位表示二进制信息0或1。例如,1001001一共有8位。
字节(Byte)简记为B,一个字节由8个位组成,即1B=8bits。字节是计算机数据处理的基本单位,例如“10001100”是一个字节。通常一个字节可以存放一个ASCII码,两个字节可以存放一个汉字机内码。
在计算机中,其它经常使用的度量单位主要还有:KB、MB、GB和TB等,下面是它们之间的换算关系:
1KB=210 Bytes =1024Bytes
1MB=210 KB =1024KB
1GB=210 MB =1024MB
1TB=210 GB =1024GB
数值在计算机中的表示
我们已经知道,数值信息在计算机中是以二进制形式表示的,但它们究竟是如何被表示的呢?是不是直接存放它们的二进制值呢?事实上,我们除了要表示一个数的值以外,还要考虑它的正负号如何表示,小数点如何表示,甚至也要考虑如何表示更有利于计算机实现,如何设计表示的范围更大,如何表示精度更高等。
整数的表示
表示一个整数除了要表示其绝对值外,还要表示其正负。由于计算机内部采用二进制,所以计算机最终只能用0或1表示正负号。历史上曾经出现过的表示整数的编码方案主要有:原码、反码和补码,现在的计算机基本上采用补码。这几种方案都是将最高位作为负号位,其中0表示正数,1表示负数。下面以8位表示一个整数为例,介绍计算机中整数的表示。
(1)原 码
最高位为符号位,其余为数值部分,数值部分用二进制数的绝对值表示整数的方法称为原码表示法,如+57和-57的原码表示为:
[+57]原 = 00111001
[-57]原 = 10111001
用原码表示时,虽然数的真值和它的原码表示之间的对应关系简单,但原码本身的运算逻辑复杂,所以不常使用。
(2)反 码
正数的反码与原码相同,负数的反码则是保持符号位为1,然后将其原码的数值部分按位取反得到的,如+57和-57的反码表示为:
[+57]反 = 00111001
[-57]反 = 11000110
虽然计算机中得到反码非常方便,但是反码用于计算还是比较麻烦,因此实际中很少使用,通常只是将反码作为求补码过程的中间形式。
(3)补 码
补码的表示法是:正数的补码与原码相同,负数的补码是将其原码除符号位外按位取反后加1得到的。如+57和-57的补码表示为:
[+57]补 = 00111001
[-57]补 = 11000111
由于补码可以用相同的运算规则来进行各种运算,使运算简化,并且运算逻辑的实现也比较容易,所以大多数计算机系统都采用补码来表示整数。
定点数
定点数采用整数的表示逻辑来存放带小数点的数。定点数是指小数点的位置固定,为了处理方便,一般分为定点纯整数和定点纯小数。其中,定点纯整数隐含小数点位置固定在数值部分的最后,定点纯小数隐含小数点位置固定在数值部分的最高位与符号位之间。
浮点数
与小数点位置固定的定点数相对应,浮点数是指小数点的位置是可以浮动的。在计算机中,这种数的表示法往往用来表示一般的实数。我们知道一个实数总可以表示成一个乘幂和一个纯小数之积,例如:
123.45 = 103 ( 0.12345 )
-0.0034574 = 10-2 ( -0.34574 )
乘幂中的指数部分我们称其为“阶码”(这是一个整数),而括号中的部分我们称其为“尾数”(这是一个纯小数),尾数和阶码都有正负之分。同理,任何一个二进制数也可以表示成相同的形式,例如:
1001.011 = 2100 ( 0.1001011 )
-0.0010101 = 2-10 ( -0.10101 )
图1.4 浮点数格式
所不同的是这里的阶码和尾数都是用二进制数表示的。这样只要我们能表示出一个二进制数的阶码和尾数,那么也就唯一地表示出了这个数。在计算机内部,浮点数通常表示成如图1.4所示格式。
其中,符号位占一位,用来表示尾数的正负号,阶码用整数表示,尾数用定数小数表示。阶码和尾数的位数可以根据对表示精度和范围的要求不同而不同,也会因整个数的长度不同而不同。以一个32位浮点数为例,若规定阶码长8位,则尾数长为23位。但由于阶码可以选用不同的编码(原码、补码等),尾数的格式和小数点位置也可以有不同的规定,因此,不同的计算机中浮点数的表示方法可以互不相同。
2. 文本信息的表示
文本是文字信息在计算机中表示的统称,它是基于特定字符集的具有上下文相关性的一个字符流,每个字符均使用二进制编码表示。文本在计算机中的处理包括输入、编辑、存储、传输和显示等过程,每个环节对文本的编码都可能不同,下面介绍几种主要编码方案。
西文字符的编码
常用字符的集合叫做“字符集”。西文字符集由英文字母、数字、标点符号和一些特殊符号组成。字符集中的每一个符号都有一个代码,即字符的二进制编码。目前计算机中使用得最广泛的西文字符集是ASCII字符集,其编码称为ASCII码,即美国标准信息交换码(American Standard Code for Information Interchange),同时对应的国际标准是ISO646。基本ASCII码采用一个字节表示一个字符,但只使用字节的低7位,所以可以表示0~27 共128个字符。其中96个是可打印字符,32个是控制字符,表1.1为ASCII字符表,b3 b2 b1 b0为ASCII的低4位,b6 b5 b4为ASCII的高3位。
由于标准ASCII字符集只有128个字符,在很多应用中无法满足要求,为此国际标准化组织又制定了ISO2002标准,称为《七位字符集的代码扩充技术》,它规定了在保持与ISO646兼容的前提下,将ASCII字符扩充为8位代码的统一方法。
表1.1 ASCII码字符编码
表1.1 ASCII码字符编码表
b6 b5 b4
b3 b2 b1 b0
000
001
010
011
100
101
110
111
0 0 0 0
NUL
DLE
SP
0
@
P
`
p
0 0 0 1
SOH
DC1
!
1
A
Q
a
q
0 0 1 0
STX
DC2
"
2
B
R
b
r
0 0 1 1
ETX
DC3
#
3
C
S
c
s
0 1 0 0
EOT
DC4
$
4
D
T
d
t
0 1 0 1
ENQ
NAK
%
5
E
U
e
u
0 1 1 0
ACK
SYN
&
6
F
V
f
v
0 1 1 1
BEL
ETB
'
7
G
W
g
w
1 0 0 0
BS
CAN

8
H
X
h
x
1 0 0 1
HT
EM

9
I
Y
i
y
1 0 1 0
LF
SUB
*
:
J
Z
j
z
1 0 1 1
VT
ESC
+
;
K
[
k
{
1 1 0 0
FF
FS

<
L
\
l
|
1 1 0 1
CR
GS
-
=
M
]
m
}
1 1 1 0
SO
RS
.
>
N
^
n
~
1 1 1 1
SI
US
/

O
_
o
DEL
汉字的编码
中文文本的基本组成单位是汉字。目前我国汉字的总数超过6万,数量大,字形复杂,同音字多,异体字多,这就给汉字在计算机内部的表示与处理、传输与交换、输入、输出带来了一系列问题。
GB2312-80汉字编码
汉字编码方案有多种,GB2312-80是应用最为广泛的一种。GB2312-80是我国于1981年颁布的一个国家标准—信息交换用汉字编码字符集·基本集(GB2312-80),简称国标字符集,其编码称为国标码。国标码用两个字节编码一个汉字,并且规定每个字节只用低七位,即高位都为0。它对6763个常用汉字和682个其他基本图形字符进行了编码。
GB2312国标字符集由三部分组成。第一部分为字母、数字和各种符号;第二部分为一级常用汉字,共3755个,按汉语拼音排列;第三部分为二级常用字,共3008个,因为不太常用,所以按偏旁部首排列。
GB2312国标字符集构成一个二维平面,由94行和94列组成,其中的行号称为区号,列号称为位号。每一个汉字或符号都有一个唯一的区号和位号,将区号和位号放在一起,就构成了汉字或符号的区位码。例如,“文”字的区号是46,位号是36,所以它的区位码是4636。图1.5是GB2312-80字符集及区位分布情况。
图1.5 GB2312-80字符集及区位分
区位码中的区号和位号都是十进制数,区位码与国标码之间的关系如下:
国标码首字节=区号(二进制表示)+00100000B
国标码尾字节=位号(二进制表示)+00100000B
根据“文”字的区位
码“4636”,可以计算出它的国标码是01001110 01000100,用十六进制数表示为4E44H。具体计算过程如下:
“文”国标码首字节=00101110B(区号20的二进制表示)+00100000B=01001110B
“文”国标码尾字节=00100100B(位号20的二进制表示)+00100000B=01000100B
由于文本中的汉字与西文字符经常是混合在一起使用的,在计算机内部,汉字信息如不予特别的标识,它与单字节的ASCII码就会混淆。为解决这一问题,采用的方法是将国标码的两个字节的最高位都置为1来做为汉字的机内表示,这样就可以将一个双字节汉字与两个单字节ASCII字符区分开来。这种汉字编码称为汉字的机内码,例如由“文”字的国标码,可以马上得到汉字的机内码是1100111011000100,用十六进制数表示为CEC4H。
GBK和GB18030
GB2312表示的汉字比较有限,因此一些偏僻汉字在GB2312中无法表示。随着计算机应用的普及,这个问题日渐突出,我国的信息标准化委员会就对标准进行了扩充,得到了扩充后的汉字编码方案GBK。它一方面向上兼容GB2312,另一方面将常用的繁体字填充到原编码标准中留下的空白码段中,使汉字数增加到20902个。值得注意的是GBK不是一个国家标准,而只是一个规范,随着GB18030国家标准的发布,它将完成它的历史使命。GB18030采用变长编码,其中两字节部分与GBK完全兼容,共收录了27484个汉字,总的编码数超过150万个码位
Unicode
随着国际互联网的迅速发展,进行数据交换的需求越来越大,不同的编码体系越来越成为信息交换的障碍,而且多种语言共存的文档不断增多,单靠ANSI代码页已很难解决这些问题,于是Unicode应运而生。
Unicode采用两个字节编码体系,因此它允许表示65536个字符,这已能满足目前大多数场合的需要。前128个Unicode字符是标准ASCII字符,接下来的128个扩展的ASCII字符,其余的字符供不同语言的文字和符号使用。其版本V3.0于2000年公布,内容包括字母和符号10236个、汉字27786个、韩文拼音11172个、造字区6400个、保留20249个,控制符65个。在Unicode中,ASCII字符也采用两个字节表示,这样,ASCII字符与其他字符的处理就统一起来了,这就大大简化了处理的过程。
汉字字库
汉字信息存储在计算机内采用机内码,但输出时必须转换成字形码,以人们熟悉的汉字形式输出才有意义。因此对每一个汉字,都要有对应的字的模型(简称字模)储存在计算机内,字模的集合就构成了字模库,简称字库。汉字输出时,需要先根据内码找到字库中对应的字模,再根据字模输出汉字。
构造汉字字形有两种方法:向量(矢量)法和点阵法。
向量法是将汉字分解成笔画,每种笔画使用一段的直线(向量)近似地表示,这样每个字形都可以变成一连串的向量。
点阵方式又称“字模点阵码”。每一个汉字以点阵形式存储在记录介质上,有点的地方为“1”,空白的地方为“0”。例如,可以将“字”字画在图1.6所示的64×64的方格上,每一行为64位(8个字节),共64行组成一个汉字的字形码,即共需要8(字节)×64=512字节。
图1.6 用点阵组成的汉字字形
如果对显示或打印的质量要求不是很高,也可以采用16×16点阵或24×24点阵。表示一个16×16点阵的汉字的字形只要2(字节)×16=32字节。点阵规模越大,每个汉字存储的字节数就越多,字库也就越庞大。但字形分辨率越好,字形也越美观。
大多数汉字信息处理系统把汉字字库存放在磁盘上,这样的字库称为“软字库”,使用时全部或部分调入内存储器,并通过专门的软件实现从汉字机内码转变为对应的汉字字模点阵码的地址,根据地址找到相应的字形码。
相对于“软字库”,一般将固化在EPROM或MASK-ROM的芯片中的汉字字库称为“硬字库”。一般打印机等设备中都安装有带有固化汉字库的集成电路芯片,以提高输出汉字的速度。
3. 图像与图形信息处理技术
计算机中的数字图像按其生成方法可以分为两大类,一类是从现实世界中通过数字化设备获取的图像,它们称为取样图像(Sampled Image)、点阵图像(Dot Matrix Image)和位图图像(Bitmap Image),以下简称图像(Image);另一类是计算机合成的图像(Synthetic Image),它们称为矢量图像(Vector Image),以下简称图形(Graphics)。
图像的数字化
从现实世界中获取数字图像的过程称为图像的获取(Capturing),所使用的设备称为图像获取设备,如扫描仪、数码相机和数字摄像机等。图像获取的过程实质上是模拟信号的数字化过程,如图1.7所示它的处理步骤大体分为三步:取样、分色和量化。
图1.7 图像的数字化过程
(1)取样。将画面划分为M N个网格,每个网格称为一个取样点。这样,一幅模拟图像就转换为M N个取样点组成的一个阵列。
(2)分色。将彩色图像取样点的颜色分解成3个基色(如R、G、B三基色),即每个取样点用3个亮度值来表示,称为3个颜色分量;如果不是彩色图像(即灰度图像或黑白图像),则每一个取样点只有一个亮度值。
(3)量化。对取样点的每个分量进行A/D转换,把模拟量的亮度值使用数字量(一般是8位到12位正整数)来表示。
一幅不经压缩的图像数据量可按下面的公式计算(以字节为单位):
图像数据量 = 图像水平分辨率 图像垂直分辨率 像素深度/8
所谓像素的深度是指表示每个取样点的颜色值所采用的数据位数。一幅640 480分辨率(即640 480采样点)的图像若分成红、绿、蓝三色,并且每一颜色分量的亮度用八位二进制数来表示,则可以计算出图像的数据量。由于每一个采样点有三个颜色分量,而且每个颜色分量用八位来量化,所以每一个采样点的数据位数为8+8+8=24bits,这就是像素深度。再根据以上公式,此图像数据量为640 480 24/8=900KB。表1.2列出了若干不同参数图像的数据量。
表1.2 几种常见图像的数据量
像素深度图像分辨率
8位(256色)
16位(65535色)
24位(真彩色)
640 480
300KB
600KB
900KB
1024 768
768KB
1.5MB
2.25MB
1280 1024
1.25MB
2.5MB
3.75MB
图像的压缩编码
由表1.2可知一幅未经压缩的图像的数据量是比较大的。这既不方便存储(浪费空间),也不利于图像在Internet上传输(传输速度慢、通信费用大),因此进行图像压缩就显得特别重要。
由于数字图像中的数据相关性很强,或者说数据的冗余度很大,因此对数字图像进行大幅度压缩是完全可能的。而且,人眼的视觉有一定的局限性,即使压缩前后的图像有一定的失真,只要限制在人眼无法察觉的误差范围之内,也是允许的。
数据压缩可分成两种类型,一种是无损压缩,另一种是有损压缩。无损压缩是指把压缩以后的数据进行图像还原(即解压缩)时,重建的图像与原始图像完全相同,例如行程长度编码(RLC)、哈夫曼(Huffman)编码等。有损压缩是指对压缩后的数据进行图像重建时,重建的图像与原始图像有一定的误差,但这种误差应不影响人们对图像含义的正确理解。常见的有损压缩编码有变换编码和矢量编码等。
为了便于在不同的系统中交换图像数据,人们为计算机中使用的图像压缩编码方法制订了一些国际标准和工业标准。其中最著名的是JPEG,它是一个静止图像数据压缩编码国际标准。JPEG的适用范围比较广,能处理各种连续色调的彩色或灰度图像,算法复杂度适中,既可用硬件实现,也可用软件实现。另外,JPEG图像的压缩比是用户可以控制的。压缩比越低,图像质量越好,反之,质量越差。
计算机图形
与从实际景物获取其数字图像的方法不同,人们也可以对景物(无论是真实的还是假想的)的结构、形状与外貌使用计算机进行描述,需要显示它们的图像时,计算机可根据其描述和用户的观察位置及光线的设定,生成该景物的图像。景物在计算机内的描述即为该景物的模型,人们进行景物描述的过程称为景物建模。根据景物的模型生成图像的过程称为“绘制”,也叫做图像的合成,所产生的数字图像称为计算机合成图像。研究如何使用计算机描述景物并生成其图像的原理、方法和技术称为“计算机图形学”。图1.8给出了制作计算机合成图像的全过程。
图1.8 景物的建模与图像合成过程
在计算机中为景物建模的方法有多种,它与景物的类型有密切关系。以普通工业产品(如电视机、电话机、汽车和飞机等)为例,它们可以使用基本几何元素(如点、线、面和体等)及表面材料的性质等进行描述,所建立的模型称为“几何模型”。按照所使用的几何元素类型,几何模型主要可分为线框模型、曲面模型和实体模型三种,它们在工业产品的计算机辅助设计/制造中有着重要的应用(图1.9)。
在现实世界中,还有许多景物是很难使用几何模型来描述的,例如树木、花草等。对于这些景物,需要找出它们的生成规律,并使用相应的算法来描述其规律,这种模型称为过程模型或算法模型。分形模型就是过程模型的一种特例,图1.10是分形模型所描述的一个图案。
图1.9 几何模型图
图1.10 分形模型图
4. 声音信息的处理技术
模拟音频和数字音频
声音信息的数字化
声音的压缩编码
MIDI音乐
模拟音频和数字音频
声音信号是典型的连续信号,不仅在时间上是连续的,而且在幅度上也是连续的。在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个,在幅度上“连续”是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。
在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为离散幅度信号。例如,假设输入电压的范围是0.0V~0.7V,并假设它的取值只限定在0、0.1、0.2,……,0.7共8个值。如果采样得到的幅度值是0.123V,它的取值就应算作0.1V,如果采样得到的幅度值是0.26V,它的取值就算作0.3,这种数值就称为离散数值。我们把时间和幅度都用离散的数字表示的信号称为数字信号。
声音信息的数字化
声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。如前所述,连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniform sampling);连续幅度的离散化通过量化(quantization)来实现,就是把信号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称为线性量化,否则就称为非线性量化。图1.11表示了声音数字化的概念。
声音数字化需要回答两个问题:① 每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,② 每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度(量化位数)。
图1.11 声音的采样和量化
(1)采样频率
声波实际上是连续信号,或称连续时间函数x(t),表示在t时刻声音的幅度是x(t)。用计算机处理这些信号时,必须先对连续信号采样,即按一定的时间间隔(T)取值,得到一级离散的值x(nT)(n=0,1,2, …)。这里T称为采样周期,1/T称为采样频率。常见的采样频率有:8 kHz,11.025 kHz,22.05 kHz,44.1 kHz和48 kHz等。
(2)量化精度
为了把采样序列x(nT)存入计算机,必须将采样值量化成一个有限个幅度值的集合y(nT) (n=0,1,2, …)。通常用N位二进制数表示量化后的样值,N称为量化精度,常见的量化精度有8位和16位。
由上述介绍可知,声音数字化的采样频率和量化精度越高,结果就越接近原始声音,记录数字声音所需的存储空间也越大。可以用以下公式估算未经压缩的数字化声音每秒所需的存储量:
存储量= (采样频率 量化位数 声道数)/ 8(字节)
例如,数字激光唱盘(CD-DA)的标准采样频率为44.1KHz,量化位数为16位,双声道立体声,其一秒钟音乐所需要的存储量为:
44.1 1000 16 2 / 8 = 176.4 KB
声音的压缩编码
(1)全频带声音的压缩编码
波形声音经过数字化之后数据量很大,特别是全频带声音。以CD盘片上所存储的立体声高保真全频带数字音乐为例,一小时的数据量大约是653MB。为了降低存储成本和提高通信效率(降低传输带宽),对数字波形声音进行数据压缩是十分必要的。
全频带数字声音的第1代编码技术采用的是PCM(脉编码调制)编码,它主要是依据声音波形本身的信息相关性进行数据压缩,代表性的应用是CD唱片。
第2代全频带声音编码过程分为三个阶段:第一阶段通过时间/频率变换和心理学分析,揭示原始声音中与人耳感知无关的信息;第二阶段通过量化和编码予以抑制;第三阶段使用熵编码消除声音信息中的统计冗余。典型的压缩编码方法有:MPEG-1(Layer1, Layer2, Layer3)、MPEG-2、杜比数字AC-3等。其中近几年流行的所谓“MP3”音乐就是采用MPEG-1 Layer3编码的高质量数字音乐,压缩比可达10倍左右。
另外,为了适应声音在Internet上的传播,在保证大多数人听到流畅声音的前提下,带宽较富裕的听众能获得较好的音质,出现了一种流媒体数字音频。其中最有名的有Real Networks公司的RA(Real Audio)数字音频和Microsoft公司的WMA(Windows Media Audio)数字音频。
(2)数字语音的压缩编码
语音是人们说话时肺部的受压空气沿着声道通过声门时产生的,语音信号的频率一般在300~3400Hz,是一种特殊的波形声音。再加上它是人们交换信息的主要媒体,因此对数字语音进行专门的压缩编码研究是十分有意义的。
数字语音也可以采用像全频带声音那样的基于感觉模型的压缩方法(称为波形编码),例如国际电信联盟ITU的G.711和G.721,前者是PCM编码,后者是ADPCM(自适应差分脉冲编码调制)编码。这种编码方式的压缩比较低,但语音的音质好,算法简单,且易实现,目前主要用于固定电话通信、多媒体课件讲解和动画演示中的配音等。
数字语音的另一类压缩编码方法称为参数编码或模型编码,它使用一种所谓“声源-滤波器”模型来模拟人的发声过程。从原始的语音波形信号中使用线性预测方法提取语音生成参数,把这些参数作为该语音压缩编码的结果,因此压缩比较高,但音质较差,一般应用于保密通信。
第3类语音压缩编码方法是上述两种方法的结合,称为混合编码。此类方法既能达到比较高的压缩比,又能保证较好的语音质量,目前主要应用于移动通信和IP电话中。
MIDI音乐
音频数据的另一个重要的来源是MIDI(Musical Instrument Digital Interface,即乐器数字接口)文件。所谓MIDI文件实质上是指计算机中记录的MIDI信息的数据,MIDI文件的扩展名是mid。
MIDI文件和另外一种计算机中常用的声音波形文件(*.wav文件)有什么不同呢?表面上,两种文件都可以产生声响效果或音乐,但它们的本质是完全不同的。普通的声音文件(*.wav文件)是计算机直接把声音信号的模拟信号经过取样——量化处理,变成与声音波形对应的数字信号,记录在计算机的储存介质(硬盘或光盘)中。而MIDI文件不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件和音源转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几KB或几十KB,只有波形文件的千分之一左右,便于储存和携带,所以常常作为网页和课件的背景音乐。
5. 视频信息的处理技术
视频(Video)是指内容随时间变化的一个图像序列,也称为活动图像(Motion Picture)。目前,视频技术的应用范围已经很广了,如VCD和DVD、数字电视、VOD点播、网上可视会议以及远程教学等。
视频信号的数字化
数字视频与模拟视频相比有很多优点,例如复制和传输不会造成质量下降,容易进行编辑修改,有利于传输(抗干扰能力强,易于加密),可节省频率资源等。
视频信号的数字化比图像z要复杂,它以一帧帧的画面为单位进行。一般采用YUV彩色空间,即一个亮度信号(Y)和两个色度信号(U,V)。彩色信号的YUV表示与RGB表示可以相互转换,具体的转换公式如下:
由于人眼对颜色远不如对亮度敏感,所以色度信号的取样频率可以比亮度信号的取样率低一些,由此可以减少数字视频的数据量。目前的取样格式有三种(如图1.12):4:4:4格式(色度信号的取样与亮度信号完全一样),4:2:2格式(每条扫描线上的色度信号的取样只是亮度信号的一半),4:2:0(在水平和垂直方向上色度信号的取样都只有亮度信号的一半)。
CCIR601推荐使用4:2:2的彩色电视图像取样格式。使用这种取样格式时,亮度信号Y用13.5Hz的取样频率,色度信号U和V用6.75MHz的取样频率,所得到的数字视频称为CCIR601格式。为适应多种不同应用领域(如可视电话,视频会议等)的需要,CCITT还规定了数字视频图像的公用分辨率格式CIF、1/4公用中间分辨率格式QCIF和SQCIF格式,具体规格如表1.3所示。
图1.12 亮度/色度的不同取样格式


CCIR601
CIF
QCIF
SQCIF
行数/帧
像素/行
行数/帧
像素/行
行数/帧
像素/行
行数/帧
像素/行
亮度Y
576
720
288
360
144
180
96
128
色度U
576
360
144
180
72
90
48
64
色度V
576
360
144
180
72
90
48
64
表1.3 QCIF和SQCIF格式
数字视频的压缩编码
未经压缩的数字视频的数据量十分巨大,可以计算1分钟的CCIR601格式数字视频的数据量约为1GB。这么大的数据量无论是存储还是处理,都是极不方便和浪费资源的。数字视频的压缩编码技术就是为解决这一问题而产生的。
由于视频信息中画面内部有很强的信息相关性,相邻画面的内容又有高度的连贯性,再加上人眼的视觉特性,数字视频的数据量可压缩几十倍甚至几百倍。视频信息压缩编码的方法有很多,一个好的方案往往是多种算法的综合运用。目前,国际标准化组织制订的有关数字视频(伴音)压缩编码的标准主要有MPEG-1、MPEG-2和MPEG-4。
MPEG-1标准(ISO/IEC11172)制定于1992年,是针对1.5Mb/s以下数据位率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在CD-ROM(包括Video-CD、CD-I等)存储彩色的同步运动视频图像,它针对SIF(标准交换格式)标准分辨率的图像进行压缩,每秒可播放30帧画面,具备CD(指激光唱盘)音质。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。它的目的是把221Mb/s的NTSC图像压缩到1.2Mb/s,压缩比为200:1。
MPEG-2主要针对数字电视(DTV)的应用要求,数据位率为1.5Mb/s~60Mb/s甚至更高。MPEG-2最显著的特点是通用性,它保持了与MPEG-1兼容。以MPEG-2作为压缩标准的数字卫星电视已得到广泛应用,它还将应用于高清晰度电视(HDTV)广播中。新一代的数字视盘DVD也采用MPEG-2作为其视频压缩标准。
MPEG-4的目标是支持在各种网络条件下(包括移动通信)各种交互式的多媒体应用,主要侧重于对多媒体信息内容的访问。它不仅支持自然的(取样)音频和视频,同时也支持计算机合成的视频和音频信息,具有很强的功能,有着广阔的应用前景。
计算机动画
计算机动画是采用连续播放静止图像的方法产生景物运动的效果,也即使用计算机产生图形、图像运动的技术,其实质是一种合成的视(音)频信息。计算机动画的基础是计算机图形学,它的制作过程是先在计算机中生成场景和形体模型,然后设置它们的运动,最后再生成图像并转换成视频信号输出。动画的制作要借助于动画创作软件,如Animator Pro、3D Studio MAX和Flash等。
§3 计算机硬件系统
计算机硬件系统的组成
CPU的结构与原理
内存储器
外存储器
常用输入/输出设备
主板和BIOS
多媒体计算机
计算机硬件系统的组成
随着计算机功能的不断增强,应用范围不断扩展,计算机硬件系统也越来越复杂,但是其基本组成和工作原理还是大致相同的,一个完整的计算机系统由硬件和软件两大部分组成,本节主要介绍计算机硬件系统的相关内容。
计算机硬件体系结构
计算机硬件是计算机系统中所有实际物理装置的总称。例如计算机的处理芯片、主板、机箱、键盘、鼠标、显示器、打印机、软盘、硬盘等等。
从硬件体系结构来看,计算机硬件系统采用的基本上还是计算机的经典结构——冯·诺依曼结构,即由运算器(Calculator,也叫算术逻辑部件ALU)、控制器(Controller)、存储器(Memory)、输入设备(Input Device)和输出设备(Output Device)5大部件组成(如图1.13所示),其中的运算器和控制器构成了计算机的核心部件—中央处理器(Center Process Unit,简称CPU)。
图1.13 计算机硬件的体系结构
控制器
运算器
输出设备
存 储 器
输入设备
指令流
控制流
数据流
在计算机各部件中,流动着三类不同的信息:数据(包括指令)信息、控制信息、地址信息,这些数据传输的通道,我们称之为总线(BUS),相应地可以把总线分为3类。
(1)数据总线DBUS(Data Bus)。数据总线用来传输数据信息,是双向传输的总线:CPU既可通过DBUS从存储器或输入设备读入数据,又可通过DBUS将内部数据送至存储器或输出设备。
(2)地址总线ABUS(Address Bus)。地址总线用于传送CPU发出的地址信号,是一条单向传输总线:给出CPU所读取或发送的数据的存储单元地址或I/O设备地址。
(3)控制总线CBUS(Control Bus)。控制总线用来传送控制信号、时序信号和状态信息等。其中有的是CPU向内存和外设发出的控制信号,有的则是内存或外设向CPU传递的状态信息。控制总线通过各种信号使计算机系统各个部件有条不紊、协调工作。
计算机的硬件配置组成
如前所述,计算机的硬件系统由5大部件组成,但是在实际的技术设计和工艺设计上,包括在购买个人电脑,进行个人电脑的配置时,我们往往根据各个物理部件的重要性、使用概率、物理构造等因素对计算机硬件进行划分。
一般,个人计算机的基本硬件配置包括主机、显示器、键盘、鼠标四个部件,而主机又包含主板、机箱、电源、声卡、显卡等各种物理设备。在此基础上,根据用户的需求,配备扩展外部设备,如打印机、扫描仪、数码摄像头等。我们把计算机系统必须的硬件设备称为计算机的最小配置,它应该包括显示器、键盘、鼠标、主机中的机箱、电源、显卡、主板、内存条、硬盘。而其他设备,如声卡、网卡、Modem、音箱等都是为了增强计算机系统某一方面的功能(比如多媒体功能)而添加的。
根据配置进行划分的硬件种类繁多,型号多样,性能参数各不相同,在实际配置中,恰恰是用户最需要考虑的内容,只有进行合理的搭配,才能得到具有较高性价比的硬件配置方案。
计算机的性能指标
一台微型计算机功能的强弱或性能的好坏,不是由某项指标单独决定的,而是由它的系统结构、指令系统、硬件组成、软件配置等多方面的因素综合决定的。对于不同用途的计算机,其对不同部件的性能指标要求有所不同。例如:对于用作科学计算为主的计算机,其对主机的运算速度要求很高;对于用作大型数据库处理为主的计算机,其对主机的内存容量、存取速度和外存储器的读写速度要求较高;对于用作网络传输的计算机,则要求有很高的I/O速度,因此应当有高速的I/O总线和相应的I/O接口。对于大多数普通用户来说,可以从以下几个指标来大体评价计算机的性能。
运算速度
计算机的运算速度是指计算机每秒钟执行的指令数,它是一项综合性的性能指标。单位为每秒百万条指令(简称 MIPS)或者每秒百万条浮点指令(简称 MFPOPS)。它们都是用基准程序来测试的。影响运算速度的有如下几个主要因素:
(1)CPU的主频
CPU的主频,即CPU内核工作的时钟频率。简单地说也就是CPU运算时的工作频率。一般说来,主频越高,单位时间内完成的指令数也越多,CPU工作的速度也就越快。但是,主频并不直接代表运算速度,因为CPU的运算速度还要看CPU流水线的各方面性能指标(缓存、指令系统、CPU的位数等等)。因此,尽管主频和实际的运算速度存在一定的关系,但在一定情况下,也会出现主频较高的CPU实际运算速度较低的现象。因此主频仅是CPU性能表现的一个方面,而不代表CPU的整体性能。
(2)字 长
字长又称“数据宽度”,一般由一个以上字节组成,是计算机进行数据处理时一次存取、加工和传送的数据长度。在计算机其它指标固定的情况下,字长越长,计算机一次所能处理信息的实际位数就越多,最终表现为计算机的运算速度越快。常用的字长有8位、16位、32位和64位。
(3)指令系统的合理性
每种CPU都设计了一套指令,一般均有数十条到上百条,例如:加、浮点加、逻辑与、跳转等等,组成了指令系统。指令系统功能的强弱直接影响系统的性能,比如具有多媒体扩展指令集(MMX)的CPU在处理处理复杂的图形与影像时,效果特别明显
内存储器的指标
(1)存取速度。将信息存入计算机存储器中,称为“写”操作;把信息从存储器中取出,称为“读”操作。内存储器完成一次读(取)或写(存)操作所需的时间称为存储器的存取时间,或者访问时间,而连续启动两次独立的“读”或“写”操作(如连续的两次“读”操作)所需的最短时间,称为存取周期。对于半导体存储器来说,存取周期约为几十到几百ns(10-9秒)。内存储器的存取速度将直接影响指令和数据的读写速度,从而影响计算机的整体性能。
(2)存储容量。存储器中能存储的信息总数量简称为存储容量,以字节(Byte)为单位。内存容量越大,一次读入的程序、数据就越多,这样可以避免频繁地读取外存储器中的信息,由于内存的运行速度很快,所以可以大大提高计算机的运行速度。PC机的内存储器容量已由286机配置的1MB,发展到现在P4(奔腾4)配置256MB,甚至512MB、1GB以上。内存容量的加大,对于运行大型软件十分必要。
I/O的速度
I/O的速度是指CPU与外部设备进行数据交换的速度。随着CPU主频速度的提升,存储器容量的扩大,系统性能的瓶颈越来越多地体现在I/O速度上。主机I/O的速度取决于I/O总线的设计。I/O速度的提高对于慢速设备(例如键盘、打印机)关系不大,但对于高速设备如硬盘、显卡等则效果十分明显。
以上性能指标可以为用户配置计算机提供参考,但是在实际应用过程中,有的性能指标是无法选择或选择范围很少的,比如字长;而有些指标可供选择的范围则较广,比如存储容量、I/O速度等,用户可以根据自身的实际情况,比如用途、预算等,做出合理的选择和搭配。
同时,计算机的性能是一个综合指标,各个部件性能的差异容易造成性能的瓶颈问题,从而导致高性能设备无法发挥其最优性能。比如高速CPU(P4)搭配普通SDRAM内存,就会造成整体性能被内存拖累的现象,这也是计算机用户必须考虑的问题。
2.CPU的结构与原理
CPU的结构
CPU是计算机的核心部件(图1.14),通常的说法,CPU由运算器和控制器组成。运算器用来对数据进行各种算术运算和逻辑运算,它也称为执行单元。控制器是CPU的指挥中心,它能解释指令的含义,控制运算器的操作,记录内部状态。此外,CPU中还包含一组“寄存器”,用来临时存放参加运算的数据和计算的中间结果(图1.15)。
实际上,CPU的结构要复杂许多,为了提高处理效率,运算器一般由基本逻辑部件(ALU)和浮点运算器组成,以便同时进行整数和实数的运算,此外,为了匹配高速CPU与相对低速的内存之间的工作速度,CPU中往往集成了一级缓存(L1 Cache)和二级缓存(L2 Cache),从而大大提高CPU的处理速度。二级缓存的容量还成为衡量CPU性能的重要指标。
图1.14 CPU的外观 图1.15 CPU的组成及其与内存的关系
CPU的工作原理
(一)指令和指令系统
指令是一种采用二进制表示的命令语言,它用来规定计算机执行的操作及操作对象所在的位置。指令系统则是指一个CPU能够执行的全部指令。不同CPU的指令系统是不同的。为了提升CPU在某一方面的性能,CPU厂商往往在CPU基本功能的基础上,开发某些扩展指令集,如Intel公司推出MMX(Multi Media eXtension,多媒体扩展指令集)指令集和SSE、SSE2指令集,由AMD公司提出的3DNow!和3DNOW!+指令集等;大多数情况下,指令由两部分组成(图1.16)。
图1.16 指令格式
操作码——用来指明计算机应该执行何种操作的二进制代码。比如加法、减法、跳转等各种基本操作,都有一个操作码与之对应。
操作数——用来指明该操作处理的数据或数据所在存储单元的地址。
计算机中无论简单或复杂的操作,最终都可以分解为一些最基本的操作,每一个基本操作都有一条指令与之对应,因此可以用一系列的指令来描述操作的实现过程,这一系列的指令可以理解为“程序”。
每种不同类型的CPU都有自己独特的一组指令,一个CPU能够执行的全部指令就称为该CPU的指令系统,不同CPU的指令系统是不同的。通常,指令系统中有数以百计的不同指令,例如:数据传送指令、算术运算指令、逻辑运算指令、移位指令、控制转移指令、输入/输出指令等等。
每一种类型的CPU都有自己的指令系统,因此,某一类计算机的程序代码未必能够在其他计算机上运行,这就是所谓的计算机“兼容性”问题。比如,目前PC中使用最广泛的CPU是Intel公司和AMD公司的产品,由于两者的内部设计相同,指令系统几乎一致,因此这些PC机相互兼容。而苹果公司生产的Macintosh个人计算机,其CPU采用Motorola公司的PowerPC微处理器,其处理器结构不同,指令系统大相径庭,因此无法与采用Intel公司和AMD公司CPU的PC机兼容。
即便是同一公司生产的产品,随着技术的发展和新产品的推出,它们的指令系统也是不同的。比如Intel公司的产品发展经历了8088→80286→80386→80486→Pentium→PentiumPro→ PentiumII→PentiumIII→PentiumIV→ ……。每种新处理器包含的指令数目和种类越来越多,为了解决兼容性问题,通常采用“向下兼容”的原则,即新类型的处理器包含旧类型处理器的全部指令,从而保证在旧类型处理器上开发的系统能够在新的处理器中被正确执行。
指令的执行过程
尽管计算机可以执行非常复杂的程序,完成多种多样的功能,然而,计算机唯一能够识别的语言只有机器指令。任何复杂程序的运行最终都是通过CPU一条一条地执行机器指令来完成的。
CPU执行每一条指令都需要分成若干步骤,每一步完成一个操作。一条指令的执行过程大致如下:
(1)指令预取:指令预取部件从Cache或存储器中取得一条指令。
(2)指令译码:指令译码部件从指令预取部件获得指令,并对其进行分析。
(3)获取操作数:地址转换部件根据指令计算操作数的地址,并根据地址从Cache或存储器获取操作数。
(4)运算:运算器根据操作码的要求,对操作数完成指定操作。
(5)保存:若有必要,将结果保存到指定的寄存器或内存单元中。
(6)修改指令地址:为指令预取部件获取下一条指令做好准备。
在实际设计中,指令的执行并不是完全按照以上步骤逐步进行的,设计人员往往采取多种措施提高处理速度。常见的策略之一是象一条流水线一样,允许多条指令同时处于预取、译码、运算等不同的阶段,比如一条指令进行译码的。同时,系统根据策略将另一条指令放入Cache和内存中;另一种策略就是采用多条流水线,使多条指令同时处于执行过程中,进一步加强CPU的执行效率,比如超线程技术。
总之,计算机运行程序的过程就是一条一条执行指令的过程,程序中的指令和需要处理的数据都存放在存储器中,由CPU逐条取出并执行它所规定的操作。这就是存储程序和程序控制原理,也是到目前为止几乎所有计算机的基本工作原理。
CPU常见术语
Intel x 86系列以及其他公司所生产的兼容CPU,是目前国内个人电脑装机中用得最多的芯片,为了更好地认识CPU,下面介绍一下与CPU有关的一些常用术语。
(1)CPU主频
正如1.3.1节所述,主频是CPU工作的时钟频率,是指计算机CPU在单位时间内工作的脉冲数,它在很大程度上决定了计算机的运行速度。主频的单位是MHz或GHz。例如PII233的主频为233MHz,PIII的主频有450MHz、900MHz等,P4的主频可以达到3GHz以上。IBM公司已研制出速度高达110GHz的微芯片。
(2)CPU外频(FSB)
CPU外频是指外部系统总线的工作频率,是主板为CPU提供的基准时钟频率,而且目前的绝大部分电脑系统中,外频也是内存与主板之间的同步运行频率。当CPU外频提高后,与内存之间的交换速度也相应得到了提高,这对提高电脑整体运行速度影响较大。现在PⅢ的外频一般为133MHz,P4可采用高达800MHz的外频。
(3)CPU倍频
CPU的倍频,全称是倍频系数。CPU的核心工作频率与外频之间存在着一个比值关系,这个比值就是倍频系数,简称倍频。
在486之前并没有倍频概念,CPU的主频一般都等于外频,CPU的主频和系统总线的速度是一样的。PC机的一些其他设备(如插卡、硬盘等)却受到工艺水平的限制,不能承受更高的频率,这就限制了CPU频率的进一步提高,于是倍频技术应运而生。它可使系统总线工作在相对较低的频率上,而CPU速度可以通过倍频来提升。外频、倍频和主频三者的关系是:
主频=外频×倍频
外频和倍频都可以根据CPU参数通过主板跳线或程序来设置,从而设定CPU主频。通过适当提高外频或倍频,有些CPU的主频可以超过它的标称工作频率,这就是习惯上称的“超频”,超频可以在一定程度上提升系统的性能,但是它将增加CPU的功耗,并使CPU温度升高,甚至损坏CPU。
(4)高速缓冲存储器(Cache)
Cache是位于CPU和内存之间的规模较小但速度很高的存储器。由于内存的读写速度远远低于CPU 的速度,而CPU每执行一条指令都要访问一次或多次内存,所以CPU总是要处于等待状态,严重地降低了系统的效率。采用Cache之后,在Cache中保存着内存信息的部分副本,CPU在读写数据时,首先访问Cache,只有Cache中不含有CPU所需的数据时,CPU才去访问主存。由于Cache的速度与CPU相当,因此CPU能快速完成数据的读写,从而提高系统效率。
Cache中的数据是根据一定的策略更新的,CPU在访问Cache时能够找到所需的数据称为命中,否则称为未命中。显然,命中率越高,系统效率提升的幅度越大,而命中率的提高则取决于Cache内容的更新策略等多种因素。
现在的存储器系统一般建有一级缓存和二级缓存。一级缓存即L1 Cache,集成在CPU内部,用于CPU在数据处理过程中对数据的暂时保存,以相同于CPU主频的速度工作。一级缓存中还分数据缓存(I-Cache)和指令缓存(D-Cache)。二者分别用来存放数据和执行这些数据的指令,而且两者可以同时被CPU访问。
二级缓存即L2 Cache。由于L1级高速缓存容量的限制,为了进一步提高CPU的运算速度,再增加一级高速存储器,即二级缓存,二级缓存的容量较大。L2的工作主频比较灵活,可与CPU同频,也可以不同。早期的二级缓存没有集成在CPU内部,其工作频率与主频往往有较大差距,但是随着制作工艺的进步,二级缓存也被集成入CPU内核中,以相同于主频的速度工作,可以为CPU提供更高的传输速度。
二级缓存是CPU性能表现的关键之一,在CPU核心不变化的情况下,增加二级缓存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二级缓存上有差异,因此二级缓存成为衡量CPU性能的重要指标。
CPU在读取数据时,先在L1中寻找,再从L2中寻找,然后是内存,最后在外存储器中寻找,在L1和L2中命中的概率可以达到90%以上,从而大大提高了系统的效率。
还需要说明的是,与CPU和内存的速度差异相似,系统中的很多设备之间同样存在速度差异,同样可能导致性能的下降。Cache在这些设备中的应用可以起到相同的作用。
(5)接口类型
CPU需要通过某个接口与主板连接才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等,对应到主板上就有相应的插槽类型。而目前CPU基本上都是采用针脚式接口。不同CPU的接口类型,在插孔数、体积、形状等都有变化,所以不能互相接插。
目前常见的接口类型主要有Socket 479(Intel的P4系列CPU)和Socket A(AMD公司的CPU),其他还有Socket 370,Socket 423,Slot A等,但已经不多见。
(6)超线程技术
为了提高CPU的性能,通常做法是提高CPU的时钟频率和增加缓存容量,但这种方法是有限度的,往往受到制作工艺和制作成本的限制,而且在技术实现上存在较大难度。以往的单线程CPU每秒钟能够处理成千上万条指令,但是在任一时刻只能够对一条指令进行操作,而且其执行单元并没有被充分使用。
超线程技术是提高处理器性能的又一种方法,它利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,使芯片同时处理多个线程,减少了CPU的闲置时间,提高了CPU的运行效率。
四、常见CPU介绍
现在,主流CPU还是Intel和AMD两家的天下。无论在高端还是低端,两大品牌都有着全线的产品。下面介绍这些产品。
INTEL系列
(1)Pentium 4。英特尔于2000年11月22日发行了当时最先进的处理器——基于Willamette核心的Pentium 4 处理器,首批上市的两款产品主频分别高达1.4GB和1.5GB,比历史上任何处理器都要快。P4引入SSE2多媒体指令集,既包含了原68组SSE指令,又新增了76组新的SSE2指令。并将传统的整数MMX寄存器扩展为128位,同时提供了128位SIMD整数操作和128位双精度浮点运算操作。在处理音频和视频、充分利用互联网技术以及显示三维图形方面,P 4具有更高性能。
P4的推出和强有力的宣传,使Intel进一步稳固了其在主流CPU市场的主导地位,在随后的几年中,Intel公司进一步加大对P4系列产品的研发,目前,市场上主流的P4系列CPU大都基于最新的NORTHWOOD核心,外频可达200MHz,二级缓存256KB~1MB,采用0.13微米制作工艺,最高频率超过3.2GHz,部分CPU还可以支持超线程技术。
P4系列产品具有较高的性能,在大部分领域都具有良好的表现,但是它的价格在主流的CPU中也是最高的。
(2)Celeon IV。Celeon(赛扬)系列产品是Intel公司在低端市场的力推产品。Celeon IV系列最早于2002年推出,当时基于Willamette核心,具有100MHz外频,128KB二级缓存,采用0.18微米制作工艺,起始频率高达1.7GHz。目前主流的Celeon IV产品绝大部分基于和P4相同的NORTHWOOD核心,100M外频,128KB二级缓存,采用0.13微米制作工艺,最高频率超过2.7GHz。
Celeon IV系列产品可以看作是P4的精简,具有极高的性价比,可以满足办公等绝大部分的应用领域,但是它的浮点运算能力稍差,在三维设计等领域的处理能力也略显不足。
AMD系列
(1)Athlon XP。针对Intel的Pentium 4系列产品,AMD公司推出的Athlon XP系列以其质优价廉、高性价比获得了一致的好评,赢得了大量用户。
最早的Athlon XP采用Palomino核心,256KB二级缓存,目前市场上的产品以Barton核心为主,外频133~166MHz,512KB二级缓存,采用0.13微米工艺,最高频率超过2GB。
Athlon XP增加了对SSE指令集的支持,同时通过对核心的改进,一直较大的发热量也得到了降低。Athlon XP的另外一个特点是它能够以较低的主频达到与高频CPU相当的性能,所以,它在型号中被标称的PR值往往大于实际主频,比如型号为AthlonXP 3000+的CPU实际主频是2.66 GHz,但型号名称表明它的性能主频与3GHz的Athlon CPU相当。
(2)Duron(毒龙)。Duron是AMD用来对抗Intel Celeron 处理器的低端产品,采用APPLEBRED核心,0.13微米制作工艺,133MHz外频,但是二级缓存的容量大大减少,只有64KB。与Athlon XP不同,它的型号标称采用实际频率,最高可达1.8GHz。
Duron价格低廉,具有优秀的性价比,此外部分Duron CPU具有出色的超频能力,也是吸引部分用户的重要原因。但是Duron系列的一个共同问题是发热量比较大,必须配备较好的散热器。
3.内存储器
内存储器是CPU可以直接存取数据的存储器,也是计算机软件运行过程中数据存储的最主要的场所,所有的数据都通过内存储器和CPU进行交换,因此它的性能高低直接影响系统整体性能的发挥。
现在微机的内存储器都采用内存条,可以直接插在主板的内存条插槽上,内存条与主板插槽接触的部分,称为金手指(也称针脚)。主板上装哪种类型的内存条,由所采用的芯片组和CPU类型来决定。
内存储器的分类
近年来,微机中动态存储器主要采用同步动态存储器SDRAM(Synchronous Dynamic RAM)和双速率DDR SDRAM(Double Data Rate SDRAM)内存储器。RDRAM(Rambus DRAM)是美国Rambus公司研制的另一种性能更高、速度更快的内存 。
(1)SDRAM
SDRAM,即Synchronous DRAM(同步动态随机存储器),曾经是PC电脑上最为广泛应用的一种内存类型,即便在今天SDRAM仍旧还在市场占有一席之地(图1.17)。
顾名思义,同步就是将RAM与CPU以相同的时钟频率同步进行控制,使RAM和CPU的外频同步,彻底取消等待时间,提高了数据存取速度。SDRAM采用3.3伏工作电压,168Pin的DIMM接口,带宽为64位。SDRAM不仅应用在内存上,在显存上也较为常见。
图1.17 SDRAM内存条
(2)DDR SDRAM
DDR SDRAM是Double Data Rate SDRAM的缩写,是双倍速率同步动态随机存储器的意思。DDR内存是在SDRAM内存基础上发展而来的,是目前使用最广泛的内存条(图1.18)。
与SDRAM相比,DDR运用了更先进的同步电路和更为先进的数据定位技术,SDRAM在一个时钟周期内只传输一次数据,而DDR内存则可以在一个时钟周期内传输两次数据,因此称为双倍速率同步动态随机存储器。显然DDR内存可以在与SDRAM相同的总线频率下达到更高的数据传输率。
从外形体积上DDR与SDRAM相比差别并不大,他们具有同样的尺寸和同样的针脚距离。但DDR为184针脚(即金手指),比SDRAM多出了16个针脚。此外DDR内存采用的是支持2.5V电压的SSTL2标准,而不是SDRAM使用的3.3V电压的LVTTL标准,更低的电压意味着更低的功耗和更小的发热量。
图1.18 DDR内存条
(3)RDRAM
RDRAM(Rambus DRAM)是美国RAMBUS公司开发的一种内存。与DDR和SDRAM不同,它采用了串行的数据传输模式,彻底改变了内存的传输模式。
RDRAM的数据存储位宽是16位,远低于DDR和SDRAM的64位。但在频率方面则远远高于二者,可以达到400MHz乃至更高。同样也是在一个时钟周期内传输两次数据,内存带宽能达到1.6Gb/s。
尽管RDRAM的性能优良,也曾经受到Intel公司的大力推崇,但是,它全新的数据传输模式无法保证与原有的制造工艺相兼容,而且内存厂商要生产RDRAM还必须要交纳一定专利费用,再加上其本身制造成本,就导致了RDRAM从一问世就高昂的价格让普通用户无法接受。而同时期的DDR则能以较低的价格,不错的性能,逐渐成为主流,RDRAM则始终未能成为市场的主流,只得到部分芯片组支持,而这些芯片组也逐渐退出了市场,所以RDRAM前景并不被看好。
内存储器的参数
(1)接口类型。接口类型是根据内存条金手指上导电触片的数量来划分的,习惯上,金手指上的导电触片数也称为针脚数(Pin)。由于内存所采用的针脚数不同,对应内存插槽类型也各不相同。目前台式机系统主要有SIMM(Single Inline Memory Module单内联内存模块)、DIMM(Dual Inline Memory Module双内联内存模块)和RIMM(RDRAM Inline Memory Module)三种类型的内存插槽,而笔记本内存插槽则是在SIMM和DIMM插槽基础上发展而来,只是在针脚数上略有改变。
SIMM主要应用于SDRAM,已经逐步被DIMM所取代,而RIMM是RDRAM内存所采用的接口类型,因为RDRAM的原因,所以很少能够看到。目前的主要的内存插槽是DIMM。
同样采用DIMM,SDRAM 的接口与DDR的接口也略有不同,SDRAM DIMM为168Pin,金手指每面为84Pin。金手指上有两个卡口,用来避免插入插槽时,将内存反向插入而导致烧毁。DDR DIMM则采用184Pin DIMM结构,金手指每面有92Pin,金手指上只有一个卡口。卡口数量的不同,是二者最为明显的区别。
(2)容 量
内存容量是指该内存条的存储容量,是内存条的关键性参数。内存容量以MB作为单位,可以简写为兆。内存的容量一般都是2的整次方倍,比如64MB、128MB、256MB等,一般而言,内存容量越大越有利于系统的运行。目前台式机中主流采用的内存容量为256MB或512MB,在力所能及的情况下,内存容量越大越好。
(3)CL值
CL(CAS Latency)即列地址信号延迟时间,是内存条性能的重要指标,CL值并不是真正的延时时间,但CL值越小,数据传输延时越短,速度越快。
一般的内存条都会注明CL值,SDRAM的CL值有2和3两种,而DDR SDRAM有2和2.5两种。另外,选择购买内存时,最好选择同样CL设置的内存,因为不同速度的内存混插在系统内,系统会以较慢的速度来运行,造成资源浪费。
(4)传输标准
传输标准是购买内存的首要选择条件之一,它代表内存的速度。传输标准一般以PC+数值的方式来表示,不同类型的内存条,数值的含义有所不同
SDRAM的传输标准一般有PC100和PC133两种,100和133表示内存工作频率可以达到100MHz或133MHz。
DDR SDRAM的传输标准从PC1600至PC4300不等,在这里数值表示内存传输速率,比如PC4300代表该内存的传输速率为4300Mb/s。
RDRAM的传输标准有PC600、PC800和PC1066等,数值是其工作频率的两倍,原因是因为RDRAM可以在一个周期内传输两次数据。比如工作频率为300 MHz的RDRAM,等效频率为600MHz,所以它的传输标准记为PC600。
相同类型的内存条,数值越大,性能越好,但值得注意的是,内存条性能的发挥还取决于主板的支持,比如一块最多支持PC100的主板上安装PC133的内存条就会造成资源的浪费。
4.外存储器
内存的存取速度快,但是容量比较小,价格高,而且安装在主机内,携带不便。更加重要的是,内存中的RAM,在断电后无法持久保存信息。因此为了满足大量数据长久保存和方便携带的需要,我们大量使用各种外存储器,如软盘、硬盘、磁带、移动存储设备和各种光存储设备等。
软 盘
软盘是将可移动的盘片插入到软盘驱动器内,通过驱动器中的磁头读写磁盘中的数据。目前常用容量为1.44MB,规格为3.5英寸,盘片呈圆形,被封装在硬质塑料壳内(图1.19)。
3.5英寸软盘曾经被广泛使用,它最大的优点是携带方便,但缺点是容量太小,存取速度较慢,数据保存时间不长久,且盘片很容易受损。随着其它大容量便
同课章节目录