3.1.5声音信息的加工 课件+教案+素材 (3)

文档属性

名称 3.1.5声音信息的加工 课件+教案+素材 (3)
格式 zip
文件大小 1016.0KB
资源类型 教案
版本资源 沪教版
科目 信息技术(信息科技)
更新时间 2016-07-13 16:13:53

文档简介

如何用XP系统下的录音机录制超过1分钟的声音
电脑系统里面预装的录音机虽然功能不多,但胜在体积小巧,不需要占据大量的空间。因此,简单点的声音录制没必要再去下载专业软件安装,用录音机就好了。
但录音机在使用的过程中,有个致命的缺陷:一次录音不能超过60s,怎么解决掉这个缺点呢?
复制粘贴插入法
打开系统自带的录音机:
步骤:开始——所有程序——附件——娱乐——录音机
制作一个空白声音文件:
点击红色实心圆按钮,即录音键,录制60s的空白效果。
(这里并不是真的要录声音,主要是想弄“空白带”)
录音机录够60s后会自动停止。
将文件另存为“1.wav”到相应文件夹
将声音文件扩充至120s
步骤:在该文件的菜单栏上依次选择
编辑——复制——编辑——粘贴插入
这时 “长度”中的秒数增加到了120s。
重复上一个操作(编辑——复制——编辑——粘贴插入)N次,直到得到自己所需的音乐的长度
接下来我们就可以放心大胆地在该声音文件上录制超过60s的声音啦
如果要一次录制多个声音,记得将录有声音的文件另存。
这样我们的空白声音文件“1.wav”就可以反复使用啦
END
反复多次按录音键法
录音机录够60s后会自动停止,这个时候再按一次红色实心圆按钮,即录音键,每按一次则会增加60秒,一直录制到所需的时长再停止录音。
TIPS:人很难及时按录音键,实时录音时难免出现错漏,也可先做一个空白声音文件,正式录音时,把录音滑杆放到开始位置,正常地录制就可以了。
声音信息的加工
1教学目标
1、让学生了解声音数字化原理;
2、让学生了解声音录制的过程;
2学情分析
1、学会使用“录音机”程序录制声音;
2、让学生动手搭建录音棚。
3重点难点
教 学 重 点
声音的录制
教 学 难 点
声音的相关原理
4教学过程
活动1【活动】声音信息的加工
〖单元概述〗本章通过任务活动,让教师和学生在新颖有趣的教学情景中进行教与学,将知识、技能的学习和情感的培养融入实践活动中,引导学生通过录制自己的歌曲,来了解数字声音的基本知识,掌握采集和加工声音媒体的基本方法。
〖课程标准〗
1)、了解常见的多种媒体信息,如声音的类型、格式及其存储、呈现和传递的基本特征与基本方法;
2)、能选择适当的工具,对声音信息进行采集;能解释多媒体信息采集的基本工作思想
〖教学过程〗
一、微视频激活课堂,顺势导入新课(4分钟)
教师通过《是真的吗》实验视频。顺势带入新课“声音信息的加工”,并布置分组讨论的问题“声音如何进入计算机的,又是如何从计算机发出的呢”
二、自主探究问题,关键词声音数字化原理(8分钟)
学生通过课本查询,分组讨论,并将问题的结果写在学习卡上,由小组汇报人将本组的结果汇报。教师重点讲解原理并用课件展示。
声卡 声卡
模拟信号——→数字化—→各种声音处理软件—→数字化——→模拟信号
模拟声音信号输入→处理→输出示意图
备课
三、微课认识声卡,设置好耳麦,搭建录音棚(10分钟)
微课展示声卡,让学生实物了解声卡的三个孔分别是什么,指导学生连接好耳麦线。蓝色的:声音输入端(可以用MP3通过录音线输入电脑播放);绿色:声音输出端;红色:麦克风
在计算机中设置麦克风,微课演示,学生动手操作,并将操作中出现的问题解答。
四、利用录音机程序尝试声音的录制(4分钟)
教师将课件中最后一曲的声音录制过程演示给学生,激发学生的兴趣,让学生明白录音机软件的使用过程,布置课堂练习
课题练习一:利用录音机录制诗歌(8分钟)
学生利用录音机软件录制诗歌,并保存在E盘,命名XXX班XXX.wav在完成练习的同时,要求学生完成学习卡,教师指导学生,并关注问题的发生。
然后进行交流,选择几位同学的作品让大家来欣赏,将典型的问题指出来。1)、超过60秒的作品,2)、音量不够或者没有音量的,提出解决问题的方案。
拓展练习一:将刚刚录制的声音剪接并设置为WINXp“ 最小化”时的声音。(6分钟)
教师演示个性化WINXp声音的设置,学生探索,教师指导。
五、思考问题1、没有声音或者音量不够是什么原因及解决的方法。
2、利用录音机软件录制声音超过60秒的怎么办?以及解决问题的方法
六、小结(3分钟)
本堂课了解了声音数字化的原理,认识了声卡,动手搭建了录音平台,实践操作了录音机软件,并将自己的声音录制进了电脑。
七、板书
声音信息的加工
一、声音的数字化
声音→声卡→电脑→声卡→扬声器
二、录音棚的搭建
硬件:
软件:
三、录音机软件使用
第二章 ????? 声音/声频的采集和处理
早期的计算机带有一个极简单的喇叭,只能发出很单调的滴答声,但就是这种声音,也有很多人为此着迷。如国内很流行的基于DOS的表格处理软件CCED就利用这个喇叭来播放音乐,很多用户都爱不释手,由此可见人们对计算机能发出声音的渴望。
为了满足这种需求,开发出了一种能让计算机发出很美妙声音的硬件——声卡(Sound Card),特别是新加坡的Creative Labs(创通公司)开发的Sound Blaster系列声卡,更是风靡全球。有了声卡后的计算机不仅仅是能发出声音的机器,更为重要的是,计算机能执行很多程序,来对声音进行各种各样处理,从而达到更加完美的效果。如:可以对自然语音进行分析从而形成文本,实现语音录入的能力;可以对不同人的语音进行分析,进行身份鉴别,为公安等部门破案提供证据;可以让计算机形成自然界没有的声音或者没有办法录制的声音,如:太空声,龙卷风的声音等。
在本章,将讲述声音的常用概念、声音的采集、播放软件作简单的介绍。
2.1????? 声音的基本概念
声音是一种物理现象。当物体振动时,迫使物体周围的空气分子也随之震动,从而引起空气压力的变化,当压力的高低变化以波的形式通过空气传播到人的耳朵时,使耳膜产生震动,人们就听见了声音。
有关声音或声频的技术就是研究如何处理这些声波,其中最主要的内容包括:声波的编码、存储、音乐和语音处理等。
在本章将讨论有关声音、音乐编码和语音处理。介绍声音的基本概念和形式,以及声音如何在计算机中实现。由于多媒体程序在使用声音时通常以音乐和语音的形式出现,所以音乐和MIDI标准,以及语音合成、语音识别和语音的传输的基本概念也将在本章介绍。
2.1.1????????? 声波的基本参数
前面已经提到声音就是物体振动引起空气分子随之振动而产生的波。和其它的波一样,它也具有波的基本特征。图2.1是一个波的基本形式和它的描述参数。
1.?????? 周期
以规则的时间间隔重复出现相同的波形,这个时间间隔称之为周期。由于声音是自然产生的,所以不可能是非常平滑和具有相同的周期。然而那些具有可识别周期的声音通常更加富有音乐性,例如:各种乐器的声音,另外如悦耳的鸟声,狂啸的风声等。各种非周期性声音包括:未定音的打击乐器,咳嗽声,喷嚏声和狂奔的水声等。
2.?????? 频率
频率是指波在单位时间(1秒)内重复出现的次数,其单位为Hz(赫兹)。通常还使用更大的单位kHz、MHz、GHz以及THz表示,其换算关系如下所示:
1kHz=1000Hz=1(103 Hz
1MHz=1000kHz=1(106Hz
1GHz=1000MHz=1(109Hz
1THz=1000GHz=1(1012Hz
在研究的过程中,通常还将声波划分成以下几个波段:
次生波:0~20Hz
声 波:20~20kHz(人耳能听见的声波)
超声波:20kHz~1GHz
特超声波:1GHz~10THz
在典型的计算机多媒体系统中,通常只使用人类能听见的声波部分,我们将这部分称为声频。在这个范围内的信号称之为可听信号。例如:语音和音乐就是人类产生的可听信号。另外,噪音也是人类能听见的可听信号,只是它的声音为人们所不喜欢。
在日常生活中,我们常说的音调实际上就是对声音的频率描述。当频率快时,也就是频率高时,声音就尖,反之则显得低沉,粗旷。声音的质量也与频率范围有关,如果声音的可变化频率越宽,则声音的质量越高。另外,歌唱演员分为高音、中音、低音也是用频率来区分的。
3.?????? 振幅
和其它波一样,声波也同样有振幅。在日常的生活中,我们通常所说的音量就是对声波振幅的描述。在声学中,振幅是用来定量研究空气受到压力的大小。
对于一个具体的声波而言,在一定的时间段内,如果我们能知道每个时刻波的频率和相应的振幅,我们就可以将这个波重新描绘出来,再现这个声波。
在自然界中,声波的频率和振幅时刻都在变化,形成不规则波,但是可以将之分解成多个规则波的组合。
2.1.2????????? 声音的数字化
在自然状况下,声波是一个连续的波段,而计算机只能处理非连续的0、1两种状态,这种连续波在计算机中不能直接处理,需要将之数字化。由于人的听觉也存在类似于“视觉暂留”的“听觉暂留”现象,即当变化的速率达到一定的程度后,人耳听到从计算机输出的声波就是连续的,和自然界的声音基本相同。
在前面已经提到,如果要重现这个声音的波,只需要知道波的频率和振幅,就能重新描绘出波的原来形状,再现这个声波。
在计算机对声波进行处理时,用以下三个参数对原声波进行描述:
1.?????? 采样的频率
采样频率即1秒钟内采样的次数。采样的频率越高,丢失的信息量就越少。音调越高的声音,采样的频率也要相应提高。可以简单地认为,采样频率实质上是对原始波形频率的描述。
采样过程是按照同一频率将波形分成若干个相同的部分,每一个部分取一个模拟振幅值作为采样值。采样的频率越高,单位时间内获取的样本数目就越多,数字化后的音频信号的保真度就越高,获得的听觉效果就越好,同时信息量也大大增加。在实际工作中,也必要无限制增大采样频率,这是因为:
??????????? 人的声音本身不可能无限制快地变化。
??????????? 人耳的分辨率有极限;
??????????? 高采样率,意味着加大信息的存储量。
根据抽样理论,对于随时间连续变化的模拟信号波形,如果采用该信号所含的最高频率的2倍进行采样,就可以保证在还原该信号时,波形基本不失真。由于人耳听觉的上限频率大约为20kHz,因此当采样频率达到40kHz以上时,就可以达到交好的听觉效果。如:CD音乐盘就采用的是44.1kHz的采样频率,其音质效果非常好。
当前声音的采样频率主要有三种标准,分别是44.1 kHz,22.05 kHz,11.025 kHz。采样频率越高,保真度也越好。
2.?????? 量化等级
在采样过程中,每次采样得到的声音样本都是表示声音波形的一个振幅值。量化等级即每个样本量化后共用多少个离散的数值来表示,在计算机中可以认为是用多少个二进制位来表示。若每个样本用8位的二进制数表示,则共有28=256个量级。若每个样本用16位二进制数表示,则共有65,536个量级,CD盘就采用这样的标准。
在量化的过程中,我们可以认为量化等级是用来对振幅的描述。如果量化等级越高,也就是量化时采用更多的二进制位来表示振幅,就能更加真实地体现声波振幅的变化,和这个声波的原始状态。
在计算机进行量化时,如果量化精度较低,则量化结果只能表示小范围内的振幅变化,而增加量化精度将大大提高系统对每一个振幅变化的敏感程度,但是随着量化精度的提高,系统的信息量也急剧增加。
为了能更加真实地体现原始波形,需要增加采样频率和量化等级。在实际工作中,我们通常用信噪比来描述原始波形被量化后与原始波形的比值。信噪比(SNR)可以简单的定义为:原始波形和量化后波形所带信息量之比。它的计算公式为:
SNR=6.02B-7.27
其中,信噪比SNR的单位为分贝(dB);B表示量化的位数,即信噪比与量化的二进制位的多少有关。量化时每增加一个二进制位,则信噪比就提高约6分贝。信噪比越高,保真度也越高,对于信噪比较低的系统,会出现背景噪音及失真。因此:
当量化位数为8时,其信噪比为:40.89;
当量化位数为16时,其信噪比为:89.05;
在高保真的音响系统中,要求信噪比大于90分贝,此时所用的二进制位的位数至少为16位。由此可见,CD音乐盘的音质是非常高的。
3.?????? 声道数
声道数指一次采样所记录的声音波形的个数。如果是单声道,则只产生一个声音波形,而双声道产生两个波形(双声道立体声),立体声不仅音色与音质好,而且更能反映人们的听觉效果。但是随着声道数的增加,将使所耗用的存储容量成倍增加,计算公式为:
存储量(字节/秒)=(采样频率(量化等级(声道数)/8
具体地说,一个声道只不过是能传送信号的导线。在录制声音时,可以在不同的位置安装多个话筒,因而可以从不同的方向同时录音。以后播放时,不同声道就可以组合起来产生立体声音效果。
采样频率、量化位数、声道数对声音的音质和占用的存储空间起着决定性的作用。我们希望音质越高越好,磁盘存储空间越少越好,这本身就是一个矛盾。我们必须在音质和磁盘存储空间之间取得一个平衡。
表2-1是在不同的采样频率下,不同量化等级、不同声道数的情况下,存储容量的变化表。
表2.1 采样频率,量化等级、声道数和存储容量变化表
采样频率(kHz)
量化等级(bit)
单声道(MB/min)
双声道(MB/min)
22.05
8
1.32
2.64
44.1
8
2.64
5.29
11.025
16
1.32
2.64
22.05
16
2.64
5.29
44.1
16
5.29
10.58
2.1.3????????? MIDI音乐
MIDI是英文Musical Instrument Digital Interface的缩写,意为乐器数字接口,在国内有人将之翻译为“迷笛”。1982年,许多电子乐器生产厂商在一起共同制定这种接口标准,具有这个接口的设备称为MIDI设备。由于MIDI设备均带有音乐合成器,因此在人的操纵下可以产生音乐。这个接口标准定义了MIDI设备通过MIDI接口发送编码来相互通信,这些编码相当于乐谱,他们包括音符、节拍、乐器种类及音量等,接口设备的合成器接收到这些数字编码后,便可对这些编码进行解码而生成音乐。凡遵守这一协议的不同生产厂家生产的电子乐器均可以互相连接,进行发送和接收符合MIDI标准的音乐数字编码。这样,有许多MIDI设备互相连接的各种电子乐器可组成一个形如乐队的系统,来产生各种乐器同时演奏的场面。当把MIDI应用在计算机上时,就使得计算机成为各MIDI设备间进行通信的控制器,它可控制MIDI设备奏乐,并可以对产生的音乐进行记录、存储和重放(以MIDI文件的形式)。
在MIDI设备中,最重要的是合成器,它是衡量各种MIDI设备质量高低的一个重要参数。MIDI标准实际上就是为合成器而制定,而MIDI文件就是发送给合成器以产生不同乐音的一系列指令,并生成一系列数字化信号,经过D/A转化后由音响播放。合成器按照产生乐音的物理方式,可以分成两类:FM合成方式和波形表合成方式。
FM合成方式是用电路产生的各种频率的声波复合成声音,来模拟各种乐器发出的声音,但这种模拟的声音,总是或多或少与用真实乐器演奏有所差别。目前市面上出售大部分中低档声卡,其合成器均采用的是FM合成器芯片。
波形表合成方式是将已经准备好的真实乐器的数字化录音重放出来,以合成立体乐音,实际上是对各种乐器的数字录音。波形表合成器将各种乐器的音符采样值存放在ROM中,当一个音符被调用时,便从ROM中读出,并放入RAM中,由数字信号处理器进行处理,加上各种音效,可送到D/A转化器将合成的数字音频信号变成模拟音频电压信号,然后再用电子线路进行调整,送入放大器放大后由扬声器发音。
波形表中存储的乐器音越多,所用的ROM和RAM的容量便越大。如:Sound Blaster声霸卡上有4MROM,存放有128种乐器音,18种打击乐器音和40种音效,可实现32种声音同时多旋律播放。
支持波形表的声卡上有Wave Table(波形表)或Wave Effects(波形效果)的文字说明,但要注意,有的声卡申明带有Support Wave Table(支持波形表)功能,只是说明这种声卡支持波形表技术,卡上留有将来插波形表ROM的接口,但现在并没有波形表,当需要时,可以另外购置插入该声卡。
2.1.4????????? 常见声音和音乐文件类型
声音格式实际上就是有关声音和音乐的数字信息的组织方式,不同的组织方式在计算机文件的存储中就表现为不同的扩展文件名。在Windows系统中,系统根据文件扩展名的不同分别对应不同的处理程序。在表2.2中,列出了常见声音和音乐文件的类型。
表2.2 计算机中常见声音文件类型
文件类型
流行平台
性质
备注
WAV
Windows
波形文件
Windows系统默认的声音文件类型
MIDI
多种平台
音乐格式
文件通常比较小
RMI
Windows
音乐格式
MIDI文件的变体
AU
UNIX
波形文件
主要流行于Next和Sun工作站上
AIF
APPLE
波形文件
?
VOC
Windows/DOS
波形文件
创通公司的声音标准格式
RM/RAM
多种平台
实时波形文件
主要用于Internet上实时声音传递
MP3
Windows
波形文件
压缩率较高,音质较很好
从表中列出的声音和音乐文件类型中,可以看出主要是以波形文件为主,如果解剖这些文件的内部结构,基本可以认为大同小异。
根据前面所讲,波形文件实际上就是对声波的数字化记录,之所以表现为不同的类型,主要是因为流行的平台不同、其次是因为它们的压缩方式有很大的不同,另外一个原因是为了适应不同环境的需要。在Windows系统中,主要是以WAV为主,MP3文件是在波形文件的基础上经过压缩以后形成的,而RM/RAM文件则是在波形文件的基础,根据Internet传输的需要进行了重新组织。
2.2????? 多媒体计算机中声音处理硬件
声卡是多媒体计算机最基本的配置之一。有了声卡,增加了计算机的信息表现方式,使计算机在观念上发生了很大的变化,并为实现“三电一体化”(电脑、电讯和电器融为一体)创造了条件。正因为声卡拉近了电脑和普通人群的距离,所以,为计算机的普及起到了推波助澜的作用。
2.2.1.??????? 声卡的工作原理
现在市场上声卡的品牌很多,但是其工作原理基本相同。图2.2是声卡的工作流程:
从图中可以看出,声卡的工作流程是以DSP(数字信号处理,Data Signal Processing)为核心。图中DSP左边部分为信号的输入部分,右边为信号的输出部分。在声卡的信号输入中,根据信号性质的不同,分为模拟信号和MIDI数字音乐信号。
在模拟信号输入中,可以分为MIC(麦克风)输入、Line In(线输入)输入。这些信号都是模拟信号,在输入到DSP之前,首先由A/D转换器按一定的采样频率采样并按一定的量化等级转换成数字信号,这样才能被DSP所处理。
在模拟信号被数字化后,DSP芯片可以对数字信号按不同的模式如:PCM、DPCM或ADPCM进行数据压缩,然后就可以形成文件,存储在各种存储介质中。在Windows下,形成后缀为WAV的文件。
对于由MIDI输入的信号,再经由DSP处理后,可以将这些音乐信息存放再文件中,也可以将这些信息直接发送到其他的MIDI设备,由相应的MIDI设备进行处理。所以在MIDI信号和DSP之间我们采用的是双向接口。
当我们需要播放音乐时,操作系统再将这些音乐文件调入内存,然后交给声卡的DSP去处理,声卡根据信号的不同,按不同的方式输出到相应的设备中。如果是经过A/D转换来的信息,则经过D/A转换后形成模拟信号交给功率放大器处理,并输出到音响或者是Line Out。如果是MIDI信号,或将信号交给合成器处理形成模拟信号,交给功率放大器输出,或将MIDI信号交给MIDI设备处理后输出。所以图中的MIDI设备,既可能是输入设备,也可能是输出设备。
在CD-ROM驱动器上,有专门的CD音乐的处理芯片,所以它的信息并没有经过DSP芯片处理,而是由声卡直接输送到功率放大器处理后输出。另外,对于没有声卡的用户,只要有CD-ROM驱动器,同样可以播放CD音乐。基本上所有的CD-ROM驱动上,都有一个耳机输出端口,用户只要将耳机或者带有功率放大器的音响接口插在该口上,再运行播放声音软件,就可以听音乐了。
另外,很多声卡都带有游戏杆接口,这样就可以通过游戏杆玩游戏,并同时配有音乐,使得游戏更加吸引人。
声卡中的A/D或D/A转换的位数与采样频率,决定声卡的声音质量,早期的声卡为8位,现在多为16位,甚至32位,64位,采样的频率一般有11.025kHz、22.05kHz、44.1kHz。根据前面我们在“声波概述”中所讲述的内容,根据需要选择不同的采样频率和量化等级。
对于MIDI音乐,音乐质量决定于在合成器中有采样真实的乐器的乐音并以数字形式存储在ROM中而形成的波形表,然后混合成如同真实乐器奏出的音乐一样的乐调,因而其音乐质量最高,一般较高档的声卡采用这种合成器。由FM合成器根据设置的频率合成产生的音乐则逼真度稍差,但价格也相对便宜,目前一般市场上的低价位的声卡均采用这种合成器,用户可以根据自己的需要进行选择。
2.2.2.??????? 衡量声卡质量的关键技术
衡量一块声卡质量的最重要指标有:总线类型、标准支持、即插即用、芯片类型、采样能力、合成器、MIDI功能、音效。
??????? 总线类型
不同的总线实际决定了数据传输能力的高低。在声卡中常见的总线标准有:ISA和PCI两种总线,而ISA的传输速率为6Mbps/s,而PCI可以达到133Mbps/s。由此也可以明显地看出它们传输能力有明显的区别。另外,由于ISA总线对系统资源消耗较高,对系统CPU的依赖比较大,达到25%,而PCI只有4%左右。从这点上可以看出在现阶段最好选择PCI总线的声卡。
??????? 标准支持
现在在声卡上有很多技术标准需要支持,特别是有关三维立体声标准的Direct3D标准,支持该标准的声卡产生的声音可以有更好地声音效果,很多流行的游戏都需要该标准的支持。
??????? 即插即用
是否支持即插即用(Plug and Play,通常简写为PnP)确定了声卡安装过程中是否容易。支持即插即用的声卡在安装过程中非常容易,硬件安装完毕后,系统会自动提示装入相应的应用软件,而不支持即插即用的声卡在安装过程中要设置很多参数,甚至要调整声卡上的各种跳线(Jumper),安装过程比较麻烦。
??????? 采样能力
音频采样应选择44.1kHz的采样频率,16位的量化等级,这样将音源的声音信号采样并数字化后存盘,或者播放声音信号。
对采样的音频信号还要求具有压缩功能,最常用的是采用ADPCM(自适应脉冲编码调制),大部分声卡采用一块称为CODEC的芯片,它本身具有硬件压缩功能,另外也有采用DSP+ADC,即采用数字信号处理器加A/D转换器,这类声卡采用软件压缩的方法。
??????? 芯片类型
采用CODEC芯片的声卡,有些控制由计算机的CPU进行,这样的声卡较为便宜,而采用DSP+ADC的声卡,由于DSP中已经包含了专门用于处理声音的CPU,所以对信号的处理不依赖于主机的CPU,一般这类声卡较贵。
??????? 合成器
音乐合成器可以有许多不同类型的芯片来实现,它们采用两种合成技术,即FM合成和波表合成,关于这两种合成器的详细说明可参见其他有关章节。
??????? MIDI音乐
MIDI的含义是数字乐器接口,MIDI是电子乐器之间用电缆连接的接口标准和它们之间进行通信的协议。遵守MIDI标准的乐器称为MIDI设备,MIDI设备间通过MIDI接口发送编码来互相通信,这些编码相当于乐谱,MIDI设备接收到这些编码,即MIDI信息后,合成器便会合成音乐,或者是MIDI设备奏的音乐进行记录或重放。
??????? 音效
音效是对产生的声音在加上回音、和声、混响等音乐效果,使音乐听起来更加悦耳动听。目前高级声卡声称具有180度的环绕立体声和三维立体声的音响效果。
2.2.3.??????? 声卡的安装
声卡的结构如图2.3所示。我们都知道,声卡等功能辅助卡都是插在扩展槽中。在流行的PCI总线的主板上,有两种类型的扩展槽:ISA扩展槽和PCI扩展槽。不同总线的硬卡应该插在不同的扩展槽中。所以在声卡安装前,首先必须确定声卡的总线类型。以前声卡的总线类型主要是ISA总线,新近出现了PCI总线的声卡,通过前面的叙述已经知道,PCI总线的声卡质量要高得多。不过,由于PCI和ISA扩展槽的在长度上有明显的区别,根据声卡管脚的不同,就可以很清楚地判断出声卡应该插在什么位置。另外,习惯上,PCI总线的插槽多为白色,而ISA总线的插槽则多为黑色。在总线相同的扩展槽中,每一个空槽都可以用于插入声卡,没有顺序的分别,但最好能更大距离地分开每个功能卡,这样可以有效地降低不同卡之间信号辐射的干扰。
在扩展槽中安装好声卡后,就需要在安装与声卡有关的软件。这些软件大致可以分为两类:驱动程序和应用程序。驱动程序是计算机操作系统和声卡的接口程序,是声卡工作的最基础软件,各种声卡都有自己专用的驱动程序。在Windows95/98系统中,由于支持即插即用,所以当安装完毕声卡的硬件并启动计算机后,系统通常会自动识别到新安装的声卡并提示装入相应的驱动程序,按照系统的提示,通常都能正确的安装。在成功安装驱动程序后,各种与声音有关的应用软件都可以开始工作,这些应用软件包括操作系统自带的,如:CD播放器、媒体播放机等。通常各种声卡随着硬件还带有一些应用软件,有些品牌甚至非常丰富,如:Creative(创通)公司的系列声卡。按照这些该声卡的说明书安装这些软件后,就可以正常使用了,由于不同这些应用程序与具体声卡有关,就不在这里叙述了。
在安装好声卡和应用软件后,还需要为安装声音的输入/输出设备,如:音箱等。在声卡上有如下一些信号输入/输出口,它们分别是:
1.???????? 线输入(Line In),用于录音机、CD音响等声源声音的输入。
2.???????? 话筒输入(Mic In),用于麦克风(话筒)声音的输入。该接口内部有一个放大器,能放大声音信号,由于麦克风的信号比较微弱,故需要要放大。麦克风只能接在插孔中。
3.???????? 扬声器接口(Line Out),用于连接扬声器输出声音。
4.???????? MIDI/游戏插座,一般位15针D型插座,用来连接MIDI 设备或游戏杆。
5.???????? CD In,用于从CD ROM驱动器中获得CD音乐盘的信息,这些信息不通过声卡的DSP处理,而直接送到功率放大器中使用,在CD ROM中有专门CD音乐处理芯片,不需要计算机硬件系统中CPU的处理。
6.???????? CD ROM接口插槽:这个端口可以将CD ROM驱动器直接接在声卡上。对于CD ROM驱动器来讲,不是一个标准的接口,有的用40线的扁平电缆连接,有的用35线,因而该接口只使用于某些品牌的CD-ROM驱动器,例如:Panasonic、Sony、Mitsumi等,目前基本上不在使用该接口,而是将CD-ROM驱动器接在主板上的IDE接口上。
在完成了以上这些步骤后,计算机就可以进行有关声音的操作了。
2.2.4.??????? 声卡的功能
在计算机中,声卡的功能可以简单地分为:声音的输入和声音的输出,另外很多声卡还具有简单的声音处理能力。我们根据声卡主要功能的不同,分为:模拟信号的输入、处理和输出;MIDI音乐的输入、处理和输出。
1.???????? 模拟信号输入、处理和输出
在图2.4中为模拟信号输入、处理和输出示意图。在图中,模拟声音的输入和数字化是用声卡部分完成。这些经过数字化的信号,最主要的目的是将这些信号以波形文件的方式存储或再次输出。另外,现在对于这些数字化后的信号,用途越来越广泛。常用的用途还有:
⑴语音处理
语音处理是现在很热门的话题。语音处理的最主要目的是将普通人语音转化成文本信息。在汉语中,每个音节、每个汉字都有它自己的语音特征,计算机根据这些特征,将语音信息转换成文本信息。当然,在语音处理过程中,还有许多因素需要考虑,在后面的章节中,我们会对此做专门的介绍。
⑵控制命令
控制命令和语音处理有些相似,但是相对于语音处理来讲要相对简单。在控制命令的使用过程中,控制命令毕竟不多,而语音处理面临的是大词汇集的处理。控制命令的功能主要是根据语音信号的不同,从而发出不同的命令。这样我们就可以实现用声音来控制计算机。在某些专用领域发挥着非常重要的作用,如工厂等。同时,我们还可以将一些特定的语音信息与计算机控制联系起来,如根据机器运转时发出声音的不同,判断机器的运行状况等。
⑶特征分析
特征分析就是找出用来标志某个对象的声音特征信息。不同的对象有不同的声音特征,利用这些声音特征,可以区分对象的不同。其典型的应用领域是身份验证,如:刑侦人员可以利用声音信号不同来进行身份验证;银行的自动取款机也可以根据取款人的声音来判断是否是合法用户。
2.???????? MIDI音乐输入、输出和处理
图2.5是MIDI音乐输入、处理和输出示意图。我们都知道,MIDI信号实际上记录的就是乐谱。那么我们可以根据用户在弹奏各种乐器时,立即生成它弹奏时的乐谱,为演奏者制作乐谱提供了方便。另外,不同的演奏人员有不同演奏特征,我们将这些特征进行分析,就形成了该演奏人员的特征信息。据报道,国外已经有人将莫扎特的音乐特征进行分析,从而利用这些特征重新谱曲,几可乱真。
3.???????? 声音合成
图2.6是声音合成的示意图。声音合成是将计算机中的信息用语音信号的方式输出。我们知道计算机的文本信息中是不包含声音信息的,如果要用语音的形式输出,需要首先将它们转换成语音信号,才可以输出语音信息。在输出语音信息时,需要首先满足“能被理解”,如果输出信息不能被理解,其他功能无论多么强大,都没有实际的意义;其次,如果能满足“清晰自然”,则可将声音合成提高一个档次。现在语音合成已经在开始使用,如我们拨打查询时间的电话时,电话中会传出当前时间的语音,这些时间语音是通过计算机合成而产生的。
2.3????? 多媒体计算机中声音处理软件
2.3.1.??????? 采集声音
在计算机中采集声音,根据音源的不同,有不同的采集方法。一般分成:波形声音的采集、CD音乐的采集和MIDI音乐的采集。这些声音采集的结果,都存放成WAV格式。
1.波形声音的采集
在采集波形声音之前,首先须做好硬件准备。
????????? 将麦克风接到计算机后部声卡上MIC IN孔。注意,不能插错,不能插到LINE IN孔中。
????????? 将各种不需要的声音关闭,例如包括各种环境声音和计算机发出的其他音响。
然后就可以在Windows中选择“附件”中的“录音机”开始录音了。“录音机”界面如图2.7所示。选择图中“单击开始录音”所指示按钮就可以录音。操作相当简单。录音完毕后,可以选择“文件”菜单中“保存”将录音的结果保存在文件中,以后就可以播放该文件了。
如果要调整录音时的各种参数,可以选择“文件”菜单中的“属性”。选择了该功能后,系统会弹出一个对话框,如图2.8所示。从中可以看出当前录音时采用的压缩方式,以及采样频率、量化等级、声道等信息。如果要调整这些参数,可以在“选择位置”处选择需要调整的格式,然后选择“开始转换”,系统会弹出如图2.9所示的对话框。在该对话框中可以通过“名称”选择录音质量,与之相关,可以在属性中更加具体地选择录音质量。在“格式”项目中,可以设置录音压缩的方式,不同的压缩方式有不同的压缩比例,用户可以根据自己的需要选择不同的压缩方式。
如要录制各种磁带中的声音或者录象带、电视伴音,也可以采用类似的方式。在这些设备中,都有一个称为“LINE OUT”的输出端口,将这个插孔和计算机后部声卡上的“LINE IN”插口用声频线连接起来,则这些设备的声音就可以被录制下来。
在该软件中,还可以实现一些简单的编辑,如:选择“编辑”菜单中的“插入文件”可以实现将多个波形文件连接在一起;选择“编辑”菜单中的“与当前文件混合”则可以实现将多个声音融合在一起;在“编辑”菜单中还提供了“删除”、“拷贝”和“粘贴”等功能。
2.CD音乐的采集
前面我们已经多次提到,CD音质是非常好。CD声音的采集可以用专门的软件来完成,也可以用一种非常简单的方法来实现。最简单的方法是将计算机后部的声卡上“LINE OUT”和“LINE IN”两个插孔用音频线连接起来,就可以采用上面讲过的“波形声音的采集”方式采集声音。不过这种办法可能混有一些噪音,降低了CD音乐的质量。下面我们介绍一种专门的软件:CDCOPY(CD拷贝)来完成该功能。图2.10是该软件启动后的界面。选择好需要录制的CD音乐和录制格式,注意在录制格式中可以是常见的WAV格式,也可以是新近的MP3格式(在后面有讲解),最后单击“Start Copying”指示的按钮,就可以完成录制。
3.MIDI音乐的采集
MIDI声音的采集可以采用CD音乐采集中比较简单的方法来完成。在这里就不详细叙述了。值得注意的是:在计算机中,可以同时播放CD和波形文件,并且同时从“LINE OUT”输出,这样,就相当于将两个音源合成在一起,并可以同时录音,得到一些特殊的效果。
2.3.2.??????? 输出声音
声音的输出是对采集并保存到各种媒介上的声音,用什么样的方法将它们播放出来。根据声音性质的不同,应该采取不同的方法。
1.波形声音的输出
由于波形声音文件是Windows系列软件的默认声音文件,所以播放的软件非常多,如常见的“媒体播放机”(后面有介绍)就可以直接播放波形文件,在这里就不介绍了。
2.CD音乐的输出
从前面的叙述可以看出,CD音乐的音质是非常高的,许多音乐发烧友是只听CD盘,对其他各种格式的音乐都嗤之以鼻。在Windows95/98体系中,通常将CD盘放进光驱后,计算机能自动识别,并启动相应的应用程序开始自动播放该CD音乐盘。也可以在“附件”中启动该应用程序“CD播放器”,启动后其界面如图2.11所示。该图中各种按钮的功能比较简单,这里就不详细介绍了。下面对窗口中各种注释文字解释如下。
“曲目已播放时间”:该按钮指示系统显示出当前曲目已经播放了多长时间。在该按钮右边的两个按钮的功能分别是“曲目剩余时间”和“唱片剩余时间”分别表示某曲目或者是该唱片还需要多少时间才能播放完毕。
“随机选曲”:该功能是指示系统在播放CD盘时,播放的顺序不一定按照该盘原有的排列顺序进行播放,可以按随机的顺序进行播放。如果没有选择该功能,则系统会按照CD盘的排列顺序进行播放。
“连续播放”:该功能是指示系统将一首CD曲目完整地播放出来。它是和“简介”功能相对应的。
“简介”:该功能是使系统在播放曲目时,每个曲目只播放开始的一小部分。用户可以根据得到的信息,选择性地听某些曲目。
3.MIDI音乐的输出
前面已经讲过,MIDI实际上就是乐谱的计算机表示方式。在该乐谱中记录了乐谱必备的各种信息,包括该乐谱用什么样的乐器进行演奏。一旦将MIDI音乐制成后,这些信息就被录制在MIDI音乐文件中,计算机可以直接进行播放,在后面将讲解的“媒体播放机”就是这样工作的。如果使用专门的软件,可以按照用户的需要改变MIDI文件中指定的乐器、播放速度等,经过这样的改变,可以欣赏到不同的效果的音乐,甚至乐团的演奏。
另外,从常识也知道,相同的声音在不同的环境下有不同的音响效果,比如在旷野和大厅就明显地不同,可以简单认为是“声音对环境的反映”。在一些高级声卡中,自带有这种功能,不过这种声卡比较贵。当然这些功能也可以采用软件来实现,但这会消耗很多的计算机资源,特别是CPU的资源。下面将介绍的这个软件:YAMAHA Softsynthesizer S-YXG100,图2.12就是该软件运行时的界面,该软件主要是用来播放MIDI音乐软件,同时还可以指定不同的乐器和不同的环境音效。另外,在面板中还可以通过“软波表设置”设置“乐器数目”和“CPU的负荷限值”等参数。显然,“乐器数目”越高,CPU负荷也就越大,用户可以根据需要进行选择。
5.媒体播放机
媒体播放机是Windows系列操作系统自带的一个播放软件,可以播放多种格式的文件,如:WAV波形文件、MIDI(RMI)音乐文件、AVI音频视频文件等。在这里我们只介绍怎样播放WAV波形文件和MIDI音乐文件。
这个软件在Windows系列软件的“附件”中,打开该软件后的界面如图2.13所示:
由于现在还没有打开相应的播放文件,所以不能播放。选择“文件”菜单中的“打开”条目,从中选择不同类型的声音文件就可以播放。
选择了音乐文件后,媒体播放机的界面如图2.14所示。此时选择“播放”命令就可以播放该音乐文件。播放其它类型的文件的方法与之基本相似,就不在这里详述了。
5.MP3音乐的播放
MP3是刚刚面世的一种音乐格式。从出现以来,很快就在Internet和唱片界引起了很大的反响。之所以如此,是由于MP3音乐有很高的压缩比,并且质量还非常高。
MP3是MPEG Audio Layer-3的简称。当初确定MPEG的声音压缩标准时分为三个层次:Layer-1,Layer-2和Layer-3。从表2.3中可以看出,MP3具有很高的压缩比。
表2.3各种压缩标准对比表
?
Layer-1
Layer-2
Layer-3
压缩比
1:4
1:6~1:8
1:10~1:12
每个音轨通讯速率
192Kb/s
128~96Kb/s
64~56Kb/s
如果用CD音乐的质量来采集10分钟的音乐或语音并按WAV方式存储,这将需要大约100M的存储空间。如果采用以MP3的方式压缩后存储,只需要约8.3~10M的存储空间,由此可以看出MP3的压缩效果如何了。那么这么高的压缩比,会不会损失音乐的质量呢?按照制定MP3标准的组织所讲,是有一定的损失的,但是这种损失是非常有限的。据一些音乐发烧友介绍,这种损失是微乎其微的,一般的人根本就没有办法区别,由此可见,MP3的标准是一种非常有效的压缩方式。
从前面的讲解可知到,如果以CD的质量存储音乐,每张盘约能存储65分钟的音乐,如果以每首歌曲10分钟计算,则大约可以存6~7首歌曲。那么如果以MP3的方式存储,大约可以存储60~70首音乐。由此可见,这对用户是非常有利的事情。
现在已经有很多MP3音乐播放程序,其中比较常用的是WinAMP软件,该软件比较小,但播放功能基本都具备,另外,它可以直接播放网络上的音乐。其他软件大抵都很相似,用户可以选择自己喜欢的播放程序。该软件启动后界面如图2.15所示。选择“PL(播放列表)”后,会弹出图2.16所示的对话框,用户可以用“Add File(s)”来挑选需要播放的音乐文件,也可以用“Add Directory”来选择包含MP3音乐文件的目录,另外,还可以选择“Add Location”来播放Internet站点的音乐,现在已经有很多WWW站点提供了丰富的MP3音乐。通过这些方式可以灵活地选择需要播放的内容,设置完毕后,选择Close按钮,返回到主界面。此时选择“Play”按钮就可以开始播放音乐了。
6.制作MP3音乐文件
MP3音乐有很大吸引力,很多人都想独立制作MP3音乐。其实MP3音乐制作并不困难。它的制作步骤如下:
第一步:????? 录制需要制作音乐的WAV文件。关于WAV文件的录制可以参照前面的讲解进行;
第二步:????? 启动制作软件。现在能制作MP3音乐的软件较多,选择其中一种即可。后面我们将以XingMP3 Encoder为例进行讲解。图2.17是XingMP3 Encoder的界面图。
第三步:????? 输入需要制作的WAV文件,并选择相应转换的命令就可以完成制作。
在XingMP3 Encoder软件中,可以通过界面上的“Add”按钮来选择或增加需要转换的文件。可以选择一个或多个,也就是说该软件一次可以转换一个或多个WAV文件为MP3文件,在这里我们选择了三个文件分别是:“The Microsoft Sound.wav”、“Windows启动时发金属声.wav”和前面从音乐盘中抓出的CD音乐“寒鸦戏水.wav”。在转换完毕后,用相同的名称保存在原WAV文件的相同位置。如果要改变的存放位置,可以选择“Edit”菜单中的“Preferences”条目,在弹出的对话框中,用户可以输入“Default Target Directory”(默认目录)。如果进行了这样的设置,则系统将转换后的结果保存在指定的目录之下,以便用户的管理。
下面我们将转换前后的数据进行以下对比,看看MP3音乐压缩的具体情况。从表2.4中可以看出,在将WAV文件转换成MP3文件后,文件的大小大大改变,其压缩比在这三个文件最小是5.48:1,最大是11.02:1,非常可观。
表2.4 WAV文件转换成MP3格式后大小变化表
WAV
MP3
压缩比
文件名
大小
大小
Winodws启动发金属声!!!.wav
274KB
50KB
5.48:1
The Microsoft Sound.wav
677KB
123KB
5.50:1
寒鸦戏水.wav
57595KB
5225KB
11.02:1
2.3.3.??????? 语音处理
在中国,“处理声音”用得最为广泛的是“语音录入”,即用语音录入汉字。传统的汉字录入都是采用键盘,用语音录入则可以解放双手,在一些领域语音录入有特别重要的应用,如领导的即席讲话。
现在流行的语音录入软件有:中自公司的“汉王”系列(包含手写录入、语音录入和OCR)、IBM公司的ViaVoice等。下面我们就ViaVoice做一个简单介绍。
ViaVoice是IBM公司推出的中文语音识别软件。在这之前,IBM公司已经推出美国英语、英国英语、意大利语、德语等多种语言的语音识别软件。新近推出的中文语音识别软件在中国掀起语音的识别的高潮。
在安装语音识别软件中,系统将首先测试您的麦克风等声音输入设备是否正确;然后,系统将让您做“语音适应性”训练。这个过程是让系统适应用户的口音,并且要抽取出用户的语音特征,为用户建立起特定的语音效果库。为了能达到比较好的识别效果,系统将要求用户尽量做到:
????????? 环境的一致性。该要求是指在安装软件时的硬件环境应该与使用过程中的硬件环境保持一致。主要是指如:声卡、麦克风、麦克风的位置等尽量要保持一致。
????????? 口音的一致性。该要求是指语音适应性训练时的口音应该与使用过程的口音保持一致。如果是不同的人使用该软件,应该为每个用户都建立相应特征语音库,系统提供了这样的功能。
????????? 在使用过程中,应该使吐字速度等保持一致。
在该软件安装成功以后,其使用方法较为简单。启动ViaVoice软件中的“IBM语音板”,其界面如图2.18所示。要开始进行语音识别可以选择“听写”菜单中的“开始听写”即可。此时系统会提示用户已经进入听写状态,则用户就可以进行听写了。如果结果不满意,可以选择该菜单下的“纠错”功能进行调整。用户在使用过程中,应该养成良好的习惯,有错误一定要指出,使系统能明白刚才的读音的正确结果,同时也相当于对计算机进行了一次训练。长此以往,则系统会逐步提高识别率。
图2.22中的内容正确的应该是“我经常想朋友推荐电影,但是结果几乎都不太一样,有的人喜欢极了,有的却很不以为然。”。在这段文字中,只有将“结果”错误地识别成了“建国”,其余的都完全正确。由此可见其识别率是非常高的。
总之,语音识别在一定的领域内将大有可为。
课件12张PPT。声音信息的加工授课教师:周文璞 查看学习资料和课本,分小组讨论探究声音数字化原理,并将答案写在学习卡上。合作探究1、声音是如何进入计算机的?2、又是如何从计算机传出来的? 把模拟的声音信号变成计算机能够识别和处理的数字信号,这个过程称为数字化,也叫“模数转换”。把数字声音信号转变成模拟声音信号,然后再输出到扬声器,这个过程称为“数模转换”。 计算机通过声卡来实现模数转换和数模转换声卡接口动手实践 根据微课视频安装并设置好耳麦,搭建好自己的录音棚自主探究 利用录音机软件录制学习卡上的诗歌,并保存在E盘,命名为:XXX班xxx.wav拓展练习 将刚刚录制的XXX班xxx.wav文件截取一段并设置为WINxp最小化的声音。探究问题 1、利用录音机软件录制声音超过60秒的怎么办?
2、如何让WAV格式变成MP3格式呢?本堂小结 了解了声音数字化的原理,认识了声卡,动手搭建了录音棚,实践操作了录音机软件,并将自己的声音录制进了电脑 。希望同学们以后在发布自己的声音信息是一定要遵守相关的法律法规。不造谣、不信谣、不传谣。感谢专家指导!