数字音频的编辑和处理声音信号的两个基本参数是频率和幅度。频率是指信号每秒钟变化的次数,用Hz表示。人们把频率小于20Hz的信号称为亚音信号,或称为次音信号(subsonic);频率范围为20Hz~20kHz的信号称为音频(audio)信号;虽然人的发音器官发出的声音频率大约是80Hz~3400Hz,但人说话的信号频率通常为300Hz~3000Hz,人们把在这种频率范围的信号称为话音(speech)信号;高于20kHz的信号称为超音频信号,或称超声波(ultrasonic)信号。在多媒体技术中,处理的信号主要是音频信号,它包括音乐、话音、风声、雨声、鸟叫声、机器声等。1.声音的数字化声音进入计算机的第一步就是数字化。人耳听到的声音是一种具有振幅、周期的声波,计算机要处理这种声波,可以通过话筒把机械振动转变成相应的电信号,这也是一种连续的模拟信号,而计算机只能处理数字量,所以只有把这种模拟量转换成数字量计算机才能处理。这个转换过程称为模/数转换(A/D转换)即声音的数字化。模/数转换过程主要分采样、量化及编码3步。(1)采样。在某个特定的时刻对模拟信号进行测量叫做采样(sampling)。其做法是每隔一定时间对模拟信号的幅值进行测量,得到离散的幅值,用它代表两次采样之间的模拟值。假设输入电压的范围是-4V~4V,并假设它的取值只限定在0、1、2、…,7共8个值。第一次采样得到的幅度值是-0.82V,它的取值就应算作-1V,第二次采样得到的幅度值是0.89V,它的取值就算作1V,以此类推下去即可得到一系列的采样值,用这些离散数值代表相应时间段内声音的连续值(如图10-1所示)。图10-1声音的采样和量化采样频率是指单位时间(1s)内采样的次数。采样频率越高,声音回放出来的效果越好,文件所占的存储空间也就越大。采样频率不应低于声音信号最高频率的两倍,常用的采样频率有44.1kHz、22.05kHz、10.25kHz。(2)量化。量化是将经过采样得到的离散数据转换成二进制数的过程,量化位数即分辨率是指将经过采样得到的离散数据转换成几位二进制数。上例中,如果取量化位数为8位,即将采样的到的值用8位二进制数表示,则第一次采样得到的值-1即可表示为-00000001,第二次采样得到的值可表示为00000001。在多媒体计算机中音频的量化位数一般为32、16、8、4位。显然,量化位数(二进制位数)越多,量化后的波形越接近原始波形,声音的音质越好,存储该声音所用的文件也就越大。(3)编码。将采样量化后的二进制数据按照一定的规则进行组织,以利于计算机的处理称为编码。最简单的编码是用二进制的补码表示。如上例中第一次采样值-1经过编码后被表示为11111111,第二次表示为00000001。上述声音的数字化过程是由声卡完成的。一秒钟声卡对声音采样上千次,通过模/数转换器将模拟声波转换成数字信息存储在扩展名为.wav的波形文件中。当声音播放时,声卡中的数/模转换器将声音还原成模拟信号、放大输出到喇叭或耳机,变成人耳能够听到的声音。2.声音的压缩(1)声音文件的大小。一般来说,采样频率、量化位数越高,声音质量也就越高,保存这段声音所用的空间也就越大。立体声(用两个波形记录声音)是单声道(用一个波形记录声音)文件的2倍。即文件大小(B)=采样频率(Hz)×录音时间(s)×(分辨率/8)×通道数(单声道为1,立体声为2)如:采用采样频率为44.1kHz,分辨率为16位,立体声的标准录音,录制10s的文件大小为:44.1×103×10×(16/8)×2=1764000B即1.68MB由此可见,音频的数字化要占用很大的空间,因此对音频数字化信号进行压缩是十分必要的。(2)声音的压缩。声音信号的压缩编码方式有两种:一种是波形编码技术,针对声音波形进行编码;另一种是声码技术,是对声音数字信号进行分析,提取其特征参数。经编码后可由重构来合成声音信号。波形编码是对声音波形进行抽样、量化、编码。在信号采样和量化过程中,考虑到人的听觉特性,使编码后的音频信号与原始信号的波形尽可能匹配,采样频率如果在9.6Kbps~64Kbps的到的声音信号的质量较高。但波形编码法易受量化噪声影响,进一步降低编码率也较困难。常用的压缩编码是DPCM(差分脉冲编码调制)和ADPCM(自适应差分量化)。参数分析与合成的编码方法是以声音信号产生的模型为基础,将...