为使编码后的音频信息可以被广泛地使用,在进行音频信息编码时需要采用标准的算法。因而,需要对音频编码进行标准化。
2.1音频信号
通常将人耳可以听到的频率在20Hz到20KHz的声波称为为音频信号。人的发音器官发出的声音频段在80Hz到3400Hz之间,人说话的信号频率在300到3000Hz,有的人将该频段的信号称为语音信号。在多媒体技术中,处理的主要是音频信号,它包括音乐、语音、风声、雨声、鸟叫声、机器声等。
表1数字音频等级
2.2音频编码技术
语音编码技术又分为三类:波形编码、参数编码以及混合编码。
波形编码:波形编码是在时域上进行处理,力图使重建的语音波形保持原始语音信号的形状,它将语音信号作为一般的波形信号来处理,具有适应能力强、话音质量好等优点,缺点是压缩比偏低。该类编码的技术主要有非线性量化技术、时域自适应差分编码和量化技术。非线性量化技术利用语音信号小幅度出现的概率大而大幅度出现的概率小的特点,通过为小信号分配小的量化阶,为大信号分配大的量阶来减少总量化误差。我们最常用的G.711标准用的就是这个技术。自适应差分编码是利用过去的语音来预测当前的语音,只对它们的差进行编码,从而大大减少了编码数据的动态范围,节省了码率。自适应量化技术是根据量化数据的动态范围来动态调整量阶,使得量阶与量化数据相匹配。G.726标准中应用了这两项技术,G.722标准把语音分成高低两个子带,然后在每个子带中分别应用这两项技术。
音乐的编码技术主要有自适应变换编码(频域编码)、心理声学模型和熵编码等技术。
心理声学模型:其基本思想是对信息量加以压缩,同时使失真尽可能不被觉察出来,利用人耳的掩蔽效应就可以达到此目的,即较弱的声音会被同时存在的较强的声音所掩盖,使得人耳无法听到。在音频压缩编码中利用掩蔽效应,就可以通过给不同频率处的信号分量分配以不同的量化比特数的方法来控制量化噪声,使得噪声的能量低于掩蔽阈值,从而使得人耳感觉不到量化过程的存在。在MPEGlayer2、3和AAC标准及AC-3标准中都采用了心理声学模型,在目前的高质量音频标准中,心理声学模型是一个最有效的算法模型。
2.3数字音频编码的主要应用
对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量:
—比特率;
—主观/客观的语音质量;
—计算复杂度和对存储器的要求;
—延迟;
—对于通道误码的灵敏度;
—信号的带宽。
由于不同的应用,人们对数字音频信息的要求是不同的,并且在选择数字音频信息编码所采用的技术时也需要了解人们对音频信息的各种应用。目前数字音频信息处理技术主要应用于:
■消费电子类数字音响设备
CD唱机、数字磁带录音机(DAT)、MP3播放机以及MD(MiniDisc)唱机已经广泛地应用了数字音频技术。
■广播节目制作系统
在声音节目制作系统,如录音、声音处理加工、记录存储、非线性编辑等环节使用了数字调音台、数字音频工作站等数字音频设备。
■多媒体应用
在多媒体上的应用体现在VCD、DVD、多媒体计算机以及Internet。VCD采用MPEG-I编码格式记录声音和图像;DVD-Audio格式支持多种不同的编码方式和记录参数,可选的编码方式包括无损的MLP、DSD、DilbyAC-3、MPEG2-layer2Audio等,而且是可扩充的、开放的,并可以应用未来的编码技术:Internet上采用MP3的音频格式传输声音,以提高下载能力。
■广播电视数字化
在广播电视和数字音频广播系统中,声音编码采用MUSICAM编码方法,符合MPEG-1Layer1高级音频编码。如当今的数字电视采用的音频标准就是DilbyAC-3和MPEG-layer2。
■通讯系统
总之,根据应用场合的不同可以将数字音频编码分为如下两种编码:
语音编码:针对语音信号进行的编码压缩,主要应用于实时语音通信中减少语音信号的数据量。典型的编码标准有ITU-TG.711、G.722、G.723.1、G.729;GSMHR、FR、EFR;3GPPAMR-NB、AMR-WB;3GPP2QCELP8k、QCELP13k、EVRC、4GV-NB等。
音频编码:针对频率范围较宽的音频信号进行的编码。主要应用于数字广播和数字电视广播、消费电子产品、音频信息的存储、下载等。典型的编码有MPEG1/MPEG2的layer1、2、3和MPEG4AAC的音频编码。还有最新的ITU-TG.722.1、3GPPAMR-WB+和3GPP24GV-WB,它们在低码率上的音频表现也很不错。
三、音频编码标准发展现状
3.1语音编码标准发展现状
3.2音频编码标准发展现状
MPEG4的目标是提供未来的交互多媒体应用,它具有高度的灵活性和可扩展性。与以前的音频标准相比,MPEG4增加了许多新的关于合成内容及场景描述等领域的工作。MPEG4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,并在诸多领域内给予高度的灵活性。
3.3具有我国自主知识产权的音频编码标准发展现状
四、数字音频编码技术的发展趋势
4.1语音编码技术的发展趋势
除此之外,为适应在Internet上传送语音的需要,目前ITU-TSG16组正在研究和制定可变速率的语音编码标准。变速率的语音编码将是近期语音编码发展的一个趋势。