音频信号在时间域上的冗余形式主要表现在以下几方面。
(1)样值幅度分布的非均匀性
统计表明,在大多数类型的音频信号中,不同幅度的样值出现的概率不同,小幅度样值比大幅度样值出现的概率要高。尤其在语音和音乐信号的间隙,会有大量的小幅度样值。
(2)样值间的相关性
对语音波形的分析表明,相邻样值之间存在很强的相关性。当采样频率为8kHz时,相邻样值之间的相关系数大于0.85。如果提高采样频率,则相邻样值之间的相关性将更强。因而根据这种较强的一维相关性,利用差分编码技术,可以进行有效的数据压缩。
(3)信号周期之间的相关性
虽然音频信号分布于20Hz~20kHz的频带范围,但在特定的瞬间,某一声音却往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,就会像某些振荡波形一样,在周期与周期之间存在着一定的相关性。利用音频信号周期之间的相关性进行压缩的编码器,比仅仅利用邻近样值间的相关性的编码器效果要好,但要复杂得多。
(4)长时自相关
上述样值、周期间的一些相关性,都是在20ms时间间隔内进行统计的所谓短时自相关。如果在较长的时间间隔(如几十秒)内进行统计便得到长时自相关函数。长时统计表明,当采样频率为8kHz时,相邻样值之间的平均相关系数可高达0.9。
(5)静音
语音间的停顿间歇本身就是一种冗余。若能正确检测出该静音段,并去除这段时间的样值数据,就能起到压缩的作用。
*摘自《数字电视原理》第3版