音频压缩 (格式)

本页使用了标题或全文手工转换
维基百科,自由的百科全书

音频压缩(区别于动态压缩)属于数据压缩的一种,用以减少音讯流媒体的传输频宽需求与音讯档案的储存大小。按压缩方法可以分为无损压缩和有损压缩。

无损音频压缩

无损压缩虽然缩小音频的储存大小,但可以保留原始文件的所有信息,在播放上与原始文件没有任何差别。可以从以下方面评估:压缩速度、压缩比率、解码速度、软件硬件支持、稳定性和出错率。

无损压缩是一个可逆的过程,利用信息冗馀进行资料压缩。

根据信息理论中的信源编码定理:

其中为输入讯息的长度。

为输出讯息的长度。

小于两者的互信息,则传递的资料会产生错误,因此无损压缩原是不可能的。

但是现实生活中传递的讯息常常会有信息冗馀的情况,所以无失真压缩仍是可行。

利用信息冗馀来进行压缩的范例如下:

假设今天要传递的讯息是一间教室的哪些座位为空位。

相较于传递每个座位的个别资讯一连串的讯息,直接传递哪几排座位为空位更能节省消息的大小。

因此无失真压缩的压缩率也跟资料源的一致性有关,一致性越高,压缩率越高。

Shorten是一种比较早的无损压缩格式;后来出现的有Free Lossless Audio Codec(FLAC)、Apple Lossless(ALAC)、Monkey's Audio(APE)和WavPack(WV)。

有损音频压缩

有损压缩,对原始文件的一些信息做一些近似处理,以得到更小的文件。

压缩后档案大小约为原本的百分之五到百分之二十(无损档案压缩约为原本的百分之五十到百分之六十)。

有损压缩是一个不可逆的过程,但是有损压缩将人类心理学、听觉系统的辨识都纳入压缩结果的考量。

因此虽然压缩后档案很小,聆听者几乎分辨不出来。

由于有损压缩的不可回复性,这种格式并不适合用在需要反复存档、读取的工作上。

例如音乐工作者修改乐曲内容,有损压缩较适合用在最后的使用者上,最常见的有损压缩算法如 MP3

有损资料压缩常用的压缩方法为修正离散馀弦(MDCT),利用人类听阈的特性以及听觉掩蔽,将不重要的声音资讯舍弃。

结合人类大脑听觉辨识与人耳听阈的研究称为声心理学。

需要注意的是,虽然有损压缩在理论上对原始文件造成损失,但这种损失不一定能被人耳分辨出来。[1]

参考文献

  1. ^ 存档副本. [2014-06-11]. (原始内容存档于2020-12-22).