跳至內容

視訊壓縮

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

視像壓縮(英語:Video compression)是指運用資料壓縮技術將數碼視像資料中的冗餘資訊去除,降低表示原始視像所需的資料量,以便視像資料的傳輸與儲存。實際上,原始視像資料的資料量往往過大,例如未經壓縮的電視質素視像資料的位元率高達216Mbps,絕大多數的應用無法處理如此龐大的資料量,因此視像壓縮是必要的。目前最新的視像編碼標準為ITU-T視像編碼專家組(VCEG)和ISOIEC動態圖像專家組(MPEG)聯合組成的聯合視像組JVT,Joint Video Team)所提出的H.264/AVC[1]

簡介

視像壓縮通常包含了一組編碼器解碼器。編碼器將原始的視像資料轉換成壓縮後的形式,以便進行傳輸與儲存。解碼器則是將壓縮後的形式轉換回視像資料的表示。一組成對的編碼器與解碼器通常被合稱為編解碼器(CODEC、enCOder/DECoder英語decoder)。

壓縮方法

典型的視像編碼器

資料壓縮是透過去除資料中的冗餘資訊而達成。就視像資料而言,資料中的冗餘資訊可以分成四類:

  • 時間上的冗餘資訊(temporal redundancy)
在視像資料中,相鄰的幀(frame)與幀之間通常有很強的關連性,這樣的關連性即為時間上的冗餘資訊。
  • 空間上的冗餘資訊(spatial redundancy)
在同一張幀之中,相鄰的像素之間通常有很強的關連性,這樣的關連性即為空間上的冗餘資訊。
  • 統計上的冗餘資訊(statistical redundancy)
統計上的冗餘資訊指的是欲編碼的符號(symbol)的概率分佈是不均勻(non-uniform)的。
  • 感知上的冗餘資訊(perceptual redundancy)
感知上的冗餘資訊是指在人在觀看視像時,人眼無法察覺的資訊。

右上圖為一個典型的視像編碼器。在進行當前訊號編碼時,編碼器首先會產生對當前訊號做預測的訊號,稱作預測訊號(predicted signal),預測的方式可以是時間上的預測(inter prediction英語inter prediction),亦即使用先前幀的訊號做預測,或是空間上的預測(intra prediction),亦即使用同一張幀之中相鄰像素的訊號做預測。得到預測訊號後,編碼器會將當前訊號與預測訊號相減得到殘餘訊號(residual signal),並只對殘餘訊號進行編碼,如此一來,可以去除一部份時間上或是空間上的冗餘資訊。接着,編碼器並不會直接對殘餘訊號進行編碼,而是先將殘餘訊號經過變換(通常為離散餘弦變換)然後量化以進一步去除空間上和感知上的冗餘資訊。量化後得到的量化系數會再透過熵編碼,去除統計上的冗餘資訊。

在解碼端,透過類似的相反操作,可以得到重建的視像資料。

衡量

衡量視像壓縮技術的優劣,可以從運算複雜度和壓縮質素兩方面來看。就運算複雜度而言,理想的編碼器運算複雜度越低越好。而就壓縮質素而言,必須同時考慮壓縮後視像的位元率和失真程度。壓縮後的位元率和失真程度皆為越低越好,兩者之間存在一個權衡關係,理想的編碼器旨在追求能夠提供位元率和失真程度間的最佳折衷關係。

一般情況下,編碼器的運算複雜度和壓縮質素之間也存在一個折衷關係,根據應用的不同而有所抉擇。例如當應用為視像資料的儲存時,可以選擇運算複雜度和壓縮質素較高的設計。而當應用為視像會議或是手機視像通話,受限於即時(即時)通訊的要求或是有限的運算資源,可能會選擇運算複雜度和壓縮質素較低的設計。

由於編碼後的影像質素最終是由人眼所判斷的,在衡量失真程度時,應使用與人類視覺感知相符的影像質素衡量標準。然而,傳統所使用的衡量標準像是峰值信噪比和人類視覺感知不全然相關[2]。近幾年已有基於人類視覺感知的影像質素衡量標準被提出,例如結構相似性指標[3]結構相似性 index,SSIM index)與視覺資訊忠誠[4](visual information fidelity,VIF),並且在編碼器的設計中被使用[5],進一步提昇了壓縮後的影像質素。

標準

視像編碼標準主要是由ITU-TISOIEC兩大組織制定而成,其發展如下表所示。

視像編碼標準發展
年份 標準 制定組織 解除著作權保護
DRM-free
主要應用
1984 H.120 ITU-T
1990 H.261 ITU-T 視像會議視像通話
1993 MPEG-1第二部份 ISOIEC 影音光碟(VCD
1995 H.262/MPEG-2第二部份 ISOIECITU-T DVD影碟DVD-Video)、藍光Blu-Ray)影碟、數碼視像廣播(DVB)、SVCD
1996 H.263[6] ITU-T 視像會議視像通話3G手機視像(3GP
1999 MPEG-4第二部份 ISOIEC
2003 H.264/MPEG-4 AVC[1] ISOIECITU-T 藍光Blu-Ray)影碟、高清DVDHD DVD)、數碼視像廣播(DVB)、串流媒體、影片錄製
2013 高效率影片編碼(H.265/HEVC) ISO/IECITU-T 超高清藍光光碟(UHD Blu-Ray)、數碼視像廣播(DVB)、串流媒體、影片錄製
2020 多功能影片編碼(H.266/VVC) ISO/IECITU-T 未普及

不同視像編碼標準之間的效能比較可以在文獻[7]中找到。此外還有VP9AV1等其他編碼標準。

參見

外部連結

參考資料

  1. ^ 1.0 1.1 Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC), May 2003.
  2. ^ Zhou Wang and Alan C. Bovik, "Mean squared error: Love it or leave it? - A new look at signal fidelity measures," IEEE Signal Processing Magazine, vol. 26, no. 1, pp 98−117, Jan. 2009.
  3. ^ Zhou Wang, Alan C. Bovik, Hamid R. Sheikh, and Eero P. Simoncelli, "Image quality assessment: from error visibility to structural similairty," IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600−612, Apr. 2004.
  4. ^ H. R. Sheikh and A. C. Bovik, "Image information and visual quality," IEEE Trans. Image Process., vol.15, no.2, pp.430−444, Feb. 2006.
  5. ^ Z. Y. Mai, C. L. Yang, K. Z. Kuang and L. M. Po, "A novel motion estimation method based on structural similarity for H.264 inter prediction,」 in Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2, pp. 913−916, May 2006.
  6. ^ ITU-T, "Video coding for low bit rate communications," ITU-T Recommendation H.263, version 2, Jan. 1998.
  7. ^ Thomas Wiegand, Heiko Schwarz, Anthony Joch, Faouzi Kossentini, and Gary J. Sullivan, "Rate-constrained coder control and comparison of video coding standards," IEEE Trans. Circuits Syst. Video Technol., vol. 13, no. 7, July 2003.