數字視頻的編碼標準
來源:訊維 編輯:lsy631994092 2019-06-25 15:33:28 加入收藏
壓縮編碼標準是數字視頻產業發展的基石和標尺。數字編解碼標準采用的基本方法幾乎都是基于塊的混合編碼框架,混合編碼框架的技術方式主要包括基于DCT變換編碼運動補償的預測編碼和熵編碼,這是現代視頻編碼的關鍵技術。所謂”基于塊”,指的是首先將一幅圖像分成矩形的像素塊,作為編碼處理的基本單元。“混合”指的是消除時間冗余的運動估計與消除空間冗余的變換編碼的結合。在理想情況下, -方面為了充分利用像素之間的空間相關性,變換應該應用于整幅圖像或視頻幀;另一方面,如果以單個像素為單位進行運動估計,就能夠精確地消除時間冗余。但是以上兩種方式的計算復雜度都相當高,且要求兩者是互相矛盾的。因此,通常采用適當大小的矩形像素塊作為變換編碼和運動估計的基本單位,以平衡編碼效率和計算復雜度兩方面的矛盾。
數字視頻編碼是減少數據冗余的過程。雖然用于表示數字視頻的數據量很大,但數據之間往往保持高度的相關性,這些相關性表現出數據的冗余。視頻壓縮編碼就是采用一定的方式減少數據之間的相關性,盡可能消除冗余,使數據最有效地表示信息。通常的數據冗余存在于三個方面,即空間、時間和心理視覺冗余。
空間冗余產生的原因在于視頻序列都是由一幀一幀的圖像序列組成的,對于每幀圖像,前景物體和背景都有很大的相關性。據統計,圖像內的每個像素都與其距離小于16個像素點的像素相關。
時間冗余存在的原因在于視頻序列在時間上的相關性,視頻幀在時間上呈現的是一種近似連續的變化;在動態視頻序列中,前一幀圖像和后一幀圖像有很大的相關性,因此形成時間上的數據冗余。在一定的時間間隔內,視頻序列中的背景往往都相同,前景物體只是有微小的變化,即平移、旋轉或拉伸等,所以相鄰的兩幀或幾幀之間有許多相同或相近的地方,沒有必要在每幀中都把這些數據信息表示出來。
心理視覺冗余是由于人類視覺系統對圖像的變化感知產生的,人的視覺系統是非均勻和非線性的,并不是圖像的所有變化都能感知。而且,人眼對圖像的亮度和色度的敏感度相差很大,對亮度的敏感度遠大于對色度的敏感度。心理視覺冗余就是利用人的錯覺來壓縮數據量。數字視頻編碼可通過變換編碼和預測編碼達到消除冗余的目的,并以較小的帶寬傳輸盡量多的有效數據。
在制定數字音視頻壓縮編碼標準的過程中,聯合圖像專家組(Joint Photographic Experts Group, JPEG)、動態圖像專家組(Moving Pictures Experts Group, MPEG)和視頻編碼專家組(Video Coding ExpertGroup, VCEG)發揮了至關重要的推動作用。
評論comment