Posted by : Kuroneko Book Club Jumat, 01 November 2013


Digital Video Coding

Bentuk-bentuk dari video digital antara lain :
Interlaced scan
Interlaced scan dipakai pada sistem broadcast TV analog. Interlaced scan merekam gambar dalam set baris ganjil dan genap. Tiap set baris ganjil dan genap adalah field dan pasangan field ganjil dan genap disebut sebagai frame.
Progressive scan
Progressive scan menangkap dua kali field per detik dari interlaced bila keduanya beroperasi pada nilai frame per detik yang sama.
R=W x H x D x Fs
W = lebar video (pixel)
H = tinggi video (pixel)
D = kedalaman (bits/pixel)
Fs = frame rate
Beberapa teknik tambahan dalam pengkodean video digital :
Chroma subsampling
Kompresi intraframe : untuk menghapus redundansi spasial pada frame tunggal yang kemudian dapat digunakan untuk kompresi interframe
Kompresi interframe : untuk menghapus redundansi sementara antar frame dan sering disebut sebagai estimasi dan kompensasi gerakan
Pengkodean entropi
Kontrol rate : penentuan langkah kuantisasi supaya seluruh bitrate dapat memenuhi penyimpanan data yang telah ditentukan dan kebutuhan transmisi
Tujuan dari pengkodean video digital adalah untuk pengurangan bitrate dalam penyimpanan dan transmisi menggunakan statistik dan redundansi subjektif dan untuk memanfaatkan informasi probabilitas menggunakan teknik pengkodean entropi untuk menurunkan panjang pengkodean symbol secara lossless. Teknik – teknik kompresi pada pengkodean video digital antara lain :
Teknik simple
Digunakan untuk operasi dengan kompleksitas sangat rendah / pengkodean lossless. Teknik truncation mengurangi jumlah bit yang digunakan untuk merepresentasikan nilai data domain spasial / domain transform. Color look-up Table (CLUT) digunakan untuk mengubah nomor logical warna yang disimpan pada tiap pixel memori video ke dalam warna fisik. Run-length coding (RLC) digunakan untuk kompresi set terbatas dari kode sumber yang memiliki kemunculan frekuensi yang ganjil.
Teknik interpolatif
Teknik interpolatif mengurang dimensi spasial komponen chrominance video masukan sehingga jumlah pixel yang akan dikodekan berkurang.
Teknik entropi
Dua teknik utama entropi adala kode Huffman dan pengkodean aritmatik
Prediktif dan estimasi gerakan
Teknik ini dapat diaplikasikan ketika korelasi antara pixel yang berhubungan secara temporal/spasial atau koefisien domain transform kuat. Kunci utama menghapus redundansi sementara adalah dengan estimasi gerakan, dimana vector gerakan diprediksi antara frame sekarang dan frame referensi. Algoritma pencarian cepat pola blok rektangular antara lain three-step search (3SS), four-step search (4SS), dan block-based gradient descent search (BBGDS). Algoritma pencarian cepat pola blok nonrectangular adalah algorirtma Diamond Search (DS). Algoritma pencarian ini menggunakan dua pola pencarian antara lain large diamond search pattern (LDSP) dan small diamond search pattern (SDSP). Langkah-langkah algoritma DS adalah :
Inisialisasi LDSP pada posisi tengah dari jendela pencarian dan 9 poin pengecekan LDSP diuji. Jika poin SAD minimum yang dihitung diletakkan pada posisi tengah, lanjut ke langkah 2, bila tidak, lanjut ke langkah 3.
Poin SAD minimum yang telah dihitung pada langkah sebelumnya diatur ulang posisinya sebagai poin tengah, untuk membentuk LDSP baru. Jika poin minimum SAD yang baru terletak pada posisi tengah, lanjut ke langkah 3, bila tidak, ulangi langkah ini secara rekursif.
Ubah pola pencarian dari LDSP ke SDSP. Poin SAD minimum yang dihasilkan pada langkah ini adalah solusi akhir untuk vector gerakan dan menunjuk ke blok dengan pasangan terbaik.

Gambar 1 three-step search untuk estimasi gerakan

Gambar 2 four-step search untuk estimasi gerakan
Transformasi
Tujuan transformasi adalah untuk dekorelasi konten frame gambar dan untuk encodekoefisien transformasi. DCT digunakan dengan dua cara yang berbeda. Cara pertama adalah digunakan untuk mengurangi redundansi spasial dari frame tunggal video. Cara kedua adalah untuk dikombinasikan dengan teknik kompresi gerakan untuk mengurangi redundansi temporal menggunakan estimasi gerakan, yang kemudian dilanjutkan dengan DCT untuk mengurangi redundansi spasial lebih lanjut.
Statistikal

Pengkodean video H.263 dan H.263+

Gambar 3 Blok diagram encoder H.263

Gambar 4 Blok diagram decoder H.263
Langkah –langkah pengkodean :
Struktur frame video
Standar H.263 mendukung mendukung lima format gambar terstandardisasi yaitu sub-QCIF, QCIF, CIF, 4CIF, dan 16CIF.
Transformasi DCT
Kuantisasi
Pengkodean entropi
Mode opsional
H.263+ atau H.263 versi 2 dikembangkan dengan tujuan melebarkan jarak aplikasi dan untuk meningkatkan efisiensi kompresi. Perbaikan pada versi ini adalah peningkatan kualitas dari video terkompresi untuk komunikasi dua arah secara real-time.

Pengkodean video MPEG-1 dan MPEG-2
Pengkodean video MPEG-1
Teknik pengkodean ini mirip dengan skema dasar blok H.261 hibrid DCT/DPCM, yang meliputi struktur blok makro, kompensasi gerakan, dan penambahan kondisional. Standar MPEG-1 mengkategorikan tiga tipe pengkodean macroblock (MB), yaitu :
Skipped_MB, dimana vektor gerakan adalah nol dan semua koefisien kuantisasi DCT adalah nol.
Inter_MB, dimana prediksi kompensasi gerakan dari referensi frame lalu dan mendatang digunakan.
Intra_MB dimana tidak ada prediksi dari frame sebelumnya yang digunakan.
Pengkodean video MPEG-2
Konsep yang digunakan dalam pengkodean video MPEG-2 adalah gambar frame & field, prediksi gerakan pada frame & field, DCT frame & field, dan scan alternative. Mode pengkodean scalable dari MPEG-2 antara lain :
Skalabilitas SNR, digunakan untuk menyediakan degradasi kualitas dengan basis skalabilitas frekuensi dari video pada media transmisi.
Skalabilitas spasial, digunakan untuk mendukung tampilan dengan resolusi spasial yang berbeda pada penerima.
Skalabilitas temporal, digunakan untuk mendukung resolusi temporal atau frame rate yang berbeda.

Pengkodean MPEG-4 dan H264/AVC
Pengkodean ini mengandalkan representasi objek pada data video. Objek video dikategorisasikan berdasarkan property intrinsic seperti bentuk, tekstur, dan gerakan. Fitur pada pengkodean ini adalah :
Pengkodean objek media yang mengijinkan kompresi data dari objek media yang meliputi audio, visual, atau konten audio-visual
Komposisi objek media yang mengijinkan komposisi dari objek media untuk menciptakan bahan objek media sehingga dapat membentuk adegan audio-visual.
Multiplex objek media yang meliputi multiplexing dan sinkronisasi asosiasi data dengan objek media untuk transport antar jaringan.
Interaksi objek media yang mengijinkan interaksi dengan adegan audio-visual pada penerima.

Pengkodean H.264/MPEG-4 AVC
Pengkodean ini mirip dengan pengkodean video MPEG-2 yang terdiri dari gabungan antara temporal block-based dan prediksi spasial dan pengkodean transformasi block-based.

Gambar 5 encoder H.264/AVC
Windows Media Video 9 (WMV-9)
Beberapa inovasi pada WMV-9 adalah :
Transformasi ukuran blok yang adaptif
Tranformasi dengan presisi terbatas
Kompensasi gerakan
Kuantisasi dan dekuantisasi
Pengkodean entropi yang mahir
Penyaring deblocker secara inloop
Pengkodean B-frame yang mahir
Pengkodean interlace
Overlap smoothing
Low-rate tools
Kompensasi kekaburan.
WMV-9 mendefinisikan empat mode vector gerakan, yaitu :
Ukuran blok campuran (16x16 dan 8x8), quarter-pixel, bicubic;
16x16, quarter-pixel, bicubic;
16x16, half-pixel, bicubic;
16x16, half-pixel, bilinear;

Leave a Reply

Subscribe to Posts | Subscribe to Comments

Popular Post

Diberdayakan oleh Blogger.

- Copyright © College Notes for Today -Metrominimalist- Powered by Blogger - Designed by Johanes Djogan -