BETA La rivista ipertestuale tecnica
BETA
BETA La rivista ipertestuale tecnicaBarra BETA
Barra Sito Beta.it

BETA 2299.5 - Multimedia: La codifica digitale MPEG - Parte 1 | Parte 2 | Parte 3 | Parte 4 | Parte 5  -  Indici | Guida

Clicca qui!

La codifica digitale MPEG

Andrea Lubrano, Fabrizio Gargano, Luciano Giustini
BETA

Parte 2: Introduzione a Mpeg

Che cosa hanno in comune le trasmissioni televisive satellitari, i piccoli file video che è possibile scaricare via Internet, la battaglia delle grandi case discografiche contro la violazione del copyright in Rete? Una sigla, Mpeg che indica il più utilizzato standard di codifica audiovideo al mondo.
 
Mpeg

Il Moving Picture Experts Group che dà il nome alla sigla Mpeg è statoLeonardo Chiariglione fondato nel 1988 per iniziativa di Leonardo Chiariglione, ingegnere, dello CSELT di Torino (Centro Studi e Laboratori Telecomunicazioni di Telecom Italia). Questo gruppo di esperti ha definito vari standard che permettono di trasmettere immagini video e suoni in forma digitale con un formato compresso utilizzando meno banda rispetto ai sistemi analogici.
Nell'ambito dell'ISO, l'Organizzazione Internazionale per la Standardizzazione, l'Mpeg si è occupato dello sviluppo di nuovi standard di codifica di suoni e immagini in movimento. Mpeg, come già stato detto, è un acronimo, ma la denominazione ufficiale del gruppo all'interno della gerarchia è:

ISO/IEC JTC1 SC29 WG11
dove le varie sigle stanno per:

   ISO:  International Organization for Standardization
   IEC:  International Electrotechnical Commission
   JTC1: Joint Technical Committee 1
   SC29: Sub-committee 29
   WG11: Working Group 11  (moving pictures and audio)

Il gruppo di lavoro Mpeg si incontra circa 4 volte all'anno per una durata di sessione di una settimana. Durante gli intervalli tra un incontro e l'altro, una grande mole di lavoro viene svolta separatamente dai membri e ai meeting il lavoro viene organizzato e pianificato per il futuro.

Fin dall'inizio il lavoro dell'Mpeg si è sviluppato in tre direzioni distinte definite attraverso tre sigle numeriche, Mpeg 1, 2, 3. Ciascuna delle sigle indicava un diverso standard corrispondente a una diversa velocità di trasferimento.
In particolare, si vuole definire la sintassi del flusso di bit compressi, che implicitamente definisce un decompressore. Diversamente, Mpeg non specifica dettagliatamente gli algoritmi, ma lascia una certa libertà ai produttori individuali ed è proprio questa formula che colloca Mpeg come consorzio molto dinamico e innovativo.
 
 

Mpeg 1

Mpeg1

Mpeg 1 è il primo standard di codifica digitale elaborato dal gruppo. Il suo ambito di applicazione è essenzialmente quello dei dischi contenenti informazione video da riprodurre in locale. Questo formato definisce il flusso di bit per audio e video compressi in modo ottimale tale da riempire una larghezza di banda di 1.5 Mbit/s.
Questo valore è stato scelto opportunamente, poichè è il data rate dei CD audio e dei nastri DAT. Lo standard è suddiviso in 3 parti, video, audio e systems, dove systems sta per l'integrazione tra i flussi di dati audio e video, grazie ad un'opportuna etichettatura che permette la sincronizzazione dei due flussi. Mpeg è già entrato nella fase 2, il cui compito è di definire uno stream per l'audio e il video dai 3 ai 10 Mbits/s. Grazie alla parte audio di questo standard è stato creato il  formato file  MP3 che per la sua versatilità e facilità di trasferimento ha messo in crisi l'intera normativa sul copyright musicale.
 
 

Mpeg 2

Con Mpeg 2 (che ha poi incluso anche lo standard successivo Mpeg3) si voleva rendere disponibile la codifica digitale per un trasferimento a distanza aggiungendo anche alcune funzioni nuove come il trasferimento in parallelo di più canali audio o lo zapping tra diversi flussi video. Mpeg2 è lo standard più utilizzato al mondo per la trasmissione televisiva via satellite. Nel 1995 il centro CSELT di Telecom Italia è stato il primo istituto al mondo a dimostrare la capacità dell'Mpeg 2 di trasferire a distanza informazioni audiovideo ad alta qualità.
 

Mpeg 4

Mpeg4
La nuova sfida dell'interattività che le possibilità di Internet hanno portato in primo piano è stata raccolta da Mpeg4 (gli obiettivi di Mpeg 3 sono stato raggiunti da semplici modifiche dello stesso Mpeg2). Questo nuovo standard, disponibile dal 1997, sconvolge il concetto classico di audiovisivo, perchè più che trasferire una serie di quadri successivi si occupa di codificare degli oggetti audiovisuali definendo per ciascuno di questi il suo comportamento. Ogni oggetto può essere composto tanto da immagini di sintesi quanto da immagini tradizionali ma quello che più conta è che essendo una struttura di cui è descritto il comportamento esso può diventare oggetto di interazioni.
Per fare un esempio più che codificare una successione di immagini che descrivono il comportamento di una persona all'interno di una stanza, Mpeg4 codifica l'intera stanza e l'intera azione della persona al suo interno rendendo così possibile all'utente di scegliere il proprio punto di visuale o decidere della presenza o assenza di certi elementi. Il grado di interattività deve venire di volta in volta definito.
 

I prossimi Mpeg: Mpeg7

Da Mpeg4 si passerà poi al futuribile Mpeg7 in cui gli elementi di ricerca e le possibilità di interazione aumenteranno grazie ad un sistema di classificazione dell'immagine molto complesso. Mpeg7 sarà uno standard per la ricerca, l'archiviazione, la manipolazione e il processo di informazioni multimediali. Per capire esattamente di cosa si tratti dovremo aspettare la sua data di uscita prevista per il luglio del 2001.
 

Come Mpeg-1 riesce a comprimere...



Ora si elencheranno le tipiche condizioni statistiche che permettono a Mpeg, tramite opportune specifiche sintattiche e semantiche, di ottenere buoni risultati di compressione:

  1. trasformazione da RGB o Pal a Yuv
  2. divisione in bande (slices)
  3. divisione delle bande in macroblocchi
  4. divisione in blocchi 8x8
  5. relazione spaziale: codifica di trasformazione con la DCT a 8x8 pixel
  6. risposta della vista umana: minore acuità alle alte frequenze spaziali, ovvero quantizzazione scalare degradata dei coefficienti della DCT
  7. correlazione tra ampie aree dell'immagine: predizione dei coefficienti della DCT in blocchi 8x8.
  8. elementi statisticamente più presenti codificati: codifica a lunghezza variable (RLE) .
  9. Ridondanza temporale: tipo di macroblocco e vettori di movimento forward, backward e granularità di macroblocco
  10. predizione dei vettori di movimento
  11. predizione temporale in avanti e all'indietro nelle immagini di tipo B.
  12. Attività di movimento limitato nelle immagini di tipo P: macroblocchi saltati, quando il vettore di movimento ha nulle entrambe le componenti direzionali e l'errore di predizione di quantizzazione è nullo. I macroblocchi saltati sono l'elemento più desiderabile nel bitstream, poichè non consumano bit, a parte un leggero incremento di bit nel successivo macroblocco che non viene saltato
  13. Movimento coplanare in immagini di tipo B: macroblocchi saltati, quando il vettore di movimento è lo stesso dei macroblocchi precedenti e l'errore di predizione è assente.

Trasmissione Audio/Video: problematiche centrali

Trasmettere sequenze o in generale filmati audio/video su una rete affinchè possano fruirne un grande numero di persone va incontro ai seguenti problemi:
  • Grande quantità di dati

  • La quantità di dati da trasmettere per un filmato è imponente.
  • Ingombro delle linee di comunicazione

  • La trasmissione di filmati su reti locali o reti a vasta scala occuperebbe praticamente tutta la banda a disposizione, rendendo impossibile la comunicazione per servizi meno pesanti e limitando significativamente il numero di utenti che scambiano filmati video.
  • Indisponibilità sul mercato di supporti veloci di immagazinamento

  • La fruizione in locale di filmati audio/video preregistrati su CD-rom, nastri o dischi magnetici, è problematica all'interno di un personal computer.
  • Compromesso di qualità scadente

  • Varie soluzioni di compromesso sono state proposte nell'ultimo decennio.

Le specifiche tecniche dello standard Mpeg

Il comitato Mpeg ha concluso, alla fine del 1991, il "Committee Draft of Phase I'', comunemente chiamato MPEG I, che stabilisce la struttura di un bit stream per audio e video digitali compressi che rientri all'interno del data rate di 1,5 Mbit/sec. Pertanto un segnale conforme allo standard MPEG I puo' essere memorizzato sugli attuali dispositivi ed essere trasmesso attraverso le attuali reti di trasmissione digitale, sia locali che geografiche.

Le tecniche che vengono utilizzate per la compressione, come vedremo di seguito - Decimazione dei canali di crominanza, Trasformata discreta coseno, Quantizzazione dei coefficienti e Compressione di Huffman - derivano in gran parte da quelle proposte dallo standard JPEG (Joint Photographics Expert Group) per la compressione di immagini fisse. Tale standard, per i buoni risultati di compressione che si riescono ad ottenere con immagini a colori o in toni di grigio, e' molto diffuso nella comunita' scientifica ed utilizzato in molte apparecchiature nei campi della fotografia ed elaborazione delle immagini.

Il segnale in ingresso per lo standard MPEG I, chiamato SIF (Source Interface Format), equivale ad un segnale CCIR-601 (quello dello standard televisivo NTSC) diviso con rapporto 2:1 in orizzontale, 2:1 lungo l'asse dei tempi ed ancora 2:1 lungo l'asse verticale dei due canali di crominanza. Qualche linea viene ulteriormente eliminata per fare in modo che le dimensioni dell'immagine siano multiple di 8 e 16 e semplificare così i calcoli successivi. Questo ci porta ad una risoluzione per il formato SIF di 352x240 punti a 30 fotogrammi al secondo, se prendiamo in considerazione il formato NTSC.

Lo standard prevede l'utilizzo di alcune sofisticate tecniche per eliminare la ridondanza dei dati in ingresso e diminuire quindi il bit rate di almeno un fattore 20.
 

MPEG (1/x)

MPEG (4/x)

Collegamento d'articolo
Parte 1 | Parte 2 | Parte 3 | Parte 4 | Parte 5

Parte 3 - Algoritmo di codifica


Andrea Lubrano, Fabrizio Gargano e Luciano Giustini hanno collaborato insieme per la stesura di una tesina sui codici di compressione MPEG per il corso di laurea in Ingegneria Informatica all'Università di Roma Tre, docente prof.ssa G. Murciano. La tesina è stata progettata in funzione della pubblicazione su Web ed è stata quindi prodotta fin da subito in formato HTML. Coloro i quali fossero interessati ad una versione stampabile e più ''leggera'' della stessa possono richiederla all'indirizzo info@beta.it. Per i lettori abbonati le due versioni sono disponibili all'indirizzo BETA http://subs.betamag.com

Copyright © 1999 Andrea Lubrano, Fabrizio Gargano, Luciano Giustini, tutti i diritti sono riservati. Questo Articolo di BETA, insieme alla Rivista, è distribuito secondo i termini e le condizioni della Licenza Pubblica Beta, come specificato nel file LPB.


BETA 2299.5: Sommario | Indice del Numero | Redazione | Liste/Forum | Informazioni | Licenza Pubbl. Beta | Mirror ufficiali | Abbonati a BETA | Internet ID | Guida | Cerca | Stampa


Beta.it (http://www.beta.it)email info@beta.it
Barra Sito Beta.it

indice sito | mappa | contattaci | newsletter | pubbl./ad info | abbonamento | informazioni | shopping

Copyright © 1994-1999 BETA, tutti i diritti sono riservati - http://www.beta.it

Sommario Abbonamenti a BETA Redazione Liste/Forum Informazioni Indice del Numero Mirror ufficiali Beta Home Page Beta Home Page english Beta News BETA Rivista Articoli BETA Beta Edit, pubblicazioni Beta Logo, premi Beta Lpb, Licenza Pubblica e Articoli Lpb Beta Navigatore Beta Online Beta Library Beta Info Gruppo Beta BETA La rivista ipertestuale tecnica Collegamento al sito Web