Compresiones en los formatos de video digital

Temas:

1.-Principios básicos

2.-Tipos de compresiones

3.-Cómo actúan

4.-El factor de compresión

5.-Comentarios

6.-Concatenación de compresiones


Como ya hemos visto en el apartado Digital?, una secuencia de video en tiempo real ocupa mucha cantidad de información y aparatos muy especializados para poder manejarla, y nos encontramos con un dilema: dejamos el mundo digital restringido a unos pocos elegidos que puedan pagar los costosos equipos o buscamos soluciones para que sea asequible: la solución es obvia: Video Digital para todos !!!

Pues a trabajar: Qué podemos hacer para rebajar esta cantidad de datos?

Y recurrimos a lo de siempre: el ojo. Estudiamos el ojo humano para saber qué es lo que menos aprecia, qué es lo que se le escapa. Descubrimos que la luminancia es lo que mejor le va, detecta sútiles cambios en la luminancia y en cambio para la crominancia tiene más tolerancia, es decir: no se entera si le das menos calidad de colorimetría.

Pues ya está, por una parte nos cargamos parte de la señal de crominancia y por otra lo que haremos es quitar toda la información redundante, es decir, la que se repite y es una tontería grabar dos veces.

A todo esto le sumaremos compresiones espaciales y ya tenemos video digital para todos.

Hasta aquí lo básico, ahora entraremos en detalles de qué tipos de compresiones tenemos y cómo se aplican.

Primero hay que distinguir entre tipos de compresiones:

Por una parte las podemos clasificar en destructivas y no destructivas

Por otra parte en fijas y variables.

y por otra parte en intraframes y temporales.

Estas características son combinables entre sí, así podemos tener una compresión destructiva, fija y temporal.

Destructivas: Las que en el proceso pierden parte de los datos de la señal original. Así, es imposible restaurar la primera señal, siempre se pierden datos. Todas las que usaremos en video son de este tipo.

No destructivas: también llamadas dinámicas, son las que si pueden comprimir comprimen y si no pueden, antes de perder calidad, no comprimen. Esta compresión no la podremos usar en video porque no nos garantiza un flujo de datos estable por lo que a partir de ahora nos olvidaremos de este tipo. Un ejemplo: es la que usa el programa WinZip, si lo habéis usado veréis que algunas veces comprime mucho y otras casi nada, pero al descomprimir siempre nos devuelve el formato original.

LLega el momento de aprender un término muy importante: Bit Rate o Flujo de Datos. Es la cantidad de información que maneja un sistema por segundo, pero sin picos ni bajadas, que pueda mantener esa cantidad de datos por segundo sin una sola bajada. Esto es muy importante, ya que lo que pretendemos con una compresión es que pueda ser usada por un sistema (un Disco Duro...) que sólo puede mover -por ejemplo- 15 Mb por segundo, entonces usaríamos un bit rate de 10 Mb para dejar un margen y asegurarnos que no fallará. Es muy importante porque este factor es el que nos garantizará que veamos la imagen en tiempo real, sin ningún tirón ni paradas de las que tanto molestan.

Fijas: Son las que durante todo el tiempo mantienen el mismo bit rate, la mayoría de las que usaremos en video son fijas

Variables: Son las que pueden ir cambiando el bit rate, a este tipo pertenece una variante del MPEG2 que se usa en el DVD.


Explicación: MPEG ó MJPEG es la comisión de expertos -Motion Join Pictures Experts Group- encargada de estudiar fórmulas de compresión en la imagen en movimiento derivados de las compresiones fijas de tipo JPEG -Join Pictures Expert Group-.

Intra-frames: Son las que se aplican sólo a cada frame por separado, de manera que todos los frames tienen almacenada la información de la imagen, a este apartado corresponden los sistemas BETACAM DIGITAL y toda la família DV entre otros y últimamente las variantes de MPEG-2 y 4 usadas para IMX y HD.

Temporales o Inter-Frames: Son las que necesitan de toda una secuancia de información para reconstruir una imagen, ya que sólo graban la imagen en sí en un frame y el resto son predicciones y ecuaciones matemáticas. Estas son las usadas en el Betacam SX, en el DVD y en las retransmisiones de difusión final de cable y satélite.

Después de conocer los tipos de compresión, vayamos a saber cómo comprimen.

Primero, lo que haremos es separar la imagen en grupos de 8x8 pixels y le llamaremos bloque, dentro de él buscaremos similitudes y mediante el uso de algoritmos matemáticos descartaremos los datos que se repitan, luego haremos lo mismo con macrobloques (16x16 pixels). Esta es la operativa explicada de una manera bastante simple de la compresión DCT (Discreet Cosinus Transform) y es la base de todas las compresiones, aunque después se les añadan procesos, todas usan como primer paso de su compresión este procedimiento y cuando llamamos DCT a un sistema, es que sólo aplica esta compresión.

Esta es la usada en el BETACAM DIGITAL y en el DV.

Un paso más será la compresión temporal; cogemos un Grupo De Imágenes (en inglés Group Of Pictures, GOP) o sequencia de X frames (podemos asignarle la duración que queramos) y nos olvidamos de los frames como lo entendemos hasta ahora (sucesión de imágenes), pasaremos a llamarles frames-I, frames-B y frames-P.

Los frames-I son los únicos que llevan grabada la información de la imagen, sería como un frame de sistema DCT.

Los demás frames (frames-B y frames-P) no contienen imagen alguna, sino que únicamente contienen algoritmos y fórmulas matemáticas, predicciones de movimientos y cambios hechas en relación al último frame-I y a sus antecesores y sucesores frames-B y frames-P.

Esta es la compresión usada en todos los sistemas de tipo MPG y BETACAM SX entre otros


Un término importante en el mundo de las compresiones es el factor de compresión.

Cuando decimos que una compresión es 2:1 estamos diciendo que del total de la información (1) estamos comprimiendo de manera tal que nos queda la mitad de datos (1/2), y si es 9:1 es que estamos reduciendo el bit rate nueve veces con lo que sólo usaremos una novena parte de lo que necesitaríamos para manejar imagen sin compresión.

Hay que comentar que si bien por norma general una mayor compresión implica menor calidad, no siempre es así, también depende mucho de la calidad y acierto de los codecs (o fórmulas matemáticas) empleados en la compresión, así el Betacam SX usa un factor de compresión más elevado que los basados en DV y sin embargo tiene más calidad, y que el sistema BETACAM DIGITAL, aún teniendo una compresión de 2:1 se le considera un sistema casi transparente, o sea, que la pérdida es insignificante y por ello se ha convertido en el standard de video digital de alta calidad para no tener que recurrir a los D1 por su aparatosidad y precio.

También comentar que si una señal está comprimida 2:1 no quiere decir que tenga la mitad de calidad, si así fuera, es que no habríamos descubierto aún las compresiones, simplemente estaríamos recortando datos de la imagen o simplificándola.

Y es que lo que se pretende con las compresiones son tres cosas:

Abaratar procesos y costes reduciendo la cantidad de datos.

Engañar al ojo haciéndole creer que la imagen es perfecta.

E intentar que al descomprimir nos reconstruya la imagen lo más parecida posible al original.


Dicho esto vienen los comentarios

Nunca olvidemos que todas las compresiones que usaremos en video son destructivas, o sea, que en cada paso que hagamos habrá una pérdida de datos irrecuperable y que esta será mayor cuanto más bajo sea el sistema usado.

Que esta pérdida de datos normalmente no afecta al producto final si su intención es que lo vea el ojo humano, pero si lo que pretendemos es trabajar la imagen y sobre todo, hacer efectos complejos, manipulaciones de imagen, retoques de colorimetría o croma-keys, entonces la información necesaria para estos procesos no estará y se hará visible en forma de recortes pobres y de baja calidad o en artifacts (los drops del mundo digital).

Que ya nos podemos ir olvidando de los viejos sistemas de medición de señal (Señal/ruido, Db's...), éstos no nos sirven para una tecnología que nos ha irrumpido más rápidamente que sus propios elementos de control y medición (o es que a alguien no le interesa que sea medida la señal digital?), por lo que volvemos al instrumento de siempre, el "ojímetro", hay fallos de ratios en los ordenadores, hay pixelados, hay aliasings y escalonados, hay "rebordes", hay "cuadraditos", hay "desapariciones" de pequeños objetos, hay paletas de colores incompletas, hay efectos de blur o falta de definición, etc. Quién o qué mide esto?

Que más pronto o más tarde tendremos que aprender otro concepto: la concatenación.

Este es el efecto de encadenar compresiones. Un ejemplo: grabamos y ya efectuamos una primera compresión, lo entramos en un sistema de edición donde vamos a tener que descomprimir y comprimir varias veces el material para realizar efectos, encadenados, títulos, etc. cada paso es una pérdida de datos, luego lo pasaremos a una cinta para enviar a la cadena emisora (otra compresión), ésta lo descomprimirá para leerlo y lo meterá en su servidor de emisión con una compresión muy alta, y a la hora de emitir lo descomprimirá otra vez y para pasarlo al satélite o al cable o a la futura televisión terrestre digital le dará la mayor de las compresiones que podamos imaginar (para que le quepan más y más canales en el ancho de banda que tiene asignado) y el receptor final lo descomprimirá para mandar al televisor. Con lo que al final, lo que verá el receptor final en su casa, llevará del orden de 7 u 8 compresiones y otras tantas descompresiones. No habría problema si esto funcionase como la "ley del embudo" y que la calidad que diese la compresión mayor fuese la final, pero esto no va así; en cada compresión se pierden datos irrecuperables en la próxima descompresión y el nuevo paso de compresión comprimirá sobre unos datos ya inexistentes y así cada vez, con lo que lo que obtenemos el efecto "amplificador" o exponencial, en cada paso se van evidenciando mucho más los defectos. Así como el efecto de una compresión puede ser inapreciable, el impacto de esta sucesión puede ser fatal para la calidad de la imagen final.

Para evitar esto, tenemos que trabajar en sistemas que de entrada nos garanticen la máxima calidad posible (ratios de compresión no superiores a 2:1 para cinta y estaciones que manejen imagen sin compresión) e intentar evitar cadenas de compresiones.









Todos estos consejos no dejan de ser una opinión personal, siempre refutable, discutible y sobre los que estaría muy contento de recibir opiniones, consejos, críticas o cualquier comentario por mail.


Autor: Jaume Bordoy, 2002, 2004, 2006, todos los derechos reservados

Autorizo cualquier tipo de difusión, divulgación, distribución o comunicación de este artículo sin cargo alguno, de todo o de parte, siempre que se mencione el autor original y su procedencia (Jaume Bordoy, Mallorca, www.tilt.es), se me comunique el texto usado y su difusión ( mail ) , no sea con fines lucrativos y en el caso de parte/s se haga constar como tal (extracto, parte/s, resumen...).

El Autor:
Jaume Bordoy.

tilt@tilt.es

Home