Transcript Multimedia

Tema 4
Multimedia
Rogelio Montañana
Departamento de Informática
Universidad de Valencia
[email protected]
http://www.uv.es/~montanan/
Universidad de Valencia
Ampliación Redes 4-1
Rogelio Montañana
Concepto de red Multimedia
• Teóricamente:
– La red que transmite información utilizando
para ello más de un medio físico. Ejemplo:
documento con texto e imágenes
• Para nosotros:
– La red que transmite información de audio y/o
vídeo en tiempo real (aunque solo se utilice uno
de estos medios). Ejemplo: telefonía por
Internet
Universidad de Valencia
Ampliación Redes 4-2
Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógicodigital
• Audio digital. Estándares. Compresión
• Vídeo digital. Estándares. Compresión
• Protocolos RTP y RTCP
• Vídeoconferencia. Estándares H.32x
• Pasarelas e Interoperabilidad
• Vídeo bajo demanda
• Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-3
Rogelio Montañana
Teorema de Nyquist.
• Teorema de Nyquist: La digitalización de
una señal analógica ha de hacerse
muestreando al menos al doble de la
frecuencia máxima que se pretende
capturar.
– Canal telefónico: 3,1 KHz  Muestreo 8 KHz
– Audio HiFi: 20 KHz  Muestreo 44,1 KHz
Universidad de Valencia
Ampliación Redes 4-4
Rogelio Montañana
Teorema de Nyquist
Canal telefónico
Ancho de banda =
300 a 3.400 Hz
8.000 muestras/s
(captura hasta 4 KHz)
Muestras
Señal analógica
original
Universidad de Valencia
Ampliación Redes 4-5
Señal ‘muestreada’
a 8 KHz
Rogelio Montañana
Conversión analógico-digital
PCM (Pulse Code Modulation)
Ruido (o error) de cuantización
Digitalización
El error de
cuantización
depende del número
de bits por muestra.
Señal
‘muestreada’
(valores continuos)
100100111011001
Señal digital (valores discretos)
Universidad de Valencia
Ampliación Redes 4-6
Rogelio Montañana
Sumario
• Teorema de Nyquist. Conversión analógicodigital.
• Audio digital. Estándares. Compresión
• Vídeo digital. Estándares. Compresión
• Protocolos RTP y RTCP
• Vídeoconferencia. Estándares H.32x
• Pasarelas e Interoperabilidad
• Video bajo demanda
• Telefonía sobre Internet
Universidad de Valencia
Ampliación Redes 4-7
Rogelio Montañana
Audio digital no comprimido
Tipo
Frec. de Bits por Canales
muestreo muestra
Caudal
Sonido telefónico
(G.711)
8 KHz
8
1
64 Kb/s
(RDSI)
CD-DA (Compact
Disc – Digital Audio)
44,1 KHz
16
2
1,411 Mb/s
(CD-ROM 1x)
DAT (Digital Audio
Tape)
48 KHz
16
2
1,536 Mb/s
Universidad de Valencia
Ampliación Redes 4-8
Rogelio Montañana
Clasificación algoritmos de compresión
• Por su fidelidad:
– Sin pérdidas (lossless): usada para datos (ej.: norma V.42bis en
módems, ficheros .zip)
– Con pérdidas (lossy): usada normalmente en audio y vídeo.
Inaceptable para datos
• Por su velocidad relativa de compresión/descompresión:
– Simétricos: necesitan aproximadamente la misma potencia de CPU
para comprimir que para descomprimir
– Asimétricos: requieren bastante más CPU para comprimir que para
descomprimir.
• En multimedia se suelen utilizar algoritmos lossy
• Siempre se necesita más CPU para comprimir que para
descomprimir
• Generalmente los algoritmos que consiguen mayor compresión
gastan más CPU.
Universidad de Valencia
Ampliación Redes 4-9
Rogelio Montañana
Tipos de compresión de audio
• General (apta para todo tipo de sonidos):
– Psicoacústica (MPEG)
– Adaptativa Diferencial (ADPCM)
• Específica para voz:
– Code Excited Linear Prediction (CELP)
– CS-ACELP (Conjugate-Structure Algebraic Code
Excited Linear Prediction
– GSM
• Los codecs de voz no son aptos para música u
otros sonidos
Universidad de Valencia
Ampliación Redes 4-10
Rogelio Montañana
Algunos formatos de audio digital
Bajo
Retardo
Elevado
retardo
Formato
Frec. Muestreo
(KHz)
Canales
Caudal por canal
(Kb/s)
Uso
PCM (G.711)
8
1
64
Telefonía
ADPCM (G.721)
8
1
32
Telefonía
SB-ADPCM (G.722)
16
1
48/56/64
Vídeoconferenc.
MP-MLQ (G.723.1)
8
1
6,3/5,3 variable
Telefonía Internet
ADPCM (G.726)
8
1
16/24/32/40
Telefonía
E-ADPCM (G.727)
8
1
16/24/32/40
Telefonía
LD-CELP (G.728)
8
1
16
Telefonía/Videoc.
CS-ACELP (G.729)
8
1
8
Telefonía Internet
RPE-LTP (GSM 06.10)
8
1
13,2
Telefonía GSM
CELP (FS 1016)
8
1
4,8
LPC-10E (FS 1015)
8
1
2,4
CD-DA / DAT
44,1/48
2
705,6/768
MPEG-1 Layer I
32/44,1/48
2
192-256 variable
MPEG-1 Layer II
32/44,1/48
2
96-128 variable
MPEG-1 Layer III (MP3)
32/44,1/48
2
64 variable
Hi-Fi Internet
MPEG-2 AAC
32/44,1/48
5.1
32-44 variable
Hi-Fi Internet
Universidad de Valencia
Ampliación Redes 4-11
Audio Hi-Fi
Rogelio Montañana
Audio digital comprimido
• Generalmente a más compresión menor calidad y mayor
consumo de CPU.
• Los sistemas de caudal variable (MPEG, G.723.1) son los
que mejor se adaptan a redes sin reserva de caudal
constante, como el modelo DiffServ de Internet o los
servicios UBR o ABR de ATM.
• Los sistemas de caudal constante (G.711, G.722, G.729)
son más adecuados para servicios orientados a conexión
(RSVP o circuitos CBR de ATM, por ejemplo).
• La compresión MPEG es la más eficiente y da mayor
calidad, pero consume mucha CPU e introduce mucho
retardo por lo que no puede emplearse en aplicaciones
interactivas (vídeoconferencia o telefonía).
Universidad de Valencia
Ampliación Redes 4-12
Rogelio Montañana
Comparación de codecs
Fuente
Simulación
de canal
Limitación
Codec
‘X’
1
2
3
4
5
1
2
3
4
5
“El tren es un medio de transporte cómodo.”
MOS
Calidad voz
Nivel de distorsión
5
Excelente
Imperceptible
4
Buena
Apenas Perceptible, no desagradable
3
Regular
Perceptible, levemente desagradable
2
Pobre
Desagradable, pero aceptable
1
Insatisfactoria
Muy desagradable. Inaceptable
MOS: Mean Opinion Score
MOS de 4.2 = Calidad óptima
Universidad de Valencia
Ampliación Redes 4-13
Rogelio Montañana
Compresión vs calidad
PCM (G.711)
Caudal (Kb/s)
64
56
48
40
ADPCM 32 (G.726)
32
ADPCM 24 (G.725)
24
ADPCM 16 (G.726)
16
8
CS-ACELP (G.729a)
LPC 4.8
LDCELP 16 (G.728)
CS-ACELP 8 (G.729)
MP-MLQ 6,4 (G.723.1)
Normalmente requieren
hardware especial
0
0
1
2
3
4
5
MOS (Mean Opinion Score) Calidad Subjetiva
Universidad de Valencia
Ampliación Redes 4-14
Rogelio Montañana
Codec de alta compresión optimizado
para la voz humana
Estos codecs no son
aptos para música
Universidad de Valencia
Ampliación Redes 4-15
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-16
Rogelio Montañana
Señal de vídeo analógica
R (rojo)
G (verde)
B (azul)
Escaneador
rasterizador
Filtros
Divisor
R
Lente
La imagen capturada se
descompone en tres señales
que corresponden a los
colores primarios
amplitud
tiempo
G
B
amplitud
amplitud
tiempo
tiempo
Universidad de Valencia
Ampliación Redes 4-17
Rogelio Montañana
Fundamentos de TV en color
• Las señales R-G-B se transforman en una señal de luminancia
(Y) y dos de crominancia. Esta conversión se hace para:
– Mantener compatibilidad con televisión B/N (se ignora la crominancia)
– Dar mas ancho de banda a la luminancia (el ojo es menos sensible a la
crominancia).
• En sistema PAL las señales de crominancia se llaman U y V; la
transformación que se realiza es:
 Y (Luminancia) = 0,30 R + 0,59 G + 0,14 B
 U (Crominancia) = 0,493 (B - Y) = -0,15 R - 0,29 G + 0,44 B
 V (Crominancia) = 0,877 (R - Y) = 0,62 R - 0,52 G - 0,10 B
• Anchura de los canales:
 Y: 5 MHz
 U y V: 1 MHz
Universidad de Valencia
Ampliación Redes 4-18
Rogelio Montañana
Funcionamiento de la TV en color
Matriz
Inversa
R
G
B
TV Color
Y
R
G
B
Circuito
Matricial
U
V
Modulador
Mezclador
Modulador
Filtro
Y
TV Blanco y Negro
Universidad de Valencia
Ampliación Redes 4-19
Rogelio Montañana
Señales de vídeo analógico
• A menudo las dos componentes de crominancia (U y V) se combinan
(multiplexan en frecuencia) en una única señal llamada C.
• En equipos sencillos (p. ej. vídeo VHS) se combinan Y y C en una única
señal que se llama composite o vídeo compuesto.
• Conforme se reduce el número de señales disminuye la calidad
(especialmente en el paso de Y/C a vídeo compuesto).
Num. Denominación
Señales
(PAL)
Tipo de
conector
Tipo de
equipo
Calidad
3
YUV
(componentes)
3 RCA o
3 BNC
Equipos
profesionales
Estudio
2
Y/C
S-Vídeo
(mini-DIN)
Vídeo Hi-8,
S-VHS
Broadcast
1
Compuesto
(composite)
RCA
Vídeo 8 mm,
VHS
Vídeo
doméstico
Universidad de Valencia
Ampliación Redes 4-20
Rogelio Montañana
Vídeo digital ‘no comprimido’
• El formato de grabación utilizado como referencia en estudios
de TV es el D1 (estándar ITU-R CCIR-601).
• En formato digital las dos componentes de crominancia se
denominan Cr y Cb (en vez de U y V).
• Cada fotograma se representa como una imagen de 720x576
píxels (PAL). La luminancia se digitaliza con mayor resolución
que las crominancias:
– Luminancia (Y): 720(h) x 576(v) x 8 bits x 25 fps = 82,944 Mb/s
– Crominancia Cr : 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s
– Crominancia Cb: 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s
• Caudal total: 82,9 + 41,5 + 41,5 = 165,888 Mb/s
Universidad de Valencia
Ampliación Redes 4-21
Rogelio Montañana
Vídeo digital ‘no comprimido’
• La reducción de la resolución en las componentes de
crominancia se denomina submuestreo (subsampling).
• El submuestreo se basa en la menor sensibilidad del ojo
humano a la crominancia.
• El submuestreo 4:2:2 de CCIR-601 reduce la información de
crominancia a la mitad (sin submuestreo el caudal total sería
248,7 Mb/s).
• La información de crominancia puede reducirse aún más (a la
cuarta parte) aplicando submuestreo 4:1:1 o 4:2:0. Este
submuestreo degrada un poco la calidad de color, pero la
diferencia con 4:2:2 es pequeña y sólo suele ser percibida por
profesionales o en situaciones extremas.
Universidad de Valencia
Ampliación Redes 4-22
Rogelio Montañana
Submuestreo 4:2:2
720
720
360
576
8 bits
576
576
R
Y
G
B
Cr
Cb
Luminancia 4
Crominancia 2+2
Universidad de Valencia
Ampliación Redes 4-23
Rogelio Montañana
Submuestreo 4:1:1
720
720
180
576
576
576
R
Y
G
B
Cr
Cb
Luminancia 4
Crominancia 1+1
Universidad de Valencia
Ampliación Redes 4-24
Rogelio Montañana
Submuestreo 4:2:0
720
720
360
576
576
288
Cr
R
Y
G
Cb
B
Luminancia 4
Crominancia 2+0
Universidad de Valencia
Ampliación Redes 4-25
Rogelio Montañana
Sistemas de grabación de vídeo
digital para TV estándar (no HDTV)
Sistema
Submuestreo Bits/pixel
Compresión
Mb/s
D5
4:2:2
10
1:1
220
D1 (ITU CCIR 601)
4:2:2
8
1:1
172
Digital Betacam (Sony)
4:2:2
10
2,3:1 (*)
95
AMPEX DCT
4:2:2
8
2:1 (*)
88
Digital-S, D-9,
DVCPRO50
4:2:2
8
3,3:1 (*)
50
DV, DVCAM,
DVCPRO, D-7
4:1:1 ó 4:2:0
8
5:1 (*)
25
D2, D3
Composite
8
1:1
94
(*)
Compresión espacial (intraframe) con algoritmos muy parecidos a los de M-JPEG.
Universidad de Valencia
Ampliación Redes 4-26
Rogelio Montañana
Compresión de vídeo en tiempo real
La compresión
introduce retardo
Señal YUV, Y/C o
Composite
Cámara de
TV o vídeo
Almacenamiento
Digitalizador
CODEC
Hard o soft
Vídeo digital
comprimido
Vídeo digital
sin comprimir
Vídeo
analógico
Monitor
Estación digitalizadora
(PC/Mac/Workstation)
Red local
(o WAN)
CODEC: COmpresor/DECompresor
Universidad de Valencia
Ampliación Redes 4-27
Rogelio Montañana
Compresión de vídeo en diferido
Señal YUV, Y/C o
Composite
Cámara de
TV o vídeo
Almacenamiento
Almacenamiento
CODEC
Soft
Digitalizador
Vídeo digital
sin comprimir
Vídeo
analógico
Monitor
Vídeo digital
comprimido
Estación digitalizadora
(PC/Mac/Workstation)
Red local
(o WAN)
CODEC: COmpresor/DECompresor
Universidad de Valencia
Ampliación Redes 4-28
Rogelio Montañana
Compresión de vídeo
• Para la compresión de vídeo se aplican dos
técnicas:
– Compresión espacial o intraframe: se aprovecha la
redundancia de información que hay en la imagen de
cada fotograma, como en la imágenes JPEG
– Compresión temporal o interframe: se aprovecha la
redundancia de información que hay entre fotogramas
consecutivos.
• La compresión interframe siempre lleva incluida
la intraframe.
Universidad de Valencia
Ampliación Redes 4-29
Rogelio Montañana
Formatos compresión de vídeo
Sistema
Compresión
Espacial (DCT)
Compresión
temporal
M-JPEG
Sí
No
Media
Baja
Muy
pequeño
H.261
Sí
Limitada
(fotog. I y P)
Elevada
Media
Pequeño
MPEG-1/2
Sí
Extensa
(fotog. I, P y B)
Muy elevada
Alta
Grande
H.263
MPEG-4
Sí
Extensa
(fotog. I, P y B)
Enorme
Alta
Media
Grande
Universidad de Valencia
Complejidad Eficiencia Retardo
compresión
Ampliación Redes 4-30
Rogelio Montañana
Caudal requerido por los sistemas de
compresión de vídeo más comunes
Bajo
retardo
Elevado
retardo
Universidad de Valencia
Estándar/Formato
Ancho de banda
típico
Ratio de
compresión
CCIR 601
170 Mb/s
1:1 (Referencia)
M-JPEG
10-20 Mb/s
7-27:1
H.261
64 Kb/s – 2000 Kb/s
24:1
H.263
28,8-768 Kb/s
50:1
MPEG-1
0,4-2,0 Mb/s
100:1
MPEG-2
1,5-60 Mb/s
30-100:1
MPEG-4
28,8-500 Kb/s
100-200:1
Ampliación Redes 4-31
Rogelio Montañana
Vídeo M-JPEG (Motion JPEG)
• Es el más sencillo. Trata el vídeo como una secuencia de
fotografías JPEG, sin aprovechar la redundancia entre
fotogramas.
• Algoritmos DCT (Discrete Cosine Transform)
• Poco eficiente, pero bajo retardo.
• Usado en:
– Algunos sistemas de grabación digital y de edición no
lineal (edición independiente de cada fotograma)
– Algunos sistemas de videoconferencia (bajo retardo).
• No incluye soporte estándar de audio. El audio ha de
codificarse por algún otro sistema (p. Ej. CD-DA) y
sincronizarse por mecanismos no estándar.
Universidad de Valencia
Ampliación Redes 4-32
Rogelio Montañana
Funcionamiento de MPEG
Compresión espacial
y temporal
Fotogramas
digitalizados
Compresor MPEG
(software o hardware)
La compresión puede o no ser en tiempo real.
Generalmente para hacerla en tiempo real
se requieren compresores en hardware
Universidad de Valencia
Ampliación Redes 4-33
Flujo MPEG
comprimido
Rogelio Montañana
Vídeo MPEG (MPEG-1)
• Submuestreo 4:2:0 (25% ahorro respecto 4:2:2)
• Dos formatos posibles:
– SIF (Standard Interchange Format): en PAL Y:
352 x 288 pixels, Cr y Cb: 176 x 144 pixels
– QSIF (Quarter SIF): Y: 176 x 144; Cr y Cb : 88
x 72
• Dos tipos de compresión (simultáneamente):
– Espacial: como en JPEG
– Temporal: se aprovecha la semejanza que cada
fotograma tiene con los que le rodean.
Universidad de Valencia
Ampliación Redes 4-34
Rogelio Montañana
Compresión temporal en MPEG
• El primer fotograma se digitaliza como una imagen JPEG
• De los siguientes fotogramas sólo se se digitalizan los
cambios respecto al anterior. Para localizar los cambios:
– Se ‘cuadricula’ la imagen en macrobloques, cada uno
formado por 16x16 pixels de Y (8x8 de Cr y 8x8 de Cb)
– Si se detecta que un macrobloque ha cambiado de sitio
esto se indica mediante un vector de movimiento.
• Una imagen SIF (352x288) está formada por:
352/16 x 288/16 = 22 x 18 = 396 macrobloques
Universidad de Valencia
Ampliación Redes 4-35
Rogelio Montañana
Vídeo MPEG
• Tipos de fotogramas:
– I (Intra): autocontenidos, solo compresión espacial (como JPEG)
– P (Predictive): referido al P/I anterior. Compresión temporal por
extrapolación mediante macrobloques. Un macrobloque pueden ser:
• Inalterado: no modificado respecto al fotograma de referencia
• Desplazado: (p. ej. un balón en movimiento) se describe por un
vector de movimiento y eventualmente una corrección
(diferencia respecto al original)
• Nuevo: (p. ej. Lo que aparece detrás de una puerta que se abre)
se describe por compresión espacial (como un fotograma I)
– B (Bidireccional): compresión temporal con interpolación; referido
al P/I anterior y al P/I posterior. Máxima compresión, máxima
complejidad de cálculo. Suaviza la imagen, reduce el ruido.
Universidad de Valencia
Ampliación Redes 4-36
Rogelio Montañana
Fotogramas I (Intra)
Los fotogramas Intra se codifican
de forma autocontenida, sin
referirse a otros fotogramas
18 KBytes
18 KBytes
18 KBytes
18 KBytes I
18 KBytes
I
I
I
I
72 x 1024 x 8 / 0,16 = 3,7 Mb/s
Universidad de Valencia
Ampliación Redes 4-37
25 fotogramas
por segundo
Rogelio Montañana
Fotogramas P (Predictivos)
Los fotogramas Predictivos
se codifican usando
compensación de
movimiento basada en el
fotograma I o P anterior
18 KB
6 KB P
6 KB
18 KB
6 KB
6 KB
18 KB
I
P
I
P
P
I
60 x 1024 x 8 / 0,24 = 2,0 Mb/s
Universidad de Valencia
Ampliación Redes 4-38
Rogelio Montañana
Fotogramas B (Bidireccionales)
Los fotogramas Bidireccionales
se codifican usando
compensación de movimiento
basada en el I o P mas próximo
anterior y posterior
4 KB
4 KB
6 KB
4 KB
Valores
orientativos
4 KB
6 KB
4 KB
4 KB
18 KB
18 KB
I
B
B
P
B
B
10
P
9
B
8
B
7
I
6
5
4
3
2
1
54 x 1024 x 8 / 0,36 = 1,2Mb/s
Orden de transmisión: 1,4,2,3,7,5,6,10,8,9,…
Universidad de Valencia
Ampliación Redes 4-39
Rogelio Montañana
Comparación fotogramas P y B
Vector de movimiento
fotograma P
I__P
I
0 ms
P
40 ms
80 ms
P
P
120 ms
IPPP
I
0 ms
P
40 ms
120 ms
Vector de desviación fotograma B
IBBP
I
0 ms
Universidad de Valencia
80 ms
B
40 ms
Ampliación Redes 4-40
B
80 ms
P
120 ms
Rogelio Montañana
Fotogramas MPEG I, P y B
Vector de movimiento
Macrobloque
16X16 Pixels
Fotograma n
Fotograma n+1
Predicción Bidireccional
Área de búsqueda
I
B
0
B
P
2
1
B
3
B
4
I
5
B
0
P
B
1
2
3
Grupo de fotogramas
Universidad de Valencia
Ampliación Redes 4-41
Rogelio Montañana
Vídeo MPEG-1
• Secuencia típica (360 ms): I1 B2 B3 P4 B5 B6 P7 B8 B9 I10
• Orden codif/decodificación: I1 P4 B2 B3 P7 B5 B6 I10 B8 B9
• Tamaño típico de fotogramas (SIF, 352 x 288):
–
–
–
–
–
I: 18 KBytes
P: 6 KBytes
B: 4 KBytes
Caudal medio (IBBPBBPBBI): 1,2 Mbps
Con QSIF el caudal se reduce a 300 Kbps
• Latencia de compresión (valores típicos):
–
–
–
–
M-JPEG:
MPEG fotogramas I:
MPEG fotogramas I y P:
MPEG Fotogramas I, P y B:
Universidad de Valencia
Ampliación Redes 4-42
45 ms
200 - 400 ms
200 - 500 ms
400 - 850 ms
Rogelio Montañana
Caudal de una vídeoconferencia
Caudal medio: 384 Kb/s
Resolución: 352 x 288 (CIF)
Velocidad de refresco: 30 fps
Caudal
instantáneo
Fotograma I
Fotograma I
600 Kb/s
300 Kb/s
Fotogramas P y B
Tiempo
0 Kb/s
0 ms
Universidad de Valencia
100 ms
200 ms
Ampliación Redes 4-43
300 ms
400 ms
Rogelio Montañana
Audio MPEG-1
• Muestreo mono o estéreo a 32, 44.1(CD) o 48 (DAT) KHz.
Si se va a utilizar caudal es reducido es conveniente hacer
el muestreo a 32 KHz.
• Compresión psicoacústica (con pérdidas) asimétrica.
• De 32 a 448 Kbps por canal de audio
• Tres capas en orden ascendente de complejidad/calidad:
– Capa I: buena calidad con 192-256 Kbps por canal; no se utiliza
– Capa II: calidad CD con 96-128 Kbps por canal
– Capa III: calidad CD con 64 Kbps por canal
• Cada capa incorpora nuevos algoritmos, y engloba los de
las anteriores.
• Capa III usada en DAB (Digital Audio Broadcast) y en
MP3
Universidad de Valencia
Ampliación Redes 4-44
Rogelio Montañana
Sistema MPEG-1
• Se ocupa de asegurar el sincronismo entre audio y vídeo
mediante un sistema de marcas de tiempo (‘timestamps’)
en base a un reloj de 90 KHz.
• Solo es necesario si se utilizan audio y vídeo
simultáneamente (no para flujos MP3 por ejemplo)
• Ocupa poco caudal (5-50 Kbps)
Universidad de Valencia
Ampliación Redes 4-45
Rogelio Montañana
Sincronización de audio y vídeo MPEG
Señal de audio Codificador
analógica
de audio
Flujo de audio digital
con marcas de tiempo
Multiplexor Flujo MPEG-1
del sistema
Reloj
de 90 KHz
Señal de vídeo
analógica
Codificador
de vídeo
Flujo de vídeo digital
con marcas de tiempo
Durante la decodificación se realiza el proceso inverso
Universidad de Valencia
Ampliación Redes 4-46
Rogelio Montañana
MPEG (Moving Pictures Expert Group)
• Grupo de trabajo de ISO que desarrolla estándares de audiovídeo comprimido:
• MPEG-1 (1992, ISO 11172)
– Orientado a vídeo en CD-ROM (vídeo progresivo)
– Objetivo: Calidad VHS. Caudal típico 1,5 Mb/s
– Útil para teleenseñanza, aplicaciones de empresa, negocios, etc.
• MPEG-2 (1996, ISO 13818)
–
–
–
–
Extensión compatible de MPEG-1 ‘hacia arriba’
Orientado a teledifusión (vídeo entrelazado)
Calidad broadcast, también HDTV. 4-100 Mb/s.
Útil para todo tipo de aplicaciones (negocios, entretenimiento, etc.)
• MPEG-3: Inicialmente pensado para HDTV, finalmente
resuelto por reparametrización de MPEG-2.
Universidad de Valencia
Ampliación Redes 4-47
Rogelio Montañana
MPEG-n
• MPEG-4 (1998-1999, ISO 14496):
– Extensión ‘hacia abajo’ de MPEG-1. Orientado a vídeo sobre
Internet
– Útil en el rango 28,8-500 Kb/s. Nuevos algoritmos de compresión
– Definición de AVOs (objetos audio visuales) similar a VRML
– MPEG-4 v. 2 (previsto dic. 1999)
• MPEG-5 y MPEG-6: inexistentes
• MPEG-7 (aprobado sep. 2001, ISO 15938)
– Descripción de contenidos audiovisuales (indexación, búsquedas,
bases de datos, etc.). Interpreta semántica de la información
audiovisual
• MPEG-21: en fase borrador. Prevista aprobación de IS entre 12/2002 y
9/2004
• Referencia: http://mpeg.telecomitalialab.com
Universidad de Valencia
Ampliación Redes 4-48
Rogelio Montañana
Vídeo MPEG-2 (I)
• Extensión compatible de MPEG-1
• Diseñado para televisión digital:
– Optimizado para transmisión, no almacenamiento
– Prevé vídeo entrelazado (TV) además de progresivo
(MPEG-1 era sólo progresivo)
• Según los valores de los parámetros de muestreo
utilizados se definen en MPEG-2 cuatro niveles:
–
–
–
–
Bajo:
Principal:
Alto-1440:
Alto:
Universidad de Valencia
352 x 288
720 x 576
1440 x 1152
1920 x 1152
Ampliación Redes 4-49
(compatible MPEG-1)
(equivalente CCIR 601)
(HDTV 4:3)
(HDTV 16:9)
Rogelio Montañana
Vídeo MPEG-2 (II)
• Además de los niveles se definen seis perfiles según el
submuestreo y algoritmo de compresión utilizado. Los
perfiles posibles son:
–
–
–
–
–
–
Simple: para codecs de bajo costo
Principal: el más utilizado
SNR
Espacial
Alto
Para gran calidad
4:2:2
• No todas las combinaciones nivel-perfil están permitidas
• Cada combinación tiene un caudal máximo previsto
• TV digital y DVD utilizan nivel y perfil principal
ML@MP (Main Level @ Main Profile)
Universidad de Valencia
Ampliación Redes 4-50
Rogelio Montañana
Niveles
Caudales de Niveles y Perfiles MPEG-2
Perfiles
Simple
Principal
SNR
Escal.
Espacial
Escal.
Alto
4:2:2
(Studio)
Submuestreo
4:2:0
4:2:0
4:2:0
4:2:0
4:2:0/2
4:2:0/2
Alto
1920 x 1152
(HDTV 16:9)
80 Mb/s
Alto-1440
1440 x 1152
(HDTV 4:3)
60 Mb/s
Principal
720 x 576
(CCIR 601)
Bajo
352 x 288
(MPEG1)
15 Mb/s
15 Mb/s
100 Mb/s
60 Mb/s
15 Mb/s
80 Mb/s
20 Mb/s
50 Mb/s
4 Mb/s
Los mostrados son los caudales máximos previstos en el
estándar para cada combinación de perfil y nivel.
Universidad de Valencia
Ampliación Redes 4-51
Rogelio Montañana
Audio MPEG-2
• Algoritmos:
– Versión compatible con MPEG-1 capa I, II y III
– Sistema de compresión mejorado Advanced Audio
Coding (AAC). Calidad comparable a MPEG-1 capa III
con el 50-70% de caudal. No compatible con MPEG-1.
• Canales:
– Versión estéreo compatible con MPEG-1
• Independiente (cada canal por separado)
• Conjunto (aprovecha redundancia entre canales)
– Soporte multicanal (idiomas) y 5.1 (5 canales más
surround)
Universidad de Valencia
Ampliación Redes 4-52
Rogelio Montañana
Vídeo H.26x
• Estándares de vídeo la ITU-T para vídeoconferencia: baja velocidad, poco
movimiento. Menos acción que en el cine.
– H.261: Desarrollado a finales de los 80 para RDSI (caudal constante).
– H.263, H.263+, H.26L. Más modernos y eficientes.
• Algoritmos de compresión MPEG simplificados:
– Vectores de movimiento más restringidos (menos acción)
– En H.261: No fotogramas B (excesiva latencia y complejidad)
• Menos intensivo de CPU. Factible codec software en tiempo real
• Submuestreo 4:1:1
• Resoluciones:
– CIF (Common Interchange Format): 352 x 288
– QCIF (Quarter CIF): 176 x 144
– SCIF (Super CIF): 704 x 576
• Audio independiente: G.722 (calidad), G.723.1, G.728, G.729
• Sincronización audio-vídeo mediante H.320 (RDSI) y H.323 (Internet)
Universidad de Valencia
Ampliación Redes 4-53
Rogelio Montañana
Resoluciones estándar de vídeo
comprimido
Formato
SQCIF
QCIF
CIF
4CIF o
SCIF
16CIF
4:3
16CIF
16:9
Resolución 128x96 176x144 352x288 702x576 1408x1152 1920x1152
720x576 1440x1152
Estándar
H.261
Opc.
H.263
Opc.
Opc.
Princip.
Alto 1440
MPEG-4
MPEG-1
MPEG-2
Universidad de Valencia
Bajo
Ampliación Redes 4-54
Alto
Rogelio Montañana
Resoluciones de vídeo
QCIF SQCIF
CIF
SCIF
16CIF 4:3
16CIF 16:9
Universidad de Valencia
Ampliación Redes 4-55
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-56
Rogelio Montañana
Estructura paquete RTP
20
Cabecera
IP
12
8
Cabecera Cabecera
UDP
RTP
La cabecera RTP incluye:
Variable
Datos (Audio o Video digital)
Con esto el receptor puede:
Payload Type
(7 bits)
Identificar el tipo de
información recibida
(ej.: audio G.722)
Número de secuencia
(16 bits)
Ordenar datagramas
recibidos,
detectar perdidos
Timestamp
(32 bits)
Reproducir en el
instante adecuado,
sincronizar audio y vídeo
Universidad de Valencia
Ampliación Redes 4-57
Rogelio Montañana
Cabecera RTP (RFC 1889)
Universidad de Valencia
Ampliación Redes 4-58
Rogelio Montañana
Paquetes RTCP
• Los paquetes RTCP no llevan información de usuario, solo
de control.
• Pueden ser de varios tipos:
– SR (Sender Report): ofrece estadísticas de transmisión y
recepción de los participantes que son emisores activos.
– RR (Receiver Report): ofrece estadísticas de recepción de
los participantes que no son emisores activos.
– SDES (Source Description): describe a un emisor activo. Lo
utilizan los emisores para anunciarse de manera no ambigua.
– BYE: Indica el final de la participación
• Con la información de RTCP los emisores pueden ajustar
el caudal según el estado de la red.
Universidad de Valencia
Ampliación Redes 4-59
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-60
Rogelio Montañana
Aplicaciones de audio-vídeo en
tiempo real
Aplicación
Sentido Estándares Retardo Espectadores Multicast
Videoconferencia


H.32x
Bajo
Uno o varios
Apropiado
Emisiones en
directo (radio-TV
por Internet)

H.32x
MPEG
Alto
Muchos
Muy
Apropiado
Audio-Vídeo
bajo demanda

MPEG
Medio
Uno
No
Universidad de Valencia
Ampliación Redes 4-61
Rogelio Montañana
Vídeoconferencia
• Comunicación interactiva por medio de
audio, video y compartición de datos
• Puede ser:
– Punto a punto
– Punto a multipunto
– Multipunto a multipunto
Universidad de Valencia
Ampliación Redes 4-62
Rogelio Montañana
Requisitos/Características de la
vídeoconferencia
•
•
•
•
Compresión/descompresión en tiempo real
Retardo máximo 200-400 ms.
Movilidad reducida
Normalmente aceptable audio de calidad
telefónica
• Necesidad de sincronizar audio y vídeo
• Necesidad de protocolo de señalización (servicio
orientado a conexión)
Universidad de Valencia
Ampliación Redes 4-63
Rogelio Montañana
Estándares de Vídeoconferencia
• Los sistemas de videoconferencia han sido
estandarizados por la ITU-T (International
Telecommunications Union – Telecommunications
sector) en los estándares de la serie H (sistemas
multimedia y audiovisuales)
• En la serie H hay una gran cantidad de estándares.
• Los H.32x son estándares de videoconferencia. La
‘x’ depende del tipo de red utilizado
Universidad de Valencia
Ampliación Redes 4-64
Rogelio Montañana
Estándares H.32x
Estándar
Medio físico
Tipo servicio
H.320
H.321
RDSI
ATM
Circuito
Circuito
H.322
H.323
H.324
IsoEthernet
Ethernet
Módem analógico
TDM
Paquete
Circuito
Año
aprobación
1990
1996
Los H.32x son estándares ‘paraguas’. Cada uno de ellos se basa en una
serie de estándares previos para especificar todos los servicios necesarios
en una vídeoconferencia. Ej.: Codificación de audio G.711
Universidad de Valencia
Ampliación Redes 4-65
Rogelio Montañana
Estándares H.320 y H.323
RDSI
Universidad de Valencia
IP
Ampliación Redes 4-66
Rogelio Montañana
Vídeoconferencia H.320
3*BRI
RDSI
Polycom
3*BRI
Sistema de grupo
o sala
Picturetel
Flujo de audio-vídeo
128 - 384 Kb/s
Dirección E.164: 963983542
Dirección E.164: 963865420
Universidad de Valencia
Ampliación Redes 4-67
Rogelio Montañana
Vídeoconferencia H.323
10BASE-T
Internet
Polycom,
Tandberg
Flujo de audio-vídeo
14,4 - 512 Kb/s
Dirección IP: 147.156.1.20
Universidad de Valencia
ADSL
Sistema de
sobremesa
Microsoft
Netmeeting,
Polycom
ViaVideo
Dirección IP: 172.68.135.22
Ampliación Redes 4-68
Rogelio Montañana
Terminales de vídeoconferencia
Polycom ViaVideo
Video: H.261, H.263, H.263+
Audio: G.711, G.722, G.728, G.723.1
Caudal: 32-384 Kb/s (H.323)
Formatos: CIF, QCIF
Peso: 250 g
Conexiones ent./sal.: USB, audio
Precio: 500 euros
Universidad de Valencia
Polycom ViewStation SP128
Video: H.261, H.263+
Audio: G.711, G.722, G.728
Caudal: 56-128 Kb/s (H.320), 56-768 Kb/s (H.323)
Formatos: CIF, QCIF
Peso: 2,7 Kg
Conexiones ent./sal.: video v audio
Precio: 5.000 euros
Ampliación Redes 4-69
Rogelio Montañana
Vídeoconferencia H.323: Gatekeeper
Luis
147.156.3.12
5112
Laura
147.156.4.15
5113
Internet
Ana
147.156.7.45
5114
Pedro
147.156.1.20
5111
GK
Universidad de Valencia
Dirección E.164
(número teléfono)
Alias H.323
Dirección IP
5111
Pedro
147.156.1.20
5112
Luis
147.156.3.12
5113
Laura
147.156.4.15
5114
Ana
147.156.7.45
Ampliación Redes 4-70
Rogelio Montañana
Estándares H.320 y H.323
H.323
H.320
Control H.225.0 Control de llamada Q.931
H.245
Medios
Universidad de Valencia
Control del sistema H.242
H.225.0
Multiplexación
H.221
G.711
G.722
G.723.1
G.728
Audio
G.711
G.722
G.728
H.261
H.263
Vídeo
H.261
H.263
T.120
Datos
T.120
Ampliación Redes 4-71
Rogelio Montañana
Formatos de audio H.32x
Codec Ancho de Banda Ratio de Ancho de Banda
en origen
compresión comprimido
G.711
G.722
G.723.1
G.728
G.729
MPEG
64 Kb/s
224 Kb/s
64 Kb/s
64 Kb/s
64 Kb/s
706 Kb/s
1:1
3,5-4,6 : 1
10 : 1
4:1
8:1
3-11 : 1
64 Kb/s
48-64 Kb/s
6,4 Kb/s
16 Kb/s
8 Kb/s
64-256 Kb/s
MPEG no es un formato de audio H.323. Solo aparece a título comparativo
Universidad de Valencia
Ampliación Redes 4-72
Rogelio Montañana
Terminales H.323
Teléfono IP
Red IP
Sistema de grupo
o sala
Sistema de
sobremesa
Lo único obligatorio en un terminal
H.323 es la parte de audio
Universidad de Valencia
Ampliación Redes 4-73
Rogelio Montañana
Arquitectura terminal H.323
Equipo e/s
de vídeo
Codec Video
H.261, H.263
Equipo e/s
de audio
Codec Audio
G.711, G.722,
G.723, G.728,
G.729
Datos usuario
Aplicaciones
T.120, etc.
Retardo
trayecto
Recepción
(Sync)
Control del sistema
Control H.245
Interfaz de
usuario para
control
del sistema
Universidad de Valencia
UDP
Capa
H.225
RTP
RTCP
IP
TCP
H.225.0 Control
llamada
H.225.0 Control
RAS
Ampliación Redes 4-74
UDP
Rogelio Montañana
Señalización H.323
Petición de admisión
Confirmación de admisión
RAS
GK
Gatekeeper
Terminal H.323
Inicio
Conexión
H.225
(Q.931)
Intercambio de capacidades
Apertura de canal lógico
Terminal H.323
H.245
ACK de apertura de canal lógico
Path
Resv
RSVP
(opcional)
Flujo RTP
Flujo RTP
Medio
Flujo RTCP
Universidad de Valencia
Ampliación Redes 4-75
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-76
Rogelio Montañana
Elementos de vídeoconferencia
• Terminal: es el equipo que utiliza el usuario para
comunicarse
• Gateway, pasarela o puerta de enlace: interconecta
redes diferentes: H.320 (RDSI) e Internet (H.323)
• Gatekeeper o equipo selector: permite el control
de acceso. Realiza la equivalencia de direcciones
IP a direcciones E.164 o usuarios
• MCU, Multipoint Control Unit o Unidad de
control multipunto: replica un flujo de audio/video
para permitir multiconferencia
Universidad de Valencia
Ampliación Redes 4-77
Rogelio Montañana
Funciones del Gatekeeper
• Obligatorias:
– Traducción de direcciones IP a E.164 o userid (alias)
– Control de Admisión: en función de los recursos disponibles
(ancho de banda, etc.)
– Gestión de ancho de banda: controla número de terminales
accediendo simultáneamente
• Opcionales
– Señalización de control: el gatekeeper puede efectuar la
señalización de llamada
– Autorización de llamada: acepta o rechaza la llamada en base a
autorización del usuario
– Gestión de llamada: mantiene una lista de llamadas activas
Universidad de Valencia
Ampliación Redes 4-78
Rogelio Montañana
Zonas de Gatekeeper
Zona 1
Prefijo 56
Zona 3
Prefijo 48
GK
Zona 2
Prefijo 73
GK
Universidad de Valencia
Zona: conjunto formado
por los terminales,
gateways, y MCUs
gestionados por un
gatekeeper
GK
WAN IP
Las zonas de
Gatekeeper son
areas lógicas que
reflejan la
topología de la red
y simplifican las
tareas
administrativas
Ampliación Redes 4-79
GK
Rogelio Montañana
Pasarela (Gateway) H.320-H.323
147.156.2.15
963972386
Arrancar Netmeetig
GW 147.156.2.69
Llamar a 963972386
ADSL
147.156.2.69
Internet
963171500
PRI
GW
BRI
RDSI
Gateway o
‘puerta de enlace’
Universidad de Valencia
Ampliación Redes 4-80
Rogelio Montañana
Funciones Gateway H.323
• Interoperabilidad entre audio/vídeo y
estándares de red
• Conversión de protocolo
– Procedimientos de comunicación
– Formatos de transmisión
• Opcionalmente: Transcodificación
(conversión de formatos audio/video)
Universidad de Valencia
Ampliación Redes 4-81
Rogelio Montañana
Arquitectura Gateway H.320-H.323
Control de
llamada
IP
H
.
3
2
3
H.245
H.225
IVR
H.242
Q.931
Video
Audio
H
.
3
2
0
RDSI
Datos T.120
Universidad de Valencia
Ampliación Redes 4-82
Rogelio Montañana
Gateway/Gatekeeper, llamada entrante
147.156.2.15
963972386
Arrancar Netmeeting
GK: 158.42.5.96
Usuario: Alicia
Número de tel.: 60
Llamar a
963171500 ext. 60
ADSL
147.156.2.69
Internet
963171500
GW
PRI
BRI
RDSI
¿ext. 60?
60 = 147.156.2.15
158.42.5.96
GK
Gatekeeper o
‘equipo selector’
Usuario
IP
Ext.
Alicia 147.156.2.15 60
Universidad de Valencia
Ampliación Redes 4-83
Rogelio Montañana
Gateway/Gatekeeper, llamada saliente
147.156.2.15
Arrancar Netmeeting
GK: 158.42.5.96
Usuario: Alicia
Número de tel.: 60
963972386
Llamar al 963972386
ADSL
147.156.2.69
Internet
963171500
GW
PRI
BRI
RDSI
Registro
Usar GW 147.156.2.69
Gatekeeper
158.42.5.96
GK
Usuario
IP
Ext.
Alicia 147.156.2.15 60
Universidad de Valencia
Ampliación Redes 4-84
Rogelio Montañana
Procedimientos de llamada vía
Gateway/Gatekeeper
• Respuesta de voz interactiva (IVR, Interactive Voice
Response):
– Marco 96-386-3500 y dice: ‘si sabe la extensión tecleela con un
cero delante, si no espere y le atenderá la operadora’.
• Extensión por defecto:
– Todas las llamadas se encaminan a una extensión determinada.
• Llamada directa del exterior:
– Cada extensión recibe un número directo del exterior. Ej.: 96-3863563 llama a la extensión 3563. Requiere obtener números extra
del operador.
• Enrutamiento TCS4:
– La extensión se marca detrás del número: 96-386-3500#3563 llama
a la extensión 3563. No disponible en España (los números extra
se ignoran).
Universidad de Valencia
Ampliación Redes 4-85
Rogelio Montañana
Necesidades de la vídeoconferencia
• Caudal:
– El teóricamente necesario más un 10-20% como
mínimo
• Retardo:
– Para telefonía de calidad: <150 ms extremo a extremo
(recomendación ITU G.114)
– Para videoconferencia: < 400 ms
• Pérdida de paquetes:
– Menor del 1% (hay que evitar la congestión)
Universidad de Valencia
Ampliación Redes 4-86
Rogelio Montañana
Vídeoconferencia multipunto H.320
Flujos de audio-vídeo
unidireccionales de 384 Kb/s
Emisor
3*BRI
Receptor
3*BRI
RDSI
3*BRI
3*BRI
PRI
Receptor
Receptor
MCU
Servidor MCU
(Multipoint Control Unit)
Replica el flujo de audio/vídeo
para cada participante.
Posible cuello de botella
Universidad de Valencia
Ampliación Redes 4-87
Rogelio Montañana
Vídeoconferencia multipunto H.323
Internet
MCU
MCU H.323
(Multipoint Control Unit)
Replica el flujo de audio/vídeo
para cada participante.
Posible cuello de botella
Universidad de Valencia
Ampliación Redes 4-88
Rogelio Montañana
Arquitectura de MCU H.323
Mezclador de audio
Mezclador de audio
Control de imagen
de vídeo
Activación por voz
T.120
Presencia continua
Universidad de Valencia
Ampliación Redes 4-89
Rogelio Montañana
Arquitectura de MCU H.323
Petición de
conferencia
Aceptación
Flujos de audio/video
hacia/desde los
participantes
Controlador Multipunto
Control de la Conferencia
•Entrada/salida
•Asignación/ubicación de
recursos
•Sentido de la llamada
Procesador Multipunto
Procesador Multipunto
Procesador Multipunto
Procesador Multipunto
Proceso de Medios
•Mezcla de audio
•Selección de
participantes activos
•Generación de imagen
de vídeo
Procesador Multipunto
Universidad de Valencia
Ampliación Redes 4-90
Rogelio Montañana
Transcodificación
Valencia
Bilbao
Flujos H.263 de 384 Kb/s
3*BRI
3*BRI
RDSI
BRI
3*BRI
Terminal sin
soporte H.263
PRI
Flujo H.261
de 128 Kb/s
MCU
MCU con transcodificacion
La transcodificación ha de hacerse en
tiempo real y es labor intensiva de CPU
Toulouse
Atenas
Universidad de Valencia
Ampliación Redes 4-91
Rogelio Montañana
Gatekeeper, Gateway y MCUs
MCU H.323
MCU
BRI
Internet
GW
PRI
Pasarela
GK
Gatekeeper
Universidad de Valencia
RDSI
PRI
3*BRI
MCU
MCU H.320 con
transcodificación
Ampliación Redes 4-92
Rogelio Montañana
Vídeoconferencia multipunto multicast
MBone
Flujo de audio-vídeo
multicast de 192 Kb/s
Flujo replicado por los routers.
No hay cuellos de botella.
Universidad de Valencia
Ampliación Redes 4-93
Rogelio Montañana
Multicast-unicast con transcodificación
Flujo unicast
a/v 100 Kb/s
RDSI BRI
Línea E1
Internet
Luis
Alicia
Usuario sin soporte multicast
Línea E1
Flujos multicast
a/v 192 Kb/s
Juan
Usuario con
soporte multicast
Universidad de Valencia
ADSL
256 Kb/s
Flujo unicast
a/v 192 Kb/s
Pasarela multicast-unicast
con transcodificación
Ampliación Redes 4-94
Pedro
Usuario sin soporte multicast
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-95
Rogelio Montañana
Videodifusión y vídeo bajo demanda
Los contenidos no se generan en
tiempo real (CODEC software)
MS Win. Media Server
Cisco IP/TV
SGI MediaBase
Etc.
Servidor
de vídeo
Internet
128-512 Kb/s
Usuarios remotos
(MPEG-4)
Emisiones
unicast y
multicast
Usuarios locales
(MPEG-1-2-4)
Universidad de Valencia
Ampliación Redes 4-96
Rogelio Montañana
Perfiles típicos de audio-vídeo en
servicios de VoD
Tipo de
conexión
Caudal Caudal Calidad Caudal
total
audio Audio vídeo
Kb/s
Kb/s
KHz
Kb/s
Calidad
vídeo
Caudal
usado
Kb/s
Módem RTC
33,6
10,2
5,5
mono
16
128x96
10 fps
26
Módem RTC
56
10,2
5,5
mono
38
176x144
12 fps
48
RDSI básico
(2B)
128
16
8
mono
80
240x180
24 fps
96
ADSL/
Cable módem
256
28
8+8
stereo
190
320x240
24 fps
218
ADSL/
Cable módem
512
48
16 + 16
stereo
390
640x480
24 fps
438
Universidad de Valencia
Ampliación Redes 4-97
Rogelio Montañana
Distribución de vídeo en directo
CODEC
H.26x
CODEC
MPEG
Universidad de Valencia
Internet
Ampliación Redes 4-98
Rogelio Montañana
TV en red de datos, formación continua
Videoteca cursos de
formación en MPEG-2 y 4
Servidor de Vídeo Windows
Media Server, IP/TV, etc.
Programa
Formación 3
Guía de
programas
Presentaciones
en directo H.26x
WAN
MPEG-4, H.263
LAN
MPEG-2, H.261
Training
Programa
Program 3
Formación 3
Training
Programa
Program 1 1
Formación
Program
Training
Program 2 2
Formación
Programa
Formación 1
Cursos programados regularmente y
emitidos por multicast varias veces por semana
Universidad de Valencia
Ampliación Redes 4-99
Rogelio Montañana
Diferencia entre vídeoconferencia y
vídeo streaming
Vídeo streaming
Vídeoconferencia
Codificación
MPEG-1, MPEG-4
H.263
Caudal típico
750-1500 Kb/s
128-384 Kb/s
Retardo
4-5 s
200 ms
Jitter
5-6 s
20-70 ms
La vídeoconferencia requiere un servicio de mayor
calidad que el vídeo streaming
Ejemplo de servicio de vídeo streaming:
www.catv.org/frame/cmur_streaming.html
Universidad de Valencia
Ampliación Redes 4-100
Rogelio Montañana
Sumario
•
•
•
•
•
•
•
•
Teorema de Nyquist. Conversión analógico-digital
Audio digital. Estándares. Compresión
Vídeo digital. Estándares. Compresión
Protocolos RTP y RTCP
Vídeoconferencia. Estándares H.32x
Pasarelas e Interoperabilidad
Vídeo bajo demanda
Telefonía Internet
Universidad de Valencia
Ampliación Redes 4-101
Rogelio Montañana
Telefonía sobre Internet
• Pretende aprovechar la red IP para la
comunicación telefónica
• Requiere una red con bajo retardo y caudal
garantizado (QoS)
• Además de digitalizar la voz es necesario ofrecer
todas las funciones propias de una red telefónica:
– Señalización
– Funciones avanzadas: reenvío de llamadas, mensajería,
etc.
Universidad de Valencia
Ampliación Redes 4-102
Rogelio Montañana
Evolución de la telefonía
Red Telefónica
Telefonía Tradicional
Red IP
Telefonía tradicional sobre backbone IP
Call Manager
Call Manager
Red IP
Telefonía IP
Universidad de Valencia
Ampliación Redes 4-103
Rogelio Montañana
Ejemplo de telefonía IP
1
1
A 0976* por 1
A 0* por 2
Resto por 1
3
A 0923* por 1
A 0* por 2
Resto por 1
2
3
2
Red
Telefónica
pública
Red
Telefónica
pública
Red
Telefónica
pública
Salamanca
Zaragoza
Pamplona
Universidad de Valencia
Ampliación Redes 4-104
Rogelio Montañana
CONS vs CLNS
Dir. E.164: 2001
Dir. E.164: 1001
Red Telefónica
En caso de fallo la red telefónica no se recupera de forma automática
Dir. E.164: 1001
Dir. IP: 136.12.15.32
Dir. E.164: 2001
Dir. IP: 158.35.23.1
Red IP
En caso de fallo la red IP reenvía los paquetes por una ruta alternativa.
Universidad de Valencia
Ampliación Redes 4-105
Rogelio Montañana
Ejemplo de red de telefonía IP compleja
Red Telefónica
Sucursal ‘Antigua’
Oficina Principal
Red IP
Teletrabajador
Sucursal ‘Moderna’
Universidad de Valencia
Ampliación Redes 4-106
Rogelio Montañana
Telefonía Internet
Para ahorrar costos el
gatekeeper elige la
pasarela más próxima
al destinatario.
GK
Línea
dedicada
Gateway H.323
(solo voz)
Internet
Modem
Red
Telefónica
conmutada
RDSI
Red CATV
Cabecera
Cable Modem
GSM
Red
analógica
Red ADSL
Modem ADSL
Universidad de Valencia
Ampliación Redes 4-107
Rogelio Montañana
Telefonía sobre Internet
• Un terminal H.323 solo está obligado a soportar
audio, el vídeo es opcional
• Por tanto con H.323 y gateways podemos ofrecer
telefonía Internet sin tener que aprobar nuevos
estándares
• Sin embargo H.323 es un estándar muy complejo.
Por ello el IETF ha aprobado un estándar
alternativo específicamente diseñado para
telefonía mucho más sencillo conocido como SIP
Universidad de Valencia
Ampliación Redes 4-108
Rogelio Montañana
Telefonía IP
• Ventajas:
+ Reducción de distancias (y costes) en la red telefónica
+ Fácil enrutamiento alternativo en caso de averías en la
red (servicio no orientado a conexión)
+ Compresión de la voz (G.729, G.723.1)
+ Supresión de silencios
+ Posibilidad de ofrecer servicios de voz de alta calidad
(G.722, 7 KHz)
• Inconvenientes
– Degradación de la calidad cuando hay congestión (si no
hay QoS).
– Mayores retardos (>200ms), posibles problemas de
ecos
Universidad de Valencia
Ampliación Redes 4-109
Rogelio Montañana
LAN con telefonía IP H.323
WAN con QoS
(DiffServ o IntServ)
Call Manager
(Gestor de telefonía IP)
(Servidor Windows/XP)
Las tramas del teléfono van en
una VLAN de alta prioridad (se
usa 802.1p y 802.1Q)
Tramas H.323 con alta
prioridad (802.1p)
Teléfono software
(Netmeeting, GnomeMeeting,
Softphone, etc.)
Universidad de Valencia
El teléfono recibe alimentación
eléctrica desde el switch LAN.
Él mismo actúa como un switch
de dos puertos 10/100
Ampliación Redes 4-110
Rogelio Montañana
Hard
Teléfonos IP
Soft
OpenPhone
http://www.openh323.org/code.html
Precio: 0 euros
Cisco 7905
Audio G.711 y G.729a
Precio: 200 euros
Cisco 7960G
Audio G.711 y G.729a
Incorpora conmutador de dos puertos 10/100
Precio: 500 euros
Universidad de Valencia
Ampliación Redes 4-111
Cisco SoftPhone
Audio G.711, G.723.1 y G.729a
Precio: 150 euros
Rogelio Montañana
Compresión de cabeceras RTP
• Los paquetes de voz no
pueden ser muy grandes
(retardo de serialización)
• G.729 genera 8 Kb/s (20
bytes cada 20 ms)
• Cabeceras:
– IP: 20 bytes
– UDP: 8 bytes
– RTP: 12 bytes
• 200% de overhead. La
mayoría de los campos
son constantes
• La compresión de
cabeceras reduce a 2-4
bytes
Universidad de Valencia
Ampliación Redes 4-112
Rogelio Montañana
Telefonía y Calidad de Servicio
• La telefonía es muy exigente con el retardo y el
jitter
• Para asegurar la QoS necesaria hay que disponer
de DiffServ o IntServ
• En enlaces de baja velocidad el retardo de
serialización de paquetes grandes puede hacer
inviable la telefonía, aun teniendo QoS
• Para evitarlo se puede forzar una MTU menor de
1500 bytes
Universidad de Valencia
Ampliación Redes 4-113
Rogelio Montañana
Retardo de serialización vs velocidad
y tamaño de paquete
Tamaño de
fragmento
Retardo de serialización
(para retardo de 20 ms)
64
bytes
128
bytes
256
bytes
512
bytes
1024
bytes
1500
bytes
64 Kb/s
8 ms
16 ms
32 ms
64 ms
128 ms
128 Kb/s
4 ms
8 ms
16 ms
32 ms
64 ms
192 Kb/s
256 Kb/s
384 Kb/s
512 Kb/s
Velocidad
Tamaño
fragmento
187 ms
64 Kb/s
160 Bytes
93 ms
128 Kb/s
320 Bytes
192 Kb/s
480 Bytes
256 Kb/s
640 Bytes
384 Kb/s
960 Bytes
1280 Bytes
2,7 ms 5,3 ms 10,7 ms 21,3 ms 42,6 ms 62,5 ms
2 ms
4 ms
1,3 ms 2,7 ms
1 ms
1024 Kb/s 0,5 ms
Universidad de Valencia
8 ms
5,3 ms
16 ms
32 ms
46 ms
10,7 ms 21,3 ms 31,3 ms
2 ms
4 ms
8 ms
16 ms
23 ms
512 Kb/s
1 ms
2 ms
4 ms
8 ms
12 ms
1024 Kb/s 2560 Bytes
Ampliación Redes 4-114
Rogelio Montañana
Encolamiento en un router con QoS
Voz
Vo
Vo
Vídeo
Vi
Vi
Datos urgentes
Ur
Ur
NU NU NU NU
Ur
Ur
Vi
Vi
Vo
Vo
Datos no urg. NU NU NU NU
Subsistema de colas de nivel 3
Subsistema de colas de nivel 2
Encolamiento de baja latencia
PQ voz
PQ voz
Política
Interleave
Entrada
Paquetes
TX
Ring
Salida
Paquetes
Clase X
Clase Y
WFQ
CBWFQ
Fragmento
Default
WFQ: Weighted Fair Queuing
CBWFQ: Customer Based Weighted Fair Queuing
Universidad de Valencia
Ampliación Redes 4-115
Rogelio Montañana
SIP (Session Initiation Protocol)
• Protocolo alternativo al H.323 para telefonía sobre
Internet
• Desarrollado por el grupo de trabajo MMUSIC del
IETF (RFC2543, 3/99, 153 pág.)
• Direcciones E.164 o URLs (como direcciones de
e-mail)
• Página principal del SIP: Universidad de
Columbia: http://www.cs.columbia.edu/~hgs/sip
Universidad de Valencia
Ampliación Redes 4-116
Rogelio Montañana
Componentes de SIP
• UA (Agente de usuario): Teléfonos SIP, Gateways,
PDAs
• UAC (User Agent Client): el que inicia una llamada
• UAS (User Agent Server): el que recibe la llamada
• Servidores:
– Proxy Server: el que actúa como intermediario, en
representación de otro para efectuar una llamada
– Redirect Server: traduce una dirección en otra u otras
– Registrar: el que acepta peticiones REGISTER
– Location Server: el que facilita información al Proxy o
Redirect sobre la ubicación del destinatatrio de una
llamada
Universidad de Valencia
Ampliación Redes 4-117
Rogelio Montañana
Referencias
• Godred Fairhurst: Digital Televisión: The MPEG-2
Standard:
http://www.erg.abdn.ac.uk/users/gorry/level2dp.pdf
• Godred Fairhurst: MPEG-2 Digital Video:
http://www.erg.abdn.ac.uk/public_html/research/futurenet/digital-video/index.html
• http://mpeg.telecomitalialab.com/
• Página principal del proyecto OpenH323:
http://www.openh323.org. Interesante fuente de
información sobre H.323, implementaciones y servicios
relacionados (gateways, gatekeepers, sistemas de respuesta
automatizada, etc.) para Linux y Windows. Todo gratuito y
con los códigos fuente disponibles.
• http://www.openphone.org/
Universidad de Valencia
Ampliación Redes 4-118
Rogelio Montañana