Transcript Multimedia
Tema 4 Multimedia Rogelio Montañana Departamento de Informática Universidad de Valencia [email protected] http://www.uv.es/~montanan/ Universidad de Valencia Ampliación Redes 4-1 Rogelio Montañana Concepto de red Multimedia • Teóricamente: – La red que transmite información utilizando para ello más de un medio físico. Ejemplo: documento con texto e imágenes • Para nosotros: – La red que transmite información de audio y/o vídeo en tiempo real (aunque solo se utilice uno de estos medios). Ejemplo: telefonía por Internet Universidad de Valencia Ampliación Redes 4-2 Rogelio Montañana Sumario • Teorema de Nyquist. Conversión analógicodigital • Audio digital. Estándares. Compresión • Vídeo digital. Estándares. Compresión • Protocolos RTP y RTCP • Vídeoconferencia. Estándares H.32x • Pasarelas e Interoperabilidad • Vídeo bajo demanda • Telefonía Internet Universidad de Valencia Ampliación Redes 4-3 Rogelio Montañana Teorema de Nyquist. • Teorema de Nyquist: La digitalización de una señal analógica ha de hacerse muestreando al menos al doble de la frecuencia máxima que se pretende capturar. – Canal telefónico: 3,1 KHz Muestreo 8 KHz – Audio HiFi: 20 KHz Muestreo 44,1 KHz Universidad de Valencia Ampliación Redes 4-4 Rogelio Montañana Teorema de Nyquist Canal telefónico Ancho de banda = 300 a 3.400 Hz 8.000 muestras/s (captura hasta 4 KHz) Muestras Señal analógica original Universidad de Valencia Ampliación Redes 4-5 Señal ‘muestreada’ a 8 KHz Rogelio Montañana Conversión analógico-digital PCM (Pulse Code Modulation) Ruido (o error) de cuantización Digitalización El error de cuantización depende del número de bits por muestra. Señal ‘muestreada’ (valores continuos) 100100111011001 Señal digital (valores discretos) Universidad de Valencia Ampliación Redes 4-6 Rogelio Montañana Sumario • Teorema de Nyquist. Conversión analógicodigital. • Audio digital. Estándares. Compresión • Vídeo digital. Estándares. Compresión • Protocolos RTP y RTCP • Vídeoconferencia. Estándares H.32x • Pasarelas e Interoperabilidad • Video bajo demanda • Telefonía sobre Internet Universidad de Valencia Ampliación Redes 4-7 Rogelio Montañana Audio digital no comprimido Tipo Frec. de Bits por Canales muestreo muestra Caudal Sonido telefónico (G.711) 8 KHz 8 1 64 Kb/s (RDSI) CD-DA (Compact Disc – Digital Audio) 44,1 KHz 16 2 1,411 Mb/s (CD-ROM 1x) DAT (Digital Audio Tape) 48 KHz 16 2 1,536 Mb/s Universidad de Valencia Ampliación Redes 4-8 Rogelio Montañana Clasificación algoritmos de compresión • Por su fidelidad: – Sin pérdidas (lossless): usada para datos (ej.: norma V.42bis en módems, ficheros .zip) – Con pérdidas (lossy): usada normalmente en audio y vídeo. Inaceptable para datos • Por su velocidad relativa de compresión/descompresión: – Simétricos: necesitan aproximadamente la misma potencia de CPU para comprimir que para descomprimir – Asimétricos: requieren bastante más CPU para comprimir que para descomprimir. • En multimedia se suelen utilizar algoritmos lossy • Siempre se necesita más CPU para comprimir que para descomprimir • Generalmente los algoritmos que consiguen mayor compresión gastan más CPU. Universidad de Valencia Ampliación Redes 4-9 Rogelio Montañana Tipos de compresión de audio • General (apta para todo tipo de sonidos): – Psicoacústica (MPEG) – Adaptativa Diferencial (ADPCM) • Específica para voz: – Code Excited Linear Prediction (CELP) – CS-ACELP (Conjugate-Structure Algebraic Code Excited Linear Prediction – GSM • Los codecs de voz no son aptos para música u otros sonidos Universidad de Valencia Ampliación Redes 4-10 Rogelio Montañana Algunos formatos de audio digital Bajo Retardo Elevado retardo Formato Frec. Muestreo (KHz) Canales Caudal por canal (Kb/s) Uso PCM (G.711) 8 1 64 Telefonía ADPCM (G.721) 8 1 32 Telefonía SB-ADPCM (G.722) 16 1 48/56/64 Vídeoconferenc. MP-MLQ (G.723.1) 8 1 6,3/5,3 variable Telefonía Internet ADPCM (G.726) 8 1 16/24/32/40 Telefonía E-ADPCM (G.727) 8 1 16/24/32/40 Telefonía LD-CELP (G.728) 8 1 16 Telefonía/Videoc. CS-ACELP (G.729) 8 1 8 Telefonía Internet RPE-LTP (GSM 06.10) 8 1 13,2 Telefonía GSM CELP (FS 1016) 8 1 4,8 LPC-10E (FS 1015) 8 1 2,4 CD-DA / DAT 44,1/48 2 705,6/768 MPEG-1 Layer I 32/44,1/48 2 192-256 variable MPEG-1 Layer II 32/44,1/48 2 96-128 variable MPEG-1 Layer III (MP3) 32/44,1/48 2 64 variable Hi-Fi Internet MPEG-2 AAC 32/44,1/48 5.1 32-44 variable Hi-Fi Internet Universidad de Valencia Ampliación Redes 4-11 Audio Hi-Fi Rogelio Montañana Audio digital comprimido • Generalmente a más compresión menor calidad y mayor consumo de CPU. • Los sistemas de caudal variable (MPEG, G.723.1) son los que mejor se adaptan a redes sin reserva de caudal constante, como el modelo DiffServ de Internet o los servicios UBR o ABR de ATM. • Los sistemas de caudal constante (G.711, G.722, G.729) son más adecuados para servicios orientados a conexión (RSVP o circuitos CBR de ATM, por ejemplo). • La compresión MPEG es la más eficiente y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no puede emplearse en aplicaciones interactivas (vídeoconferencia o telefonía). Universidad de Valencia Ampliación Redes 4-12 Rogelio Montañana Comparación de codecs Fuente Simulación de canal Limitación Codec ‘X’ 1 2 3 4 5 1 2 3 4 5 “El tren es un medio de transporte cómodo.” MOS Calidad voz Nivel de distorsión 5 Excelente Imperceptible 4 Buena Apenas Perceptible, no desagradable 3 Regular Perceptible, levemente desagradable 2 Pobre Desagradable, pero aceptable 1 Insatisfactoria Muy desagradable. Inaceptable MOS: Mean Opinion Score MOS de 4.2 = Calidad óptima Universidad de Valencia Ampliación Redes 4-13 Rogelio Montañana Compresión vs calidad PCM (G.711) Caudal (Kb/s) 64 56 48 40 ADPCM 32 (G.726) 32 ADPCM 24 (G.725) 24 ADPCM 16 (G.726) 16 8 CS-ACELP (G.729a) LPC 4.8 LDCELP 16 (G.728) CS-ACELP 8 (G.729) MP-MLQ 6,4 (G.723.1) Normalmente requieren hardware especial 0 0 1 2 3 4 5 MOS (Mean Opinion Score) Calidad Subjetiva Universidad de Valencia Ampliación Redes 4-14 Rogelio Montañana Codec de alta compresión optimizado para la voz humana Estos codecs no son aptos para música Universidad de Valencia Ampliación Redes 4-15 Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-16 Rogelio Montañana Señal de vídeo analógica R (rojo) G (verde) B (azul) Escaneador rasterizador Filtros Divisor R Lente La imagen capturada se descompone en tres señales que corresponden a los colores primarios amplitud tiempo G B amplitud amplitud tiempo tiempo Universidad de Valencia Ampliación Redes 4-17 Rogelio Montañana Fundamentos de TV en color • Las señales R-G-B se transforman en una señal de luminancia (Y) y dos de crominancia. Esta conversión se hace para: – Mantener compatibilidad con televisión B/N (se ignora la crominancia) – Dar mas ancho de banda a la luminancia (el ojo es menos sensible a la crominancia). • En sistema PAL las señales de crominancia se llaman U y V; la transformación que se realiza es: Y (Luminancia) = 0,30 R + 0,59 G + 0,14 B U (Crominancia) = 0,493 (B - Y) = -0,15 R - 0,29 G + 0,44 B V (Crominancia) = 0,877 (R - Y) = 0,62 R - 0,52 G - 0,10 B • Anchura de los canales: Y: 5 MHz U y V: 1 MHz Universidad de Valencia Ampliación Redes 4-18 Rogelio Montañana Funcionamiento de la TV en color Matriz Inversa R G B TV Color Y R G B Circuito Matricial U V Modulador Mezclador Modulador Filtro Y TV Blanco y Negro Universidad de Valencia Ampliación Redes 4-19 Rogelio Montañana Señales de vídeo analógico • A menudo las dos componentes de crominancia (U y V) se combinan (multiplexan en frecuencia) en una única señal llamada C. • En equipos sencillos (p. ej. vídeo VHS) se combinan Y y C en una única señal que se llama composite o vídeo compuesto. • Conforme se reduce el número de señales disminuye la calidad (especialmente en el paso de Y/C a vídeo compuesto). Num. Denominación Señales (PAL) Tipo de conector Tipo de equipo Calidad 3 YUV (componentes) 3 RCA o 3 BNC Equipos profesionales Estudio 2 Y/C S-Vídeo (mini-DIN) Vídeo Hi-8, S-VHS Broadcast 1 Compuesto (composite) RCA Vídeo 8 mm, VHS Vídeo doméstico Universidad de Valencia Ampliación Redes 4-20 Rogelio Montañana Vídeo digital ‘no comprimido’ • El formato de grabación utilizado como referencia en estudios de TV es el D1 (estándar ITU-R CCIR-601). • En formato digital las dos componentes de crominancia se denominan Cr y Cb (en vez de U y V). • Cada fotograma se representa como una imagen de 720x576 píxels (PAL). La luminancia se digitaliza con mayor resolución que las crominancias: – Luminancia (Y): 720(h) x 576(v) x 8 bits x 25 fps = 82,944 Mb/s – Crominancia Cr : 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s – Crominancia Cb: 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s • Caudal total: 82,9 + 41,5 + 41,5 = 165,888 Mb/s Universidad de Valencia Ampliación Redes 4-21 Rogelio Montañana Vídeo digital ‘no comprimido’ • La reducción de la resolución en las componentes de crominancia se denomina submuestreo (subsampling). • El submuestreo se basa en la menor sensibilidad del ojo humano a la crominancia. • El submuestreo 4:2:2 de CCIR-601 reduce la información de crominancia a la mitad (sin submuestreo el caudal total sería 248,7 Mb/s). • La información de crominancia puede reducirse aún más (a la cuarta parte) aplicando submuestreo 4:1:1 o 4:2:0. Este submuestreo degrada un poco la calidad de color, pero la diferencia con 4:2:2 es pequeña y sólo suele ser percibida por profesionales o en situaciones extremas. Universidad de Valencia Ampliación Redes 4-22 Rogelio Montañana Submuestreo 4:2:2 720 720 360 576 8 bits 576 576 R Y G B Cr Cb Luminancia 4 Crominancia 2+2 Universidad de Valencia Ampliación Redes 4-23 Rogelio Montañana Submuestreo 4:1:1 720 720 180 576 576 576 R Y G B Cr Cb Luminancia 4 Crominancia 1+1 Universidad de Valencia Ampliación Redes 4-24 Rogelio Montañana Submuestreo 4:2:0 720 720 360 576 576 288 Cr R Y G Cb B Luminancia 4 Crominancia 2+0 Universidad de Valencia Ampliación Redes 4-25 Rogelio Montañana Sistemas de grabación de vídeo digital para TV estándar (no HDTV) Sistema Submuestreo Bits/pixel Compresión Mb/s D5 4:2:2 10 1:1 220 D1 (ITU CCIR 601) 4:2:2 8 1:1 172 Digital Betacam (Sony) 4:2:2 10 2,3:1 (*) 95 AMPEX DCT 4:2:2 8 2:1 (*) 88 Digital-S, D-9, DVCPRO50 4:2:2 8 3,3:1 (*) 50 DV, DVCAM, DVCPRO, D-7 4:1:1 ó 4:2:0 8 5:1 (*) 25 D2, D3 Composite 8 1:1 94 (*) Compresión espacial (intraframe) con algoritmos muy parecidos a los de M-JPEG. Universidad de Valencia Ampliación Redes 4-26 Rogelio Montañana Compresión de vídeo en tiempo real La compresión introduce retardo Señal YUV, Y/C o Composite Cámara de TV o vídeo Almacenamiento Digitalizador CODEC Hard o soft Vídeo digital comprimido Vídeo digital sin comprimir Vídeo analógico Monitor Estación digitalizadora (PC/Mac/Workstation) Red local (o WAN) CODEC: COmpresor/DECompresor Universidad de Valencia Ampliación Redes 4-27 Rogelio Montañana Compresión de vídeo en diferido Señal YUV, Y/C o Composite Cámara de TV o vídeo Almacenamiento Almacenamiento CODEC Soft Digitalizador Vídeo digital sin comprimir Vídeo analógico Monitor Vídeo digital comprimido Estación digitalizadora (PC/Mac/Workstation) Red local (o WAN) CODEC: COmpresor/DECompresor Universidad de Valencia Ampliación Redes 4-28 Rogelio Montañana Compresión de vídeo • Para la compresión de vídeo se aplican dos técnicas: – Compresión espacial o intraframe: se aprovecha la redundancia de información que hay en la imagen de cada fotograma, como en la imágenes JPEG – Compresión temporal o interframe: se aprovecha la redundancia de información que hay entre fotogramas consecutivos. • La compresión interframe siempre lleva incluida la intraframe. Universidad de Valencia Ampliación Redes 4-29 Rogelio Montañana Formatos compresión de vídeo Sistema Compresión Espacial (DCT) Compresión temporal M-JPEG Sí No Media Baja Muy pequeño H.261 Sí Limitada (fotog. I y P) Elevada Media Pequeño MPEG-1/2 Sí Extensa (fotog. I, P y B) Muy elevada Alta Grande H.263 MPEG-4 Sí Extensa (fotog. I, P y B) Enorme Alta Media Grande Universidad de Valencia Complejidad Eficiencia Retardo compresión Ampliación Redes 4-30 Rogelio Montañana Caudal requerido por los sistemas de compresión de vídeo más comunes Bajo retardo Elevado retardo Universidad de Valencia Estándar/Formato Ancho de banda típico Ratio de compresión CCIR 601 170 Mb/s 1:1 (Referencia) M-JPEG 10-20 Mb/s 7-27:1 H.261 64 Kb/s – 2000 Kb/s 24:1 H.263 28,8-768 Kb/s 50:1 MPEG-1 0,4-2,0 Mb/s 100:1 MPEG-2 1,5-60 Mb/s 30-100:1 MPEG-4 28,8-500 Kb/s 100-200:1 Ampliación Redes 4-31 Rogelio Montañana Vídeo M-JPEG (Motion JPEG) • Es el más sencillo. Trata el vídeo como una secuencia de fotografías JPEG, sin aprovechar la redundancia entre fotogramas. • Algoritmos DCT (Discrete Cosine Transform) • Poco eficiente, pero bajo retardo. • Usado en: – Algunos sistemas de grabación digital y de edición no lineal (edición independiente de cada fotograma) – Algunos sistemas de videoconferencia (bajo retardo). • No incluye soporte estándar de audio. El audio ha de codificarse por algún otro sistema (p. Ej. CD-DA) y sincronizarse por mecanismos no estándar. Universidad de Valencia Ampliación Redes 4-32 Rogelio Montañana Funcionamiento de MPEG Compresión espacial y temporal Fotogramas digitalizados Compresor MPEG (software o hardware) La compresión puede o no ser en tiempo real. Generalmente para hacerla en tiempo real se requieren compresores en hardware Universidad de Valencia Ampliación Redes 4-33 Flujo MPEG comprimido Rogelio Montañana Vídeo MPEG (MPEG-1) • Submuestreo 4:2:0 (25% ahorro respecto 4:2:2) • Dos formatos posibles: – SIF (Standard Interchange Format): en PAL Y: 352 x 288 pixels, Cr y Cb: 176 x 144 pixels – QSIF (Quarter SIF): Y: 176 x 144; Cr y Cb : 88 x 72 • Dos tipos de compresión (simultáneamente): – Espacial: como en JPEG – Temporal: se aprovecha la semejanza que cada fotograma tiene con los que le rodean. Universidad de Valencia Ampliación Redes 4-34 Rogelio Montañana Compresión temporal en MPEG • El primer fotograma se digitaliza como una imagen JPEG • De los siguientes fotogramas sólo se se digitalizan los cambios respecto al anterior. Para localizar los cambios: – Se ‘cuadricula’ la imagen en macrobloques, cada uno formado por 16x16 pixels de Y (8x8 de Cr y 8x8 de Cb) – Si se detecta que un macrobloque ha cambiado de sitio esto se indica mediante un vector de movimiento. • Una imagen SIF (352x288) está formada por: 352/16 x 288/16 = 22 x 18 = 396 macrobloques Universidad de Valencia Ampliación Redes 4-35 Rogelio Montañana Vídeo MPEG • Tipos de fotogramas: – I (Intra): autocontenidos, solo compresión espacial (como JPEG) – P (Predictive): referido al P/I anterior. Compresión temporal por extrapolación mediante macrobloques. Un macrobloque pueden ser: • Inalterado: no modificado respecto al fotograma de referencia • Desplazado: (p. ej. un balón en movimiento) se describe por un vector de movimiento y eventualmente una corrección (diferencia respecto al original) • Nuevo: (p. ej. Lo que aparece detrás de una puerta que se abre) se describe por compresión espacial (como un fotograma I) – B (Bidireccional): compresión temporal con interpolación; referido al P/I anterior y al P/I posterior. Máxima compresión, máxima complejidad de cálculo. Suaviza la imagen, reduce el ruido. Universidad de Valencia Ampliación Redes 4-36 Rogelio Montañana Fotogramas I (Intra) Los fotogramas Intra se codifican de forma autocontenida, sin referirse a otros fotogramas 18 KBytes 18 KBytes 18 KBytes 18 KBytes I 18 KBytes I I I I 72 x 1024 x 8 / 0,16 = 3,7 Mb/s Universidad de Valencia Ampliación Redes 4-37 25 fotogramas por segundo Rogelio Montañana Fotogramas P (Predictivos) Los fotogramas Predictivos se codifican usando compensación de movimiento basada en el fotograma I o P anterior 18 KB 6 KB P 6 KB 18 KB 6 KB 6 KB 18 KB I P I P P I 60 x 1024 x 8 / 0,24 = 2,0 Mb/s Universidad de Valencia Ampliación Redes 4-38 Rogelio Montañana Fotogramas B (Bidireccionales) Los fotogramas Bidireccionales se codifican usando compensación de movimiento basada en el I o P mas próximo anterior y posterior 4 KB 4 KB 6 KB 4 KB Valores orientativos 4 KB 6 KB 4 KB 4 KB 18 KB 18 KB I B B P B B 10 P 9 B 8 B 7 I 6 5 4 3 2 1 54 x 1024 x 8 / 0,36 = 1,2Mb/s Orden de transmisión: 1,4,2,3,7,5,6,10,8,9,… Universidad de Valencia Ampliación Redes 4-39 Rogelio Montañana Comparación fotogramas P y B Vector de movimiento fotograma P I__P I 0 ms P 40 ms 80 ms P P 120 ms IPPP I 0 ms P 40 ms 120 ms Vector de desviación fotograma B IBBP I 0 ms Universidad de Valencia 80 ms B 40 ms Ampliación Redes 4-40 B 80 ms P 120 ms Rogelio Montañana Fotogramas MPEG I, P y B Vector de movimiento Macrobloque 16X16 Pixels Fotograma n Fotograma n+1 Predicción Bidireccional Área de búsqueda I B 0 B P 2 1 B 3 B 4 I 5 B 0 P B 1 2 3 Grupo de fotogramas Universidad de Valencia Ampliación Redes 4-41 Rogelio Montañana Vídeo MPEG-1 • Secuencia típica (360 ms): I1 B2 B3 P4 B5 B6 P7 B8 B9 I10 • Orden codif/decodificación: I1 P4 B2 B3 P7 B5 B6 I10 B8 B9 • Tamaño típico de fotogramas (SIF, 352 x 288): – – – – – I: 18 KBytes P: 6 KBytes B: 4 KBytes Caudal medio (IBBPBBPBBI): 1,2 Mbps Con QSIF el caudal se reduce a 300 Kbps • Latencia de compresión (valores típicos): – – – – M-JPEG: MPEG fotogramas I: MPEG fotogramas I y P: MPEG Fotogramas I, P y B: Universidad de Valencia Ampliación Redes 4-42 45 ms 200 - 400 ms 200 - 500 ms 400 - 850 ms Rogelio Montañana Caudal de una vídeoconferencia Caudal medio: 384 Kb/s Resolución: 352 x 288 (CIF) Velocidad de refresco: 30 fps Caudal instantáneo Fotograma I Fotograma I 600 Kb/s 300 Kb/s Fotogramas P y B Tiempo 0 Kb/s 0 ms Universidad de Valencia 100 ms 200 ms Ampliación Redes 4-43 300 ms 400 ms Rogelio Montañana Audio MPEG-1 • Muestreo mono o estéreo a 32, 44.1(CD) o 48 (DAT) KHz. Si se va a utilizar caudal es reducido es conveniente hacer el muestreo a 32 KHz. • Compresión psicoacústica (con pérdidas) asimétrica. • De 32 a 448 Kbps por canal de audio • Tres capas en orden ascendente de complejidad/calidad: – Capa I: buena calidad con 192-256 Kbps por canal; no se utiliza – Capa II: calidad CD con 96-128 Kbps por canal – Capa III: calidad CD con 64 Kbps por canal • Cada capa incorpora nuevos algoritmos, y engloba los de las anteriores. • Capa III usada en DAB (Digital Audio Broadcast) y en MP3 Universidad de Valencia Ampliación Redes 4-44 Rogelio Montañana Sistema MPEG-1 • Se ocupa de asegurar el sincronismo entre audio y vídeo mediante un sistema de marcas de tiempo (‘timestamps’) en base a un reloj de 90 KHz. • Solo es necesario si se utilizan audio y vídeo simultáneamente (no para flujos MP3 por ejemplo) • Ocupa poco caudal (5-50 Kbps) Universidad de Valencia Ampliación Redes 4-45 Rogelio Montañana Sincronización de audio y vídeo MPEG Señal de audio Codificador analógica de audio Flujo de audio digital con marcas de tiempo Multiplexor Flujo MPEG-1 del sistema Reloj de 90 KHz Señal de vídeo analógica Codificador de vídeo Flujo de vídeo digital con marcas de tiempo Durante la decodificación se realiza el proceso inverso Universidad de Valencia Ampliación Redes 4-46 Rogelio Montañana MPEG (Moving Pictures Expert Group) • Grupo de trabajo de ISO que desarrolla estándares de audiovídeo comprimido: • MPEG-1 (1992, ISO 11172) – Orientado a vídeo en CD-ROM (vídeo progresivo) – Objetivo: Calidad VHS. Caudal típico 1,5 Mb/s – Útil para teleenseñanza, aplicaciones de empresa, negocios, etc. • MPEG-2 (1996, ISO 13818) – – – – Extensión compatible de MPEG-1 ‘hacia arriba’ Orientado a teledifusión (vídeo entrelazado) Calidad broadcast, también HDTV. 4-100 Mb/s. Útil para todo tipo de aplicaciones (negocios, entretenimiento, etc.) • MPEG-3: Inicialmente pensado para HDTV, finalmente resuelto por reparametrización de MPEG-2. Universidad de Valencia Ampliación Redes 4-47 Rogelio Montañana MPEG-n • MPEG-4 (1998-1999, ISO 14496): – Extensión ‘hacia abajo’ de MPEG-1. Orientado a vídeo sobre Internet – Útil en el rango 28,8-500 Kb/s. Nuevos algoritmos de compresión – Definición de AVOs (objetos audio visuales) similar a VRML – MPEG-4 v. 2 (previsto dic. 1999) • MPEG-5 y MPEG-6: inexistentes • MPEG-7 (aprobado sep. 2001, ISO 15938) – Descripción de contenidos audiovisuales (indexación, búsquedas, bases de datos, etc.). Interpreta semántica de la información audiovisual • MPEG-21: en fase borrador. Prevista aprobación de IS entre 12/2002 y 9/2004 • Referencia: http://mpeg.telecomitalialab.com Universidad de Valencia Ampliación Redes 4-48 Rogelio Montañana Vídeo MPEG-2 (I) • Extensión compatible de MPEG-1 • Diseñado para televisión digital: – Optimizado para transmisión, no almacenamiento – Prevé vídeo entrelazado (TV) además de progresivo (MPEG-1 era sólo progresivo) • Según los valores de los parámetros de muestreo utilizados se definen en MPEG-2 cuatro niveles: – – – – Bajo: Principal: Alto-1440: Alto: Universidad de Valencia 352 x 288 720 x 576 1440 x 1152 1920 x 1152 Ampliación Redes 4-49 (compatible MPEG-1) (equivalente CCIR 601) (HDTV 4:3) (HDTV 16:9) Rogelio Montañana Vídeo MPEG-2 (II) • Además de los niveles se definen seis perfiles según el submuestreo y algoritmo de compresión utilizado. Los perfiles posibles son: – – – – – – Simple: para codecs de bajo costo Principal: el más utilizado SNR Espacial Alto Para gran calidad 4:2:2 • No todas las combinaciones nivel-perfil están permitidas • Cada combinación tiene un caudal máximo previsto • TV digital y DVD utilizan nivel y perfil principal ML@MP (Main Level @ Main Profile) Universidad de Valencia Ampliación Redes 4-50 Rogelio Montañana Niveles Caudales de Niveles y Perfiles MPEG-2 Perfiles Simple Principal SNR Escal. Espacial Escal. Alto 4:2:2 (Studio) Submuestreo 4:2:0 4:2:0 4:2:0 4:2:0 4:2:0/2 4:2:0/2 Alto 1920 x 1152 (HDTV 16:9) 80 Mb/s Alto-1440 1440 x 1152 (HDTV 4:3) 60 Mb/s Principal 720 x 576 (CCIR 601) Bajo 352 x 288 (MPEG1) 15 Mb/s 15 Mb/s 100 Mb/s 60 Mb/s 15 Mb/s 80 Mb/s 20 Mb/s 50 Mb/s 4 Mb/s Los mostrados son los caudales máximos previstos en el estándar para cada combinación de perfil y nivel. Universidad de Valencia Ampliación Redes 4-51 Rogelio Montañana Audio MPEG-2 • Algoritmos: – Versión compatible con MPEG-1 capa I, II y III – Sistema de compresión mejorado Advanced Audio Coding (AAC). Calidad comparable a MPEG-1 capa III con el 50-70% de caudal. No compatible con MPEG-1. • Canales: – Versión estéreo compatible con MPEG-1 • Independiente (cada canal por separado) • Conjunto (aprovecha redundancia entre canales) – Soporte multicanal (idiomas) y 5.1 (5 canales más surround) Universidad de Valencia Ampliación Redes 4-52 Rogelio Montañana Vídeo H.26x • Estándares de vídeo la ITU-T para vídeoconferencia: baja velocidad, poco movimiento. Menos acción que en el cine. – H.261: Desarrollado a finales de los 80 para RDSI (caudal constante). – H.263, H.263+, H.26L. Más modernos y eficientes. • Algoritmos de compresión MPEG simplificados: – Vectores de movimiento más restringidos (menos acción) – En H.261: No fotogramas B (excesiva latencia y complejidad) • Menos intensivo de CPU. Factible codec software en tiempo real • Submuestreo 4:1:1 • Resoluciones: – CIF (Common Interchange Format): 352 x 288 – QCIF (Quarter CIF): 176 x 144 – SCIF (Super CIF): 704 x 576 • Audio independiente: G.722 (calidad), G.723.1, G.728, G.729 • Sincronización audio-vídeo mediante H.320 (RDSI) y H.323 (Internet) Universidad de Valencia Ampliación Redes 4-53 Rogelio Montañana Resoluciones estándar de vídeo comprimido Formato SQCIF QCIF CIF 4CIF o SCIF 16CIF 4:3 16CIF 16:9 Resolución 128x96 176x144 352x288 702x576 1408x1152 1920x1152 720x576 1440x1152 Estándar H.261 Opc. H.263 Opc. Opc. Princip. Alto 1440 MPEG-4 MPEG-1 MPEG-2 Universidad de Valencia Bajo Ampliación Redes 4-54 Alto Rogelio Montañana Resoluciones de vídeo QCIF SQCIF CIF SCIF 16CIF 4:3 16CIF 16:9 Universidad de Valencia Ampliación Redes 4-55 Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-56 Rogelio Montañana Estructura paquete RTP 20 Cabecera IP 12 8 Cabecera Cabecera UDP RTP La cabecera RTP incluye: Variable Datos (Audio o Video digital) Con esto el receptor puede: Payload Type (7 bits) Identificar el tipo de información recibida (ej.: audio G.722) Número de secuencia (16 bits) Ordenar datagramas recibidos, detectar perdidos Timestamp (32 bits) Reproducir en el instante adecuado, sincronizar audio y vídeo Universidad de Valencia Ampliación Redes 4-57 Rogelio Montañana Cabecera RTP (RFC 1889) Universidad de Valencia Ampliación Redes 4-58 Rogelio Montañana Paquetes RTCP • Los paquetes RTCP no llevan información de usuario, solo de control. • Pueden ser de varios tipos: – SR (Sender Report): ofrece estadísticas de transmisión y recepción de los participantes que son emisores activos. – RR (Receiver Report): ofrece estadísticas de recepción de los participantes que no son emisores activos. – SDES (Source Description): describe a un emisor activo. Lo utilizan los emisores para anunciarse de manera no ambigua. – BYE: Indica el final de la participación • Con la información de RTCP los emisores pueden ajustar el caudal según el estado de la red. Universidad de Valencia Ampliación Redes 4-59 Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-60 Rogelio Montañana Aplicaciones de audio-vídeo en tiempo real Aplicación Sentido Estándares Retardo Espectadores Multicast Videoconferencia H.32x Bajo Uno o varios Apropiado Emisiones en directo (radio-TV por Internet) H.32x MPEG Alto Muchos Muy Apropiado Audio-Vídeo bajo demanda MPEG Medio Uno No Universidad de Valencia Ampliación Redes 4-61 Rogelio Montañana Vídeoconferencia • Comunicación interactiva por medio de audio, video y compartición de datos • Puede ser: – Punto a punto – Punto a multipunto – Multipunto a multipunto Universidad de Valencia Ampliación Redes 4-62 Rogelio Montañana Requisitos/Características de la vídeoconferencia • • • • Compresión/descompresión en tiempo real Retardo máximo 200-400 ms. Movilidad reducida Normalmente aceptable audio de calidad telefónica • Necesidad de sincronizar audio y vídeo • Necesidad de protocolo de señalización (servicio orientado a conexión) Universidad de Valencia Ampliación Redes 4-63 Rogelio Montañana Estándares de Vídeoconferencia • Los sistemas de videoconferencia han sido estandarizados por la ITU-T (International Telecommunications Union – Telecommunications sector) en los estándares de la serie H (sistemas multimedia y audiovisuales) • En la serie H hay una gran cantidad de estándares. • Los H.32x son estándares de videoconferencia. La ‘x’ depende del tipo de red utilizado Universidad de Valencia Ampliación Redes 4-64 Rogelio Montañana Estándares H.32x Estándar Medio físico Tipo servicio H.320 H.321 RDSI ATM Circuito Circuito H.322 H.323 H.324 IsoEthernet Ethernet Módem analógico TDM Paquete Circuito Año aprobación 1990 1996 Los H.32x son estándares ‘paraguas’. Cada uno de ellos se basa en una serie de estándares previos para especificar todos los servicios necesarios en una vídeoconferencia. Ej.: Codificación de audio G.711 Universidad de Valencia Ampliación Redes 4-65 Rogelio Montañana Estándares H.320 y H.323 RDSI Universidad de Valencia IP Ampliación Redes 4-66 Rogelio Montañana Vídeoconferencia H.320 3*BRI RDSI Polycom 3*BRI Sistema de grupo o sala Picturetel Flujo de audio-vídeo 128 - 384 Kb/s Dirección E.164: 963983542 Dirección E.164: 963865420 Universidad de Valencia Ampliación Redes 4-67 Rogelio Montañana Vídeoconferencia H.323 10BASE-T Internet Polycom, Tandberg Flujo de audio-vídeo 14,4 - 512 Kb/s Dirección IP: 147.156.1.20 Universidad de Valencia ADSL Sistema de sobremesa Microsoft Netmeeting, Polycom ViaVideo Dirección IP: 172.68.135.22 Ampliación Redes 4-68 Rogelio Montañana Terminales de vídeoconferencia Polycom ViaVideo Video: H.261, H.263, H.263+ Audio: G.711, G.722, G.728, G.723.1 Caudal: 32-384 Kb/s (H.323) Formatos: CIF, QCIF Peso: 250 g Conexiones ent./sal.: USB, audio Precio: 500 euros Universidad de Valencia Polycom ViewStation SP128 Video: H.261, H.263+ Audio: G.711, G.722, G.728 Caudal: 56-128 Kb/s (H.320), 56-768 Kb/s (H.323) Formatos: CIF, QCIF Peso: 2,7 Kg Conexiones ent./sal.: video v audio Precio: 5.000 euros Ampliación Redes 4-69 Rogelio Montañana Vídeoconferencia H.323: Gatekeeper Luis 147.156.3.12 5112 Laura 147.156.4.15 5113 Internet Ana 147.156.7.45 5114 Pedro 147.156.1.20 5111 GK Universidad de Valencia Dirección E.164 (número teléfono) Alias H.323 Dirección IP 5111 Pedro 147.156.1.20 5112 Luis 147.156.3.12 5113 Laura 147.156.4.15 5114 Ana 147.156.7.45 Ampliación Redes 4-70 Rogelio Montañana Estándares H.320 y H.323 H.323 H.320 Control H.225.0 Control de llamada Q.931 H.245 Medios Universidad de Valencia Control del sistema H.242 H.225.0 Multiplexación H.221 G.711 G.722 G.723.1 G.728 Audio G.711 G.722 G.728 H.261 H.263 Vídeo H.261 H.263 T.120 Datos T.120 Ampliación Redes 4-71 Rogelio Montañana Formatos de audio H.32x Codec Ancho de Banda Ratio de Ancho de Banda en origen compresión comprimido G.711 G.722 G.723.1 G.728 G.729 MPEG 64 Kb/s 224 Kb/s 64 Kb/s 64 Kb/s 64 Kb/s 706 Kb/s 1:1 3,5-4,6 : 1 10 : 1 4:1 8:1 3-11 : 1 64 Kb/s 48-64 Kb/s 6,4 Kb/s 16 Kb/s 8 Kb/s 64-256 Kb/s MPEG no es un formato de audio H.323. Solo aparece a título comparativo Universidad de Valencia Ampliación Redes 4-72 Rogelio Montañana Terminales H.323 Teléfono IP Red IP Sistema de grupo o sala Sistema de sobremesa Lo único obligatorio en un terminal H.323 es la parte de audio Universidad de Valencia Ampliación Redes 4-73 Rogelio Montañana Arquitectura terminal H.323 Equipo e/s de vídeo Codec Video H.261, H.263 Equipo e/s de audio Codec Audio G.711, G.722, G.723, G.728, G.729 Datos usuario Aplicaciones T.120, etc. Retardo trayecto Recepción (Sync) Control del sistema Control H.245 Interfaz de usuario para control del sistema Universidad de Valencia UDP Capa H.225 RTP RTCP IP TCP H.225.0 Control llamada H.225.0 Control RAS Ampliación Redes 4-74 UDP Rogelio Montañana Señalización H.323 Petición de admisión Confirmación de admisión RAS GK Gatekeeper Terminal H.323 Inicio Conexión H.225 (Q.931) Intercambio de capacidades Apertura de canal lógico Terminal H.323 H.245 ACK de apertura de canal lógico Path Resv RSVP (opcional) Flujo RTP Flujo RTP Medio Flujo RTCP Universidad de Valencia Ampliación Redes 4-75 Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-76 Rogelio Montañana Elementos de vídeoconferencia • Terminal: es el equipo que utiliza el usuario para comunicarse • Gateway, pasarela o puerta de enlace: interconecta redes diferentes: H.320 (RDSI) e Internet (H.323) • Gatekeeper o equipo selector: permite el control de acceso. Realiza la equivalencia de direcciones IP a direcciones E.164 o usuarios • MCU, Multipoint Control Unit o Unidad de control multipunto: replica un flujo de audio/video para permitir multiconferencia Universidad de Valencia Ampliación Redes 4-77 Rogelio Montañana Funciones del Gatekeeper • Obligatorias: – Traducción de direcciones IP a E.164 o userid (alias) – Control de Admisión: en función de los recursos disponibles (ancho de banda, etc.) – Gestión de ancho de banda: controla número de terminales accediendo simultáneamente • Opcionales – Señalización de control: el gatekeeper puede efectuar la señalización de llamada – Autorización de llamada: acepta o rechaza la llamada en base a autorización del usuario – Gestión de llamada: mantiene una lista de llamadas activas Universidad de Valencia Ampliación Redes 4-78 Rogelio Montañana Zonas de Gatekeeper Zona 1 Prefijo 56 Zona 3 Prefijo 48 GK Zona 2 Prefijo 73 GK Universidad de Valencia Zona: conjunto formado por los terminales, gateways, y MCUs gestionados por un gatekeeper GK WAN IP Las zonas de Gatekeeper son areas lógicas que reflejan la topología de la red y simplifican las tareas administrativas Ampliación Redes 4-79 GK Rogelio Montañana Pasarela (Gateway) H.320-H.323 147.156.2.15 963972386 Arrancar Netmeetig GW 147.156.2.69 Llamar a 963972386 ADSL 147.156.2.69 Internet 963171500 PRI GW BRI RDSI Gateway o ‘puerta de enlace’ Universidad de Valencia Ampliación Redes 4-80 Rogelio Montañana Funciones Gateway H.323 • Interoperabilidad entre audio/vídeo y estándares de red • Conversión de protocolo – Procedimientos de comunicación – Formatos de transmisión • Opcionalmente: Transcodificación (conversión de formatos audio/video) Universidad de Valencia Ampliación Redes 4-81 Rogelio Montañana Arquitectura Gateway H.320-H.323 Control de llamada IP H . 3 2 3 H.245 H.225 IVR H.242 Q.931 Video Audio H . 3 2 0 RDSI Datos T.120 Universidad de Valencia Ampliación Redes 4-82 Rogelio Montañana Gateway/Gatekeeper, llamada entrante 147.156.2.15 963972386 Arrancar Netmeeting GK: 158.42.5.96 Usuario: Alicia Número de tel.: 60 Llamar a 963171500 ext. 60 ADSL 147.156.2.69 Internet 963171500 GW PRI BRI RDSI ¿ext. 60? 60 = 147.156.2.15 158.42.5.96 GK Gatekeeper o ‘equipo selector’ Usuario IP Ext. Alicia 147.156.2.15 60 Universidad de Valencia Ampliación Redes 4-83 Rogelio Montañana Gateway/Gatekeeper, llamada saliente 147.156.2.15 Arrancar Netmeeting GK: 158.42.5.96 Usuario: Alicia Número de tel.: 60 963972386 Llamar al 963972386 ADSL 147.156.2.69 Internet 963171500 GW PRI BRI RDSI Registro Usar GW 147.156.2.69 Gatekeeper 158.42.5.96 GK Usuario IP Ext. Alicia 147.156.2.15 60 Universidad de Valencia Ampliación Redes 4-84 Rogelio Montañana Procedimientos de llamada vía Gateway/Gatekeeper • Respuesta de voz interactiva (IVR, Interactive Voice Response): – Marco 96-386-3500 y dice: ‘si sabe la extensión tecleela con un cero delante, si no espere y le atenderá la operadora’. • Extensión por defecto: – Todas las llamadas se encaminan a una extensión determinada. • Llamada directa del exterior: – Cada extensión recibe un número directo del exterior. Ej.: 96-3863563 llama a la extensión 3563. Requiere obtener números extra del operador. • Enrutamiento TCS4: – La extensión se marca detrás del número: 96-386-3500#3563 llama a la extensión 3563. No disponible en España (los números extra se ignoran). Universidad de Valencia Ampliación Redes 4-85 Rogelio Montañana Necesidades de la vídeoconferencia • Caudal: – El teóricamente necesario más un 10-20% como mínimo • Retardo: – Para telefonía de calidad: <150 ms extremo a extremo (recomendación ITU G.114) – Para videoconferencia: < 400 ms • Pérdida de paquetes: – Menor del 1% (hay que evitar la congestión) Universidad de Valencia Ampliación Redes 4-86 Rogelio Montañana Vídeoconferencia multipunto H.320 Flujos de audio-vídeo unidireccionales de 384 Kb/s Emisor 3*BRI Receptor 3*BRI RDSI 3*BRI 3*BRI PRI Receptor Receptor MCU Servidor MCU (Multipoint Control Unit) Replica el flujo de audio/vídeo para cada participante. Posible cuello de botella Universidad de Valencia Ampliación Redes 4-87 Rogelio Montañana Vídeoconferencia multipunto H.323 Internet MCU MCU H.323 (Multipoint Control Unit) Replica el flujo de audio/vídeo para cada participante. Posible cuello de botella Universidad de Valencia Ampliación Redes 4-88 Rogelio Montañana Arquitectura de MCU H.323 Mezclador de audio Mezclador de audio Control de imagen de vídeo Activación por voz T.120 Presencia continua Universidad de Valencia Ampliación Redes 4-89 Rogelio Montañana Arquitectura de MCU H.323 Petición de conferencia Aceptación Flujos de audio/video hacia/desde los participantes Controlador Multipunto Control de la Conferencia •Entrada/salida •Asignación/ubicación de recursos •Sentido de la llamada Procesador Multipunto Procesador Multipunto Procesador Multipunto Procesador Multipunto Proceso de Medios •Mezcla de audio •Selección de participantes activos •Generación de imagen de vídeo Procesador Multipunto Universidad de Valencia Ampliación Redes 4-90 Rogelio Montañana Transcodificación Valencia Bilbao Flujos H.263 de 384 Kb/s 3*BRI 3*BRI RDSI BRI 3*BRI Terminal sin soporte H.263 PRI Flujo H.261 de 128 Kb/s MCU MCU con transcodificacion La transcodificación ha de hacerse en tiempo real y es labor intensiva de CPU Toulouse Atenas Universidad de Valencia Ampliación Redes 4-91 Rogelio Montañana Gatekeeper, Gateway y MCUs MCU H.323 MCU BRI Internet GW PRI Pasarela GK Gatekeeper Universidad de Valencia RDSI PRI 3*BRI MCU MCU H.320 con transcodificación Ampliación Redes 4-92 Rogelio Montañana Vídeoconferencia multipunto multicast MBone Flujo de audio-vídeo multicast de 192 Kb/s Flujo replicado por los routers. No hay cuellos de botella. Universidad de Valencia Ampliación Redes 4-93 Rogelio Montañana Multicast-unicast con transcodificación Flujo unicast a/v 100 Kb/s RDSI BRI Línea E1 Internet Luis Alicia Usuario sin soporte multicast Línea E1 Flujos multicast a/v 192 Kb/s Juan Usuario con soporte multicast Universidad de Valencia ADSL 256 Kb/s Flujo unicast a/v 192 Kb/s Pasarela multicast-unicast con transcodificación Ampliación Redes 4-94 Pedro Usuario sin soporte multicast Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-95 Rogelio Montañana Videodifusión y vídeo bajo demanda Los contenidos no se generan en tiempo real (CODEC software) MS Win. Media Server Cisco IP/TV SGI MediaBase Etc. Servidor de vídeo Internet 128-512 Kb/s Usuarios remotos (MPEG-4) Emisiones unicast y multicast Usuarios locales (MPEG-1-2-4) Universidad de Valencia Ampliación Redes 4-96 Rogelio Montañana Perfiles típicos de audio-vídeo en servicios de VoD Tipo de conexión Caudal Caudal Calidad Caudal total audio Audio vídeo Kb/s Kb/s KHz Kb/s Calidad vídeo Caudal usado Kb/s Módem RTC 33,6 10,2 5,5 mono 16 128x96 10 fps 26 Módem RTC 56 10,2 5,5 mono 38 176x144 12 fps 48 RDSI básico (2B) 128 16 8 mono 80 240x180 24 fps 96 ADSL/ Cable módem 256 28 8+8 stereo 190 320x240 24 fps 218 ADSL/ Cable módem 512 48 16 + 16 stereo 390 640x480 24 fps 438 Universidad de Valencia Ampliación Redes 4-97 Rogelio Montañana Distribución de vídeo en directo CODEC H.26x CODEC MPEG Universidad de Valencia Internet Ampliación Redes 4-98 Rogelio Montañana TV en red de datos, formación continua Videoteca cursos de formación en MPEG-2 y 4 Servidor de Vídeo Windows Media Server, IP/TV, etc. Programa Formación 3 Guía de programas Presentaciones en directo H.26x WAN MPEG-4, H.263 LAN MPEG-2, H.261 Training Programa Program 3 Formación 3 Training Programa Program 1 1 Formación Program Training Program 2 2 Formación Programa Formación 1 Cursos programados regularmente y emitidos por multicast varias veces por semana Universidad de Valencia Ampliación Redes 4-99 Rogelio Montañana Diferencia entre vídeoconferencia y vídeo streaming Vídeo streaming Vídeoconferencia Codificación MPEG-1, MPEG-4 H.263 Caudal típico 750-1500 Kb/s 128-384 Kb/s Retardo 4-5 s 200 ms Jitter 5-6 s 20-70 ms La vídeoconferencia requiere un servicio de mayor calidad que el vídeo streaming Ejemplo de servicio de vídeo streaming: www.catv.org/frame/cmur_streaming.html Universidad de Valencia Ampliación Redes 4-100 Rogelio Montañana Sumario • • • • • • • • Teorema de Nyquist. Conversión analógico-digital Audio digital. Estándares. Compresión Vídeo digital. Estándares. Compresión Protocolos RTP y RTCP Vídeoconferencia. Estándares H.32x Pasarelas e Interoperabilidad Vídeo bajo demanda Telefonía Internet Universidad de Valencia Ampliación Redes 4-101 Rogelio Montañana Telefonía sobre Internet • Pretende aprovechar la red IP para la comunicación telefónica • Requiere una red con bajo retardo y caudal garantizado (QoS) • Además de digitalizar la voz es necesario ofrecer todas las funciones propias de una red telefónica: – Señalización – Funciones avanzadas: reenvío de llamadas, mensajería, etc. Universidad de Valencia Ampliación Redes 4-102 Rogelio Montañana Evolución de la telefonía Red Telefónica Telefonía Tradicional Red IP Telefonía tradicional sobre backbone IP Call Manager Call Manager Red IP Telefonía IP Universidad de Valencia Ampliación Redes 4-103 Rogelio Montañana Ejemplo de telefonía IP 1 1 A 0976* por 1 A 0* por 2 Resto por 1 3 A 0923* por 1 A 0* por 2 Resto por 1 2 3 2 Red Telefónica pública Red Telefónica pública Red Telefónica pública Salamanca Zaragoza Pamplona Universidad de Valencia Ampliación Redes 4-104 Rogelio Montañana CONS vs CLNS Dir. E.164: 2001 Dir. E.164: 1001 Red Telefónica En caso de fallo la red telefónica no se recupera de forma automática Dir. E.164: 1001 Dir. IP: 136.12.15.32 Dir. E.164: 2001 Dir. IP: 158.35.23.1 Red IP En caso de fallo la red IP reenvía los paquetes por una ruta alternativa. Universidad de Valencia Ampliación Redes 4-105 Rogelio Montañana Ejemplo de red de telefonía IP compleja Red Telefónica Sucursal ‘Antigua’ Oficina Principal Red IP Teletrabajador Sucursal ‘Moderna’ Universidad de Valencia Ampliación Redes 4-106 Rogelio Montañana Telefonía Internet Para ahorrar costos el gatekeeper elige la pasarela más próxima al destinatario. GK Línea dedicada Gateway H.323 (solo voz) Internet Modem Red Telefónica conmutada RDSI Red CATV Cabecera Cable Modem GSM Red analógica Red ADSL Modem ADSL Universidad de Valencia Ampliación Redes 4-107 Rogelio Montañana Telefonía sobre Internet • Un terminal H.323 solo está obligado a soportar audio, el vídeo es opcional • Por tanto con H.323 y gateways podemos ofrecer telefonía Internet sin tener que aprobar nuevos estándares • Sin embargo H.323 es un estándar muy complejo. Por ello el IETF ha aprobado un estándar alternativo específicamente diseñado para telefonía mucho más sencillo conocido como SIP Universidad de Valencia Ampliación Redes 4-108 Rogelio Montañana Telefonía IP • Ventajas: + Reducción de distancias (y costes) en la red telefónica + Fácil enrutamiento alternativo en caso de averías en la red (servicio no orientado a conexión) + Compresión de la voz (G.729, G.723.1) + Supresión de silencios + Posibilidad de ofrecer servicios de voz de alta calidad (G.722, 7 KHz) • Inconvenientes – Degradación de la calidad cuando hay congestión (si no hay QoS). – Mayores retardos (>200ms), posibles problemas de ecos Universidad de Valencia Ampliación Redes 4-109 Rogelio Montañana LAN con telefonía IP H.323 WAN con QoS (DiffServ o IntServ) Call Manager (Gestor de telefonía IP) (Servidor Windows/XP) Las tramas del teléfono van en una VLAN de alta prioridad (se usa 802.1p y 802.1Q) Tramas H.323 con alta prioridad (802.1p) Teléfono software (Netmeeting, GnomeMeeting, Softphone, etc.) Universidad de Valencia El teléfono recibe alimentación eléctrica desde el switch LAN. Él mismo actúa como un switch de dos puertos 10/100 Ampliación Redes 4-110 Rogelio Montañana Hard Teléfonos IP Soft OpenPhone http://www.openh323.org/code.html Precio: 0 euros Cisco 7905 Audio G.711 y G.729a Precio: 200 euros Cisco 7960G Audio G.711 y G.729a Incorpora conmutador de dos puertos 10/100 Precio: 500 euros Universidad de Valencia Ampliación Redes 4-111 Cisco SoftPhone Audio G.711, G.723.1 y G.729a Precio: 150 euros Rogelio Montañana Compresión de cabeceras RTP • Los paquetes de voz no pueden ser muy grandes (retardo de serialización) • G.729 genera 8 Kb/s (20 bytes cada 20 ms) • Cabeceras: – IP: 20 bytes – UDP: 8 bytes – RTP: 12 bytes • 200% de overhead. La mayoría de los campos son constantes • La compresión de cabeceras reduce a 2-4 bytes Universidad de Valencia Ampliación Redes 4-112 Rogelio Montañana Telefonía y Calidad de Servicio • La telefonía es muy exigente con el retardo y el jitter • Para asegurar la QoS necesaria hay que disponer de DiffServ o IntServ • En enlaces de baja velocidad el retardo de serialización de paquetes grandes puede hacer inviable la telefonía, aun teniendo QoS • Para evitarlo se puede forzar una MTU menor de 1500 bytes Universidad de Valencia Ampliación Redes 4-113 Rogelio Montañana Retardo de serialización vs velocidad y tamaño de paquete Tamaño de fragmento Retardo de serialización (para retardo de 20 ms) 64 bytes 128 bytes 256 bytes 512 bytes 1024 bytes 1500 bytes 64 Kb/s 8 ms 16 ms 32 ms 64 ms 128 ms 128 Kb/s 4 ms 8 ms 16 ms 32 ms 64 ms 192 Kb/s 256 Kb/s 384 Kb/s 512 Kb/s Velocidad Tamaño fragmento 187 ms 64 Kb/s 160 Bytes 93 ms 128 Kb/s 320 Bytes 192 Kb/s 480 Bytes 256 Kb/s 640 Bytes 384 Kb/s 960 Bytes 1280 Bytes 2,7 ms 5,3 ms 10,7 ms 21,3 ms 42,6 ms 62,5 ms 2 ms 4 ms 1,3 ms 2,7 ms 1 ms 1024 Kb/s 0,5 ms Universidad de Valencia 8 ms 5,3 ms 16 ms 32 ms 46 ms 10,7 ms 21,3 ms 31,3 ms 2 ms 4 ms 8 ms 16 ms 23 ms 512 Kb/s 1 ms 2 ms 4 ms 8 ms 12 ms 1024 Kb/s 2560 Bytes Ampliación Redes 4-114 Rogelio Montañana Encolamiento en un router con QoS Voz Vo Vo Vídeo Vi Vi Datos urgentes Ur Ur NU NU NU NU Ur Ur Vi Vi Vo Vo Datos no urg. NU NU NU NU Subsistema de colas de nivel 3 Subsistema de colas de nivel 2 Encolamiento de baja latencia PQ voz PQ voz Política Interleave Entrada Paquetes TX Ring Salida Paquetes Clase X Clase Y WFQ CBWFQ Fragmento Default WFQ: Weighted Fair Queuing CBWFQ: Customer Based Weighted Fair Queuing Universidad de Valencia Ampliación Redes 4-115 Rogelio Montañana SIP (Session Initiation Protocol) • Protocolo alternativo al H.323 para telefonía sobre Internet • Desarrollado por el grupo de trabajo MMUSIC del IETF (RFC2543, 3/99, 153 pág.) • Direcciones E.164 o URLs (como direcciones de e-mail) • Página principal del SIP: Universidad de Columbia: http://www.cs.columbia.edu/~hgs/sip Universidad de Valencia Ampliación Redes 4-116 Rogelio Montañana Componentes de SIP • UA (Agente de usuario): Teléfonos SIP, Gateways, PDAs • UAC (User Agent Client): el que inicia una llamada • UAS (User Agent Server): el que recibe la llamada • Servidores: – Proxy Server: el que actúa como intermediario, en representación de otro para efectuar una llamada – Redirect Server: traduce una dirección en otra u otras – Registrar: el que acepta peticiones REGISTER – Location Server: el que facilita información al Proxy o Redirect sobre la ubicación del destinatatrio de una llamada Universidad de Valencia Ampliación Redes 4-117 Rogelio Montañana Referencias • Godred Fairhurst: Digital Televisión: The MPEG-2 Standard: http://www.erg.abdn.ac.uk/users/gorry/level2dp.pdf • Godred Fairhurst: MPEG-2 Digital Video: http://www.erg.abdn.ac.uk/public_html/research/futurenet/digital-video/index.html • http://mpeg.telecomitalialab.com/ • Página principal del proyecto OpenH323: http://www.openh323.org. Interesante fuente de información sobre H.323, implementaciones y servicios relacionados (gateways, gatekeepers, sistemas de respuesta automatizada, etc.) para Linux y Windows. Todo gratuito y con los códigos fuente disponibles. • http://www.openphone.org/ Universidad de Valencia Ampliación Redes 4-118 Rogelio Montañana