- Miércoles, 02 Septiembre 2009
La voz sobre el Protocolo Internet (Voice over IP, VoIP) se está extendiendo de forma amplia como alternativa de bajo coste para los usuarios en llamadas telefónicas de larga distancia e internacionales. Sin embargo, para los usuarios acostumbrados a la elevada calidad de audio que ofrece el servicio de la Red Telefónica Pública Conmutada (PSTN, Public Switched Telephone Network), generalmente la calidad de VoIP sale malparada en comparación.
La calidad de voz en las redes VoIP varía mucho como resultado de varios factores. Este artículo mostrará cómo los proveedores de servicios pueden evitar degradaciones en una red VoIP y proporcionar una calidad de voz comparable, o incluso superior, a los niveles de PSTN.
En la PSTN, la calidad de voz es inteligible, suena natural, permite que los usuarios identifiquen a los interlocutores y experimenta tan sólo pequeños desajustes que resulten molestos. La voz se suministra como una señal analógica, que fi-naliza en el Operador de Bucle Digital (Digital Loop Carrier, DLC)
u Oficina Central (Central Office, CO) más cercanos. El DLC convierte la señal analógica en muestras
digitales para comunicación a larga distancia, y a continuación en
el punto extremo otro DLC con-
vierte las muestras digitales de nuevo a un formato analógico en
el interface telefónico TIP-RING.
La voz de alta calidad se logra porque las señales de voz analógicas se muestrean a 8000 Hz y se comprimen a tan sólo 8 bit por muestra utilizando la Modulación de Código de Pulso ITU-T-G711.
Existen varios factores que permiten a la PSTN mantener la calidad de la voz, entre ellos:
- Muestras y compresión de voz: La transmisión del DLC original al DLC de destino es digital. Las transmisiones digitales con G711 se controlan con relojes de estrato que aseguran el sincronismo de la muestra suministrada. Raras veces suceden pérdidas o errores en la muestra comprimida y, por tanto, no se perciben por los usuarios.
- Retardos: Los retardos de extremo a extremo se deben a los retarlos de transmisión física en la PSTN. No hay memoria ni proceso de paquetes en la transmisión, lo cual hace que la conversación de
voz interactiva sea más natural y agradable.
- Eco: Aunque se utilizan los mismos teléfonos analógicos en llamadas sobre PSTN y VoIP, el eco en el servicio PSTN no es perceptible debido a los mínimos retardos. El equilibrio de las pérdidas de extremo a extremo en el DLC y la CO del PSTN ayudan a reducir las perturbaciones por eco. Para llamadas internacionales y de larga distancia donde se pueden introducir retardos, se incorporan canceladores de eco a larga distancia por parte del operador.
- Conformidad a TR-57: TR-57 [1] es el estándar norteamericano para las directrices de transmisión y conmutación en DLC. Los sistemas y las etapas de entrada analógicas de DLC que controlan los cables telefónicos TIP-RING cumplen TR-57 y las características de transmisión equivalentes en cada país, lo que optimiza la calidad de transmisión. Los DLC y las CO de PSTN también aseguran unos retardos reducidos, lo que da como resultado una mejor percepción del inicio y las terminaciones de la llamada, así como el uso de los servicios de llamada.
- Control de Número Equivalente de Llamada (Ring Equivalent Number, REN) y adaptación de impedancia: Los DLC están diseñados habitualmente para ofrecer soporte hasta tres a cinco teléfonos con el mismo cableado físico TIP-RING. Esto permite que la PSTN mantenga la calidad pese al uso simultáneo del teléfono y minimizar la perturbación debido al desajuste de impedancia.
La PSTN no está completamente libre de fallos. En algunas llamadas internacionales la calidad de voz puede verse afectada por diferentes razones. Las causas podrían ser el resultado de terminaciones inapropiadas, retardos de los enlaces por satélite y varias etapas de transcodificación G711, carencia de los canceladores de eco adecuados en los nodos de terminación, largos bucles locales, utilización de varios teléfonos con desajustes de impedancia y uso de conectividad intermedia basada en paquetes entre los nodos de larga distancia.
Cuando se compara con PSTN, la calidad de voz basada en VoIP que se percibe se ve influida por varios factores. Estos factores – entre ellos el retardo, eco, compresión de voz, pérdida de paquetes, G711-PLC, transcodificación, pérdidas en la pasarela y pérdidas de Acoplamiento de Terminal – se clasifican siguiendo el estándar TIA-TSB 116-A [2].
En la arquitectura VoIP, el Equipamiento en las Instalaciones del Usuario (Customer Premises Equipment, CPE) incluye servicios de voz como el DLC del PSTN. Pero entre los CPE de VoIP también se incluyen funciones de la CO de la PSTN, como generación de tono de llamada, detección de dígitos marcados, iniciación del establecimiento de llamada y funciones de soporte. La voz VoIP se suministra como paquetes a través de una red IP. La Figura 1 indica que hay varios parámetros que controlan la calidad de voz y cómo la red IP introduce algunos obstáculos, como la caída de paquetes, fluctuación (jitter), errores de paquete y fragmentación de éstos.
El servicio VoIP también se suministra a través del CPE del mismo modo que en los adaptadores VoIP tradicionales, pasarelas residenciales de gama alta y teléfonos especiales IP. Los dispositivos dependen de los interfaces de la red local (LAN), como Ethernet y LAN inalámbrica (WLAN) o redes de área amplia (WAN) a través de una línea de abonado digital (DSL). El ancho de banda disponible en estas interfaces de red, así como la arquitectura del dispositivo y los mecanismos de QoS incorporados, se unen para ayudar a reducir los retardos de paquetes entre extremos. Muchos dispositivos CPE gestionan la QoS en sentido ascendente, mientras que la QoS de bajada se gestiona a través del Proveedor de Servicios de Internet (Internet Service Provider, ISP). Las CO de la ruta de los datos, como los Multiplexores de Acceso de Línea Digital de Abonado (DSLAM) VDSL se encuentran ya disponibles como soporte a QoS, lo que ayuda a eliminar las caídas de paquetes VoIP en las terminaciones IP.
Los CPE de VoIP están diseñados teniendo en cuenta que el hardware permita reducir el coste de los dispositivos con el fin de que el servicio sea económico para los consumidores. Por ejemplo, las referencias de reloj no se pueden igualar a los relojes de estrato de PSTN y algunos de los dispositivos en las etapas de entrada de los CPE no pueden cumplir totalmente las especificaciones TR-57. Sin embargo, varios fabricantes han presentado recientemente dispositivos de interface telefónico que bajo coste que incorporan características TR-57, lo cual permite una mejor calidad de voz. Todavía deben incorporarse múltiples impedancias, tonos, funciones de desviación de llamada y ajuste planificado de pérdidas para cada país, adaptándose así a los valores de nivel sonoro locales para mejorar la calidad de voz en su conjunto.
En algunos países, los servicios de Internet y VoIP los proporcionan diferentes proveedores. Para reducir los gastos, los abonados pueden seleccionar el servicio de Internet con menor ancho de banda. Para superar estas limitaciones en el ancho de banda, los proveedores de VoIP utilizan codecs como G729A en lugar de G711. La compresión de voz G729A es ocho veces superior a la de G711, lo que da como resultado un sonido de menos calidad. Además, las llamadas de VoIP pueden atravesar varias pasarelas y transcodificadores, o conversiones de un sistema de compresión a otro, para llegar
a los usuarios finales en otras re-
des VoIP, la PSTN o las redes ina-
lámbricas.
Debido a la congestión de red, la caída de paquetes es inevitable. Los algoritmos de Ocultación de Pérdidas de Paquetes (Packet Loss Concealment, PLC) se incorporan al CPE para gestionar las caídas de paquetes inesperadas. Durante los períodos de silencio, los buffers de fluctuación (jitter) se ajustan para optimizar los paquetes disponibles desde el interface de red y minimizar los retardos de buffer. Esta actividad también mejora las dificultades que presentan los paquetes resultantes de derivas del reloj de extremo a extremo.
El eco es un problema crítico que influye en la calidad de voz. Los retardos de llamada de VoIP de extremo a extremo y los niveles sonoros también añaden eco. Un retardo inferior ayuda a mejorar los ecos. Los retardos pueden mejorarse con un mayor ancho de banda, los mecanismos de QoS y el CPE diseñado para menores retardos de proceso de paquetes. El nivel sonoro se establece principalmente por los teléfonos del usuario final, las impedancias y pérdidas de extremo a extremo y en el país en que se ha instalado. La calidad de voz VoIP se puede mejorar más incorporando canceladores del operador en el proceso
del CPE.
En las redes VoIP, la calidad de voz debe monitorizarse continuamente. El software de monitorización de Calidad de Voz (VQmon) se utiliza en varias instalaciones, pero no todos los dispositivos CPE pueden proporcionar una mejora de la calidad dinámica y basada en los parámetros de monitorizados. Para alcanzar la más alta calidad, los dispositivos CPE y la infraestructura desplegada de extremo a extremo debe ser capaz de ofrecer soporte a una mejora dinámica de la calidad basada en los parámetros monitorizados.
Como se ha explicado en este artículo ha detallado, se están llevando a cabo una serie de mejoras para asegurar una calidad de voz comparable a la de la PSTN desde el punto de vista de la experiencia de los usuarios cuando éstos utilizan servicios VoIP. Sin embargo, es posible que la calidad de VoIP pueda superar a la de PSTN cuando se utiliza voz de banda ancha. En los servicios tradicionales de PSTN y VoIP, la acústica telefónica y el proceso limitan las frecuencias de voz de 300 a 3400 Hz. En la voz de banda ancha, los interfaces acústicos y el proceso soportan frecuencias de 50 a 7000 Hz, lo que permite ofrecer conversación con sonido natural con sensación de presencia. El audio comprimido de banda ancha con el ancho de banda con el códec G722 necesita el mismo ancho de banda que G711. Otros codecs de banda ancha como G729EV [3] trabajan con la mitad de ancho de banda que G711. La percepción obtenida a través de algunos codecs a menudo supera a la calidad de la PSTN de G711. El nivel de calidad de voz ‘R’ de la voz en banda ancha es alrededor de un 20% mejor que G711 basado en actualizaciones de un modelo con un ancho de banda de modelo R siguiendo las recomendaciones ITU-T-G107 y G113 [4,5].
La voz en banda ancha también se está desplegando en Europa, con el soporte de los teléfonos de banda ancha DECT (Digital Enhanced Cordless Telecommunications). Estas instalaciones se basan en el hardware de la etapa de entrada en banda ancha y en la acústica. La etapa de entrada telefónica conectada al Circuito de Interface de la Línea de Abonado y los dispositivos de muestreo de hardware proporcionan un amplio ancho de banda. En la actualidad existen varios modelos de teléfono para conferencias, teléfonos por software en PC y teléfonos IP que ofrecen soporte a voz en banda ancha. Los interfaces acústicos en teléfonos digitales, Bluetooth, DECT y WiFi también pueden utilizar-
se para servicios de voz de ban-
da ancha.
Se está asegurando una serie de mejoras para asegurar que la calidad de voz sea comparable a la de PSTN cuando se utilicen servicios VoIP, y que la calidad de VoIP pueda superar a los niveles de PSTN cuando se utilicen codecs de banda ancha. En los servicios tradicionales de PSTN y VoIP, la acústica telefónica y el procesado limitan las frecuencias de voz de 300 a 3400 Hz. En la voz para banda ancha, los interfaces acústicos y el proceso soportan frecuencias de 50 a 7000 Hz, que permiten ofrecer la conversación con el sonido natural con sensación de presencia. La voz comprimida en banda ancha necesita menos ancho de banda que G711. Las percepciones de escucha de muchos codecs de banda ancha superan a los de la calidad de G711 para la PSTN. El nivel de calidad de voz ‘R’ de la voz en banda ancha es aproximadamente un 20% mejor que G711 basado en actualizaciones de un modelo con un ancho de banda de modelo R siguiendo las recomendaciones ITU-T-G107 y G113.
Referencias
- TR-NWT-000057, Functional Criteria for Digital Loop Carrier Systems, Enero 1993
- TSB-116-A Telecommunications-IP Telephony Equipment–Voice Quality Recommendations for IP Telephony , Marzo 2006
- G729EV: An 8-32 kbits/s scalable wideband speech and audio coder bit stream, Mayo 2006, http://www.itu.int/ITU-T/worksem/h325/200605/presentations/s3p3-varga-beaugeant.pdf
- ITU-T-G107 Amendment-I, New Appendix II-Provisional impairment factor framework for wideband speech transmission, Junio 2006
- ITU-T-G113 Amendment-1: New Appendix IV-Provisional planning values for the wideband equipment impairment factor Ie,wb, Junio 2006.
The author: Sivannarayana Nagireddi. Ikanos Communications, Inc.