Enfoques de voz por Internet: panorámica (I)

Internet ha supuesto un gran avance en todos los sentidos, pero al combinar este medio tecnológico con otros de uso cotidiano (con sus protocolos y sistemas correspondientes), aumentan notablemente la potencia de la Red. Es posible establecer nuevas vías de negocio y comunicación apoyándose en recursos que, hasta hace poco tiempo, pertenecían a un entorno sacado del mundo Internet.

La voz constituye un elemento extremadamente valioso en determinadas operaciones comerciales que se realizan electrónicamente, hasta el punto de que se está hablando ya del v-commerce (voice-commerce) como la nueva forma de hacer negocios en la economía digital. Esta tendencia se inscribe claramente dentro del marco general del comercio electrónico con lo cual desde el punto de vista técnico el v-commerce está basado en la telefonía por Internet, genéricamente conocida también como VoIP (Voice over IP) en términos de que transmite voz sobre una red IP. Sin embargo, el creciente desarrollo de la tecnología basada en trasmitir voz a través de Internet está dando paso a nuevos esquemas dentro de la propia tecnología de voz por Internet (y de IP), como VoXML o VoDSL.
El desarrollo de las técnicas de reconocimiento de voz es lo que ha propiciado que el tema de tecnología de voz por Internet y el subsiguiente v-commerce (y también aplicaciones para el mercado residencial) presente excelentes perspectivas de mercado: a modo de ejemplo, el potencial impacto de mercado que presentan las aplicaciones relativas a crear nuevos servicios de marcado de teléfono activado por voz algo que aparece como idóneo en los teléfonos móviles cuando se está en movimiento. Otras aplicaciones se refieren a la venta de, por ejemplo, billetes de avión o cualquier otro tipo de negocio donde el conjunto de clientes sea elevado y el cliente perciba que el acceso al servicio sea más fácil mediante una conversación telefónica. Todo este movimiento en torno a integrar la clásica voz de el nuevo entorno de Internet está dando lugar a los llamados portales de voz. En cualquier caso, el negocio de proporcionar voz a través de Internet constituye una oportunidad realmente importante para los nuevos operadores.

Conexión y funcionamiento
La forma más sencilla de hablar por teléfono es mediante la utilización del micrófono de un PC multimedia que llevan puertos para conectarse a la red telefónica pública conmutada que le conecta a su vez a Internet. Otra forma es llamar mediante un sistema PC-teléfono: en este caso las señales de voz se encaminan hacia un gateway que envía la señal hacia otro a través de Internet que, a su vez, transfiere la llamada hacia la red telefónica pública local llegando así a su destino final donde hay un teléfono como receptor. También se puede utilizar un esquema basado en teléfono-teléfono donde el usuario utiliza un teléfono, la señal pasa por un gateway que le conecta a Internet para luego volver a pasar por otro gateway y llegar finalmente al teléfono receptor. Otras posibilidades son las combinaciones PC-fax, teléfono-PC y fax-fax.

VoDSL y voz en XML
La voz se puede transmitir mediante un enlace xDSL, una tecnología que ha sido concebida para proporcionar servicios de voz y datos pero que fundamentalmente se contempla, en estos momentos, como un medio de acceso a Internet donde los datos constituyen el punto fuerte.
La transmisión de voz en xDSL constituye un aspecto especialmente importante en términos de mercado. De esta forma, los módems de cable asociados a la tecnología xDSL hacen posible que se pueda evitar el ordenador: lo único necesario es conectar un teléfono al modem. El hardware y el firmware del modem se encargan de implementar la transmisión de voz.
El tema de la voz en XML se refiere a una web con capacidad para voz, algo que se conoce como Voice Enabled Web, y que, en definitiva se refiere a conseguir que Internet sea accesible por voz y por teléfono. Esta tecnología aparece como uno de los temas de futuro emergente en el tema de poder hablar a través de la Web/Internet.
El bien conocido lenguaje eXtensible Markup Language (XML), definido por el World Wide Web Consortium (3C), se utiliza ampliamente en el ámbito del software como un medio para describir texto, imágenes y, en general, datos con estructura rica. Es en este marco de XML donde aparece lo que se conoce como Voice XML o voz en XML que se describe como un lenguaje de dominio específico que define diálogos en el interface hombre-máquina en forma de ficheros de audio, texto para ser hablado, voz para ser registrada o reconocida y una entrada touch-tone para ser recogida. Este nuevo lenguaje cubre tanto los tradicionales servicios de respuesta por voz (los IVR o Interactive Voice Response) como los más innovadores servicios de diálogo donde aparece la tecnología de reconocimiento de voz (mixed-initiative dialog) que permiten que sistema o plataforma presente iniciativa para dialogar. Recordemos en este punto que los sistemas o plataformas IVR constituyen una tecnología que se inscribe en el marco de la más general de centro de llamadas.
De una manera resumida IVR se puede describir como un sistema de automatización de la gestión de llamadas telefónicas que funciona como una operadora telefónica convencional, pero que en este caso es una operadora electrónica: cuando se produce una llamada se escucha un mensaje grabado previamente que describe el tipo de información y servicios disponibles, al mismo tiempo que proporciona una guía de los pasos a seguir para acceder a esa informaci

Viñeta publicada el 20 de febrero de 1870 en La Flaca n.º 35 Tendencias

ny2 ACTUALIDAD

ny2 Sociedad de la información

Día de la Movilidad y el BYOD Coffee Break