Comunicaciones
Software

W3C fija nuevos estándares para el reconocimiento de voz

El Consorcio World Wide Web (W3C) ha lanzado su recomendación de especificaciones para VoiceXML 2.1, el estándar para aplicaciones web manejadas por voz. VoiceXML es un lenguaje que permite que los ordenadores comprendan nuestro lenguaje y sea utilizado para procesar millones de llamadas diarias.

VoiceXML 2.1 extiende el lenguaje con ocho nuevas características que incluyen acceso dinámico a gramática y escritura, detección mediante un aviso de que el usuario está ausente y procesado de múltiples juegos de datos con un único acceso al servidor. Todas las aplicaciones de la versión anterior, VoiceXML 2.0, trabajan bajo la nueva especificación sin requerir modificación alguna.

Las recomendaciones las ha anunciado Max Ball, director de producto del laboratorio de Genesys Telecommunications, uno de los principales proveedores de software para centros de llamadas. Según Max, “VoiceXML 2.1 ofrece una significante mejora con respecto a especificaciones anteriores, con una mayor madurez para ser utilizada en los negocios y poder ser más productivos”.

VoiceXML es el principal componente de la W3C Speech Interface Framework, el cual también incluye Speech Recognition Grammar Specifications (SRGS 1.0), Speech Syntesis Markup Language (SSML 1.0) y la nueva Semantic Interpretation for Speech Recognition (SISR 1.0). Esta última permite a los desarrolladores extraer y traducir las representaciones textuales de palabras mediante un sistema de reconocimiento de voz con el fin de estructurar los resultados y presentarlos en un formato adecuado para su procesamiento. Por ejemplo, con SISR, la secuencia “quiero volar de Madrid a Barcelona” puede ser convertida a una estructura de datos que tan sólo contenga “salida: MAD” y “destino: BCN”.

El protocolo de etiquetas XML ha permitido la creación de diálogos de voz con características como grabación, DTMF, telefonía, o conversaciones simultáneas. Hasta ahora, VoiceXML 2.0 ha aportado grandes avances en el desarrollo de numerosas aplicaciones de voz con el fin de poder integrarlas en los servicios web multimedia.

Viñeta publicada el 20 de febrero de 1870 en La Flaca n.º 35 Tendencias

ny2 ACTUALIDAD

ny2 Sociedad de la información

Día de la Movilidad y el BYOD Coffee Break