W3C fija nuevos estándares para el reconocimiento de voz
El Consorcio World Wide Web (W3C) ha lanzado su recomendación de especificaciones para VoiceXML 2.1, el estándar para aplicaciones web manejadas por voz. VoiceXML es un lenguaje que permite que los ordenadores comprendan nuestro lenguaje y sea utilizado para procesar millones de llamadas diarias.
Las recomendaciones las ha anunciado Max Ball, director de producto del laboratorio de Genesys Telecommunications, uno de los principales proveedores de software para centros de llamadas. Según Max, “VoiceXML 2.1 ofrece una significante mejora con respecto a especificaciones anteriores, con una mayor madurez para ser utilizada en los negocios y poder ser más productivos”.
VoiceXML es el principal componente de la W3C Speech Interface Framework, el cual también incluye Speech Recognition Grammar Specifications (SRGS 1.0), Speech Syntesis Markup Language (SSML 1.0) y la nueva Semantic Interpretation for Speech Recognition (SISR 1.0). Esta última permite a los desarrolladores extraer y traducir las representaciones textuales de palabras mediante un sistema de reconocimiento de voz con el fin de estructurar los resultados y presentarlos en un formato adecuado para su procesamiento. Por ejemplo, con SISR, la secuencia “quiero volar de Madrid a Barcelona” puede ser convertida a una estructura de datos que tan sólo contenga “salida: MAD” y “destino: BCN”.
El protocolo de etiquetas XML ha permitido la creación de diálogos de voz con características como grabación, DTMF, telefonía, o conversaciones simultáneas. Hasta ahora, VoiceXML 2.0 ha aportado grandes avances en el desarrollo de numerosas aplicaciones de voz con el fin de poder integrarlas en los servicios web multimedia.