Las tecnologías de búsqueda se perfeccionan

Llega una forma de buscar información con NLP

Las herramientas lingüísticas y de procesamiento de lenguaje natural (NLP) se están incorporando a las tecnologías de búsqueda para facilitar el trabajo a miles de empleados que deben tomar decisiones de negocio y relacionarse con sus clientes. Ayudarles a categorizar la ingente información que llega por diversos canales, como el correo electrónico e Internet, es su objetivo.

No sólo hace falta poder buscar. Hay que comprender la búsqueda. Así lo asegura la consultora IDC, que señala en un estudio la importancia de las herramientas lingüísticas y de procesamiento de lenguaje natural (NLP) en los procedimientos de búsqueda de información, unas herramientas que permitirán a sus usuarios detectar tendencias de mercado, eventos y otros aspectos dentro de la avalancha de información que les llega. En dicho estudio se asegura que el mercado relacionado con la búsqueda de información cosechó 419 millones de dólares de ingresos en 2001. IDC también vaticina que este mercado llegará a los 1.300 millones de dólares en 2006, siendo este año clave para las tecnologías de NLP que, asegura, estarán embebidas en aplicaciones de cara al cliente como los call centers, en software de CRM (Customer Relationship Management), en extranets y sitios web públicos. Además, estas tecnologías son vitales para la inteligencia competitiva. Así, las agencias de defensa las utilizan para localizar terroristas, etc. Además, los motores de búsqueda Fast (ahora propiedad de Yahoo), Ask Jeeves y Alta Vista incorporan tecnologías NLP.
IBM y Microsoft ya están desarrollando este tipo de tecnologías con proveedores de servicios de contenido como LEXIS-NEXIS y Factiva. De hecho, según la consultora, cualquier sistema que interactúe con las personas debería usar tecnologías NLP, que dota de comprensión a la búsqueda.
La apuesta de IBM comenzó el pasado mes de septiembre, cuando ésta y Factiva anunciaron un acuerdo para codesarrollar soluciones analíticas de texto construidas sobre la plataforma WebFountain del Gigante Azul. Estas soluciones permitirán a los ejecutivos identificar más fácilmente las oportunidades de negocio. Factiva es la primera compañía en licenciar el servicio de e-business bajo demanda WebFountain y su tecnología analítica. Según sus responsables, este acuerdo es significativo en el mercado de contenidos y se proporciona como un servicio bajo demanda de Factiva y consultores de IBM. Además, ambas compañías planean lanzar otras aplicaciones adicionales con el soporte de terceras partes para desarrollar ofertas basadas en la plataforma WebFountain.
Claro que, Microsoft también está preparando su propia tecnología de búsqueda, aunque aún no ha dado detalles sobre el tema.

El milagro llamado Google
Dos estudiantes de doctorado de Stanford, Larry Page y Sergey Brin, son los responsables de la aparición del buscador con mayor éxito del mundo con un uso del 75% en nuestro país: Google. De hecho, su marca es ya más conocida que la de Coca Cola y recientemente sus fundadores han abierto una oficina en España para ofertar nuevos servicios a las empresas, a las que cobran por aparecer en sus páginas, y lanzar un servicio de noticias automatizadas.
El buscador, que surgió en 1998, proporciona acceso a más de 3.000 millones de páginas web y es capaz de proporcionar resultados en menos de medio segundo. Su tecnología y su interfaz han sido su gran aportación y lo que les ha diferenciado de los primeros buscadores. Este buscador, en vez de usar sólo un término o una tecnología de metabúsqueda, se basa en la tecnología PageRank (pendiente de patente) que hace que los resultados más importantes se muestren primero. PageRank mide la importancia de las páginas web y se piensa que resuelve una ecuación de 500 millones de variables y más de 2.000 millones de términos, utilizando una estructura vinculada de la web. De este modo, el éxito de Google se debe a un algoritmo. Además, según sus responsables, Google está estructurado de manera que nadie puede comprar un lugar privilegiado en la lista ni alterar los resultados con fines comerciales. Su arquitectura de búsqueda es escalable, lo que permite continuar indexando Internet a medida que se expande.
Como explica Álvaro Ibáñez, director general de Web (CWO) del proveedor de acceso a Internet, Ya.com Internet-Factory, “actualmente todos los buscadores de los portales que existen ahora utilizan la tecnología de Google o de Fast, que fue adquirido por Yahoo, que también tiene Inktomi, Altavista y el buscador de anuncios Overture, recientemente presentado en España. Nosotros en Ya.com utilizábamos la de Fast, pero desde hace un mes tenemos la de Google”. Según Ibáñez, el hecho de que casi todos apuesten por Google es debido a su tecnología que “combina muchas funcionalidades, entre ellas las nuevas de búsqueda de noticias y calculadoras, además del hecho de ser más conocido”. Eso sí, señala que otros como Fast permiten la búsqueda de archivos de MP3 y de vídeo.
El problema al que se enfrentan ahora los buscadores no es la tecnología, que, según Ibáñez está muy avanzada, sino cómo obtener rentabilidad, una dificultad que Google ha superado gracias a su programa de publicidad Adwords, al que están afiliadas 100.000 empresas y que les permite que sus anuncios aparezcan en la parte derecha de la página y estén relacionados con la búsqueda que ha realizado el usuario. Eso sí, Ibáñez puntualiza que, “en el futuro Google se enfrenta a la difícil gestión de su base de datos, cada vez más grande”.

Whitepaper emc-cio-it-as-a-service-wp Whitepapers