Inicio > Eventos, Innovación > “Eppur si muove”

“Eppur si muove”

Y sin embargo, se mueve“, dijo Galileo Galilei refiriéndose a la tierra, después de verse forzado a retractarse de la teoría heliocéntrica del mundo ante el tribunal de la Santa Inquisición. Desde entonces, esta frase simboliza la rebeldía de la ciencia (o la ingeniería) ante las convenciones comunes, la tradición o la autoridad establecida.

Precisamente en la Universidad de Padua (Italia), en el aula magna donde Galileo impartió clase de geometría y astronomía durante casi 20 años, tuvo lugar la semana pasada la XI edición del Cross Language Evaluation Forum (CLEF), con la participación destacada de Daedalus.

CLEF es el foro europeo más importante para la evaluación de sistemas de recuperación multilingüe y multimedia, que rivaliza a nivel mundial con TREC (Text Retrieval Conference) en Norteamérica y NTCIR (NII Test Collection for IR Systems) en Asia. A diferencia de TREC, que se centra en las técnicas de recuperación de información sobre el idioma inglés, y de NTCIR, centrado en los idiomas asiáticos como el japonés, chino y coreano, el objetivo de CLEF es la investigación en un gran número de idiomas (europeos y no europeos) y en las técnicas de recuperación cross-lingual, es decir, cuando el idioma de la consulta es diferente del de la colección de documentos en la que se busca. El objetivo final es promover y estimular el desarrollo de las tecnologías de recuperación de información en Europa para garantizar su competitividad en un ámbito mundial.

CLEF 2010 ha estado dividido en diferentes áreas temáticas (labs) que investigan diversos aspectos de la recuperación de información multilingüe: búsqueda de patentes (CLEF-IP), búsqueda de información de personas en la web (Web People Search), la recuperación de imágenes (ImageCLEF), análisis de log (LogCLEF), los sistemas de búsqueda de respuestas (RespubliQA), detección de plagio (PAN), etc.

En concreto, en Daedalus enviamos cuatro contribuciones:

  • LogCLEFAnalyzing the Success of Search Queries, donde realizamos diferentes experimentos para estudiar si hay alguna diferencia en el éxito de las consultas a “The European Library” (es decir, si el usuario encuentra lo que está buscando) cuando se utiliza el idioma nativo para buscar o bien se consulta empleando un idioma diferente. Indirectamente planteamos un análisis de si realmente es mejor para el usuario consultar en un idioma que no domina o bien sería preferible proporcionarle un traductor de consultas y resultados, a pesar de la ambigüedad que podría introducir.
  • PANA Plagiarism Detector for Intrinsic Plagiarism, donde describimos el diseño, implementación y evaluación de un sistema de detección de plagio intrínseco, externo y en Internet, de textos en lenguaje natural, basado en calcular la distancia LempelZiv (relacionada con el grado de compresión de un texto) aplicada a extraer información estructural de un texto.
  • WebPS-3k-Medoids Clustering using a Cost Function Minimization, donde definimos y evaluamos una función de coste para obtener el valor del número óptimo de clusters con el que ejecutar el algoritmo clásico de clustering llamado k-Medoids (similar a k-Means) con el que agrupar páginas web relacionadas con una misma persona, obtenidas como resultado de una búsqueda en Internet.

Además, participamos en la sesión de pósters de LogCLEF y PAN.

Sobre todo, nuestras presentaciones en las sesiones de WebPS y LogCLEF suscitaron bastante interés y estuvimos discutiendo animadamente con grupos de diferentes países sobre los resultados obtenidos y las soluciones aportadas. En general, creo que el hecho de que Daedalus sea una empresa privada, a diferencia de nuestros colegas de la universidad, nos da en muchos casos una visión más global y pragmática sobre lo que necesita la sociedad en el campo de la gestión inteligente de la información, muy atractiva para ellos. En realidad el objetivo de la participación de Daedalus en actividades de I+D+i no es sino para intentar resolver cuestiones actualmente planteadas en nuestros clientes o anticipar soluciones de futuro.

Un motivo de satisfacción fue saludar personalmente a Satoshi Sekine, moderador de la sesión de WebPS, que es el autor de la Extended Named Entity Hierarchy, una jerarquía de Entidades con Nombre mundialmente utilizada y que concretamente nosotros usamos para etiquetar semánticamente todos nuestros recursos lingüísticos (pruébalo), empleado en soluciones para nuestros clientes como el corrector de STILUS empleado en EL PAÍS, El Mundo, Grupo SM, etc. o la herramienta de etiquetado de entidades.

Al margen del trabajo, hicimos algo de turismo en esa bonita ciudad, disfrutamos de la comida y del café italianos, y pasamos buenos momentos, especialmente con nuestros amigos de la Universidad de Jaén, de Alicante, la Carlos III y la UNED. Los españoles en general hacemos una piña cuando viajamos y esto te hace sentir un poco más como en casa.

Pero no es nada fácil esto de ser innovadores… muchas veces es una inversión de esfuerzo que no se ve directamente recompensada, bien porque la tecnología está demasiado adelantada para su tiempo, por falta de confianza en algo diferente de lo habitual, o a veces por falta de visión de futuro. Pero en Daedalus seguimos trabajando en investigar, descubrir, evaluar, innovar… en foros como CLEF u otros, con la esperanza de fomentar la transferencia de tecnología y lograr avances reales en la sociedad de la información, y poder decir algún día a los escépticos, como Galileo, “y sin embargo, se mueve”.

Categorías:Eventos, Innovación
  1. Aún no hay comentarios.
  1. Aún no hay trackbacks

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Conectando a %s

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 177 seguidores

%d bloggers like this: