Inicio > Innovación > WhoGotFunded – Aplicando la Extracción de Información basada en Semántica

WhoGotFunded – Aplicando la Extracción de Información basada en Semántica

Ya es hora de ir un poco más allá de la búsqueda simple, es momento de centrarse en los datos que importan y dejar de leer páginas y más páginas de resultados. Este es el objetivo de WhoGotFunded, un sitio web que extrae datos sobre rondas de financiación de startups; desde la entidad que financia la operación hasta la región a la que pertenece la empresa pasando por el sector en el que opera, todo información útil, preparada para su consumo.

Y detrás de todo ello está la tecnología semántica de Daedalus, de la que ya hablábamos en un post anterior, proporcionada a través de herramientas de procesamiento lingüístico para inglés, francés y español que:

  • detectan las entidades que aparecen en un texto (nombres de personas, empresas, lugares, etc.),
  • indican el sector al que pertenece la empresa, combinando algoritmos de clasificación automática con información lingüística,
  • extraen fechas y cantidades presentes en el texto, e
  • identifican eventos de financiación.
 

WhoGotFunded

La detección de esos acuerdos o eventos de financiación se realiza en combinación con métodos basados en reglas que permiten saber si la estructura de una frase se corresponde o no con la de los eventos que interesa localizar. Simplificando mucho, sería algo parecido a comprobar si una frase cumple la siguiente regla: “Si aparece el nombre de una empresa como sujeto del verbo ‘conseguir’ en su forma de pretérito perfecto compuesto y aparece una cantidad de dinero como complemento directo del verbo entonces hay un evento de financiación”. Evidentemente, la empresa financiadora aparecería en un complemento adicional o, tal vez, en la siguiente frase. Como ya se adivina, la casuística es extensa y el problema complejo.

En la imagen de la derecha (haciendo click sobre ella) puede verse un ejemplo del tipo de análisis que puede obtenerse para una frase mediante procesamiento automático y que proporciona la información necesaria para aplicar reglas similares a la del ejemplo anterior.

Árbol Sintáctico de la frase

Aplicaciones de este estilo son la evolución natural de la tecnología de búsqueda. Hace poco que Google anunció los primeros pasos hacia este nuevo modo de navegar por la información. En la versión en inglés proporciona ya algo de información estructurada para algunas personas, lugares u organizaciones. El siguiente paso será aplicar toda esa información a un problema real. Eso es lo que DaedalusDigimind, la empresa francesa con la que colaboramos en este proyecto, perseguimos con WhoGotFunded, facilitar el seguimiento de la información sobre financiación que se publica diariamente para diversos sectores y startups, procesando para ello 2 millones de noticias diariamente y extrayendo alrededor de 150 eventos diarios.

Por el momento, WhoGotFunded está en fase de beta privada pero en las próximas semanas estará accesible al público, ¡mantente conectado! Mientras tanto, puedes leer en Techcrunch los primeros comentarios sobre WhoGotFunded.

Categorías:Innovación
  1. Aún no hay comentarios.
  1. Aún no hay trackbacks

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Conectando a %s

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 177 seguidores

%d bloggers like this: