SigmaOnTopic

Desarrollo de una herramienta unificada de búsqueda semántica en lenguaje natural sobre contenidos digitales no estructurados

Desafío

El proyecto se centra en el desarrollo de una herramienta unificada de búsqueda semántica en lenguaje natural sobre contenidos digitales que permita recuperar de manera efectiva información en cualquier corporación, organismo público o entidad que maneje gran cantidad de información de datos no estructurados en cualquier formato fuente (documentos, audios, vídeos, páginas web, redes sociales, bases de datos, etc.).

 

Sigma propone desarrollar el producto SigmaOnTopic que utilizará como fuente principal los repositorios digitales disponibles y permitirá recuperar contenidos mediante búsquedas expresadas en lenguaje natural que analizará cualquier tipo de documento previamente indexado a través del buscador que incorpora. Entre las principales novedades que ofrece la solución propuesta cabe destacar las dos siguientes.

 

  • Se incorporará preprocesamiento lingüístico de consultas para permitir al usuario utilizar lenguaje natural en el campo de búsqueda. El sistema traducirá la solicitud del usuario a la sintaxis del buscador, estableciendo los filtros o parámetros necesarios en función de las intenciones y entidades detectadas.

 

  • Las representaciones vectoriales se incluirán en la indexación utilizando lenguaje entrenado con redes neuronales para permitir una búsqueda más semántica. Es decir, devolverá documentos y fragmentos en los que no sólo están presentes los términos de la consulta sino también otras expresiones con el mismo significado. El sistema también es capaz de recuperar texto contenido en audios y vídeos, reduciendo previamente el ruido para mejorar la inteligibilidad.

Solución

SigmaOnTopic es un proyecto individual de investigación industrial, que permitirá al Grupo Sigma seguir siendo referente en ofrecer capacidades avanzadas de gestión documental sin cambiar las infraestructuras y repositorios de datos utilizados. 

Resultados

La fase de ejecución de SigmaOnTopic inició a mediados de 2022 y se extenderá hasta mayo de 2024. 

El proyecto se organiza en cuatro paquetes de trabajo:

  1. Desarrollo de prototipos de laboratorio SigmaOnTopic
  2. Adaptaciones UPCT e integración de prototipos.
  3. Piloto de puesta en marcha y evaluación.
  4. Gestión y difusión de los resultados.

SigmaOntopic se está integrando en el plataforma de contenidos digitales que se está utilizando mucho en las universidades españolas, creado por la Universidad Politécnica de Cartagena (UPCT).

Fondos

El proyecto cuenta con el apoyo de los fondos EU Next Generation a través de la organización Red.es y se enmarca en el Plan de Recuperación, Transformación y Resiliencia.

 

Socios

El proyecto será desarrollado íntegramente por Sigma Cognition, con el apoyo de la Universidad Politécnica de Cartagena, quien implementará el piloto y realizará la evaluación de los resultados.

Noticias y eventos del proyecto

Publicaciones

Publicaciones

ES