CDTI

Proyecto AUTDEMIND: Automatizar la detección del mindset de un usuario en la plataforma bchange

Última actualización: Octubre 2024.

Desde septiembre de 2022 y hasta agosto de 2024, Bchange ha estado desarrollando el proyecto de I+D AUTDEMIND con la financiación del Centro para el Desarrollo Tecnológico Industrial (CDTI) del Ministerio de Ciencia, Innovación y Universidades y cofinanciada por el Fondeo Europeo de Desarrollo Regional (FEDER 2021-2027).

Logo CDTI

El proyecto consiste el desarrollo de mejoras en la captura, procesamiento y análisis de datos, así como la integración de herramientas de inteligencia de artificial y procesamiento de lenguaje natural (NLP) sobre la que habrá que hacer desarrollos y entrenamientos específicos, de acuerdo con la metodología bchange, que aumenten exponencialmente la capacidad de detectar el Mindset de los usuarios, y sus necesidades de gestión, gracias a la generación de patrones de conducta, correctos e incorrectos, que permitan a la inteligencia artificial buscar “look alikes” para dar indicaciones correctivas al usuario en tiempo real.

El proyecto ha sido enmarcado dentro de la tipología de proyectos I+D de CDTI porque supone la aplicación del conocimiento científico actual en inteligencia artificial para el desarrollo de mejoras en la captura, procesamiento y análisis de datos que utiliza la plataforma actual de bchange, así como la integración de herramientas de inteligencia de artificial y procesamiento de lenguaje natural (PLN) sobre los que habrá que hacer desarrollos y entrenamientos específicos de acuerdo con la metodología Bchange, y que incorporará los avances tecnológicos actuales y los nuevos que se investiguen como resultado del proyecto.

El proyecto de I+D ha finalizado en agosto de 2024, habiéndose alcanzado los objetivos previstos en tiempo en forma, a saber:

  1. Desarrollar los siguientes avances tecnológicos de la plataforma de Bchange:
    1. Reestructuración de la base de datos de la plataforma de Bchange. Esta reestructuración servirá para implementar el uso de modelos de machine learning supervisados y no supervisados, procesamiento e interpretación de datos y la automatización de procesos. Introduciendo nuevos elementos que permitan la obtención de información a través de las respuestas de los participantes para generar un scoring a fin de combinar las teorías de la personalidad clásicas con los últimos avances en inteligencia artificial con el objetivo de producir una clasificación de su mentalidad con la técnica más puntera. Se alcanzará este objetivo transformando los datos recogidos hasta la fecha con la intervención del equipo de psicólogos y el equipo de data science indagando así en los datos obtenidos para poder producir una inteligencia artificial capaz de predecir y clasificar la mentalidad de los usuarios por medio de técnicas vanguardistas de redes neuronales. La aportación del equipo de psicólogos es indispensable para el correcto etiquetado y que el equipo técnico pueda avanzar correctamente.
    2. Creación de una herramienta para el etiquetado de datos de aprendizaje automático y para la generación de informes de uso frecuente. Esta herramienta estará orientada al equipo de psicólogos para facilitar y agilizar el proceso de etiquetado de los datos, lo que permitirá potenciar el desarrollo los modelos supervisados obteniendo así datos enriquecidos para el aprendizaje automático. Además, con esta herramienta se busca automatizar las tareas más mecánicas o que puedan ser sustituidas por un algoritmo o inteligencia artificial distribuyendo los esfuerzos a otros desarrollos. Estas automatizaciones se realizarán por medio de procesos ETL que procesarán los datos en el backend y extrayendo como output el resultado deseado.
  2. Construir el modelo de Machine Learning compuesto de los siguientes objetivos técnicos específicos:
    1. Construir el modelo de Machine Learning supervisado. Para ello se tendrá una fase de investigación, de construcción y de definición de requisitos necesarios para crear el modelo, pasando por la infraestructura que se utilizará (servicios de computación en la nube), ya que los Variational AutoEncodes y los modelos del procesamiento del lenguaje natural requieren de una gran cantidad de parámetros que se pretenden entrenar de manera continua.
    2. Creación del dataset con los datos del usuario. Es necesario crear un dataset bien estructurado con los datos de los usuarios, que serían procesados a través del VAE que, por medio del encoder se reducirá su dimensionalidad con el objetivo de identificar las relaciones que tienen los datos entre sí, por otro lado, se aplicaría un one-hot-encoding de las respuestas y datos del usuario.
    3. Construir el modelo de Machine Learning no supervisado. Como última fase se construirá el modelo de Machine Learning con algoritmos CRNN con capas LSTM, ya que con estas capas son capaces en centrarse en las estadísticas de los datos. Con estos algoritmos automáticos se busca ofrecer al cliente nuevas heurísticas que irá incrementando con el número de usuarios gracias al uso de estas estructuras actuales que irán mejorando en calidad con el paso del tiempo gracias a la diversidad de respuestas.
  3. Integrar las capacidades de Procesamiento de Lenguaje Natural (PLN), compuesto de los siguientes objetivos técnicos específicos:
    1. Desarrollar los modelos de Hugging Face ya pre-entrenados. Se usarán las librerías de Huggin Face, un modelo entrenado con 175 mil millones de parámetros y el VAE, para aprovechar al máximo los ejercicios de campo abierto, extrayendo las ideas clave de cada respuesta, interpretando el lenguaje humano, permitiendo así la generación de feedback en tiempo real. Para esto será necesario el uso de servicios de computación en la nube con AWS. La utilización de estás librerías se realizará por medio una API, que permita el acceso a estos modelos ya entrenados para adaptarlos a los casos de uso.
    2. Adaptación de los modelos a la plataforma y a los requisitos. Para ello se seleccionarán los modelos que mejor se adapten a los requisitos.
    3. Desarrollar y entrenar los nuevos modelos. Gracias a estos desarrollos planteados se podrán distinguir los distintos patrones de comportamientos identificados durante las primeras fases, comprender de una forma más certera la forma de pensar de los usuarios y así poder tener una idea más exacta de la mentalidad de los usuarios.