- Miércoles, 21 Junio 2023
La toma de decisiones basada en datos e impulsada por algoritmos de Aprendizaje Automático o Machine Learning (ML) está cambiando la forma en que funcionan la sociedad y la economía, con un profundo impacto positivo en nuestra vida cotidiana. Para que estas soluciones sean efectivas, a menudo se tienen que procesar datos cerca del usuario/a final y dichos datos pueden ser privados y confidenciales.
El Aprendizaje Distribuido y, en particular, Federado (FL: Federated Learning) emerge como un paradigma líder dentro de la rama del ML satisfaciendo estas dos propiedades. El aprendizaje federado ha crecido en paralelo con la expansión de la nube hacia el borde (CloudEdge) pero, curiosamente, ambos se han desarrollado en su mayoría de forma independiente, a pesar de su paralelismo natural. En MLEDGE (Aprendizaje Automático en la Nube y en el Borde), IMDEA Networks trabajará, con el Dr. Nikolaos Laoutaris como investigador principal, para revertir esta tendencia mediante la implementación de FL como una capa intersectorial independiente pero optimizada sobre Cloud Edge, con aplicaciones y datos del mundo real para demostrar que esta sinergia puede producir grandes beneficios para todos.
Se estima que la economía de los datos alcanzará un impacto de 827.000 millones de euros para los 27 países de la UE en 2025 (1). Por ello, el objetivo es habilitar un ecosistema próspero de servicios FL en el borde, seguros y eficientes, capaces de facilitar el uso de datos personales y B2B confidenciales para entrenar modelos de machine learning (para usuarios/as finales individuales u organizaciones administrativamente independientes que colaboran bajo diferentes suposiciones de confianza -de total a nula, y cualquier nivel intermedio-).
Eficiencia, sostenibilidad y seguridad
Como destaca Elisa Cabana, Investigadora Postdoc de IMDEA Networks: “El proyecto aporta investigaciones, entre otras áreas, en la de servicios de aprendizaje federado (FLaaS), procesamientos en el borde de la nube (Cloud Edge), uso eficiente de FL en nubes híbridas y protección contra ataques, protección de datos sensibles o confidenciales que sean intercambiados, gestión de los desafíos de portabilidad de datos en el borde, etc.”. En este contexto, el equipo diseñará un marco de desarrollo y componentes que ayuden a popularizar este tipo de servicios, así como soluciones contra ataques de envenenamiento o inferencia lanzados desde servidores de borde rebeldes y/o nodos de agregación “honestos pero curiosos”. Incluye la creación de una ‘marca de agua’ para proteger contra la redistribución de datos o metadatos intercambiados entre servidores en el borde en el marco del FLaaS.
Otros aspectos a destacar serán, como resume Cabana: “Crear una capa de lógica económica y de negocio que implemente una distribución justa de costes e ingresos entre las partes cuando colaboren en el entrenamiento de modelos de ML, y dar soporte a DevOps (Conjunto de prácticas que agrupan el desarrollo de software y las operaciones de TI. Su objetivo es hacer más rápido el ciclo de vida del desarrollo de software y proporcionar una entrega continua de alta calidad) y al desarrollo continuo de servicios de aprendizaje automático en la nube, optimizando los costes mediante su monitoreo, predicción y asignación inteligente y energéticamente eficiente de los trabajos de computación”. La investigación contribuirá, además a diseñar, implementar y hacer públicos demostradores que trabajen con datos sensibles de individuos, y alimenten modelos útiles en áreas de la economía tradicional y de la economía digital como FinTech, identidad, salud, transporte, control de acceso, etc.
Transferencia tecnológica a la sociedad
La innovación del proyecto desarrollará, en un contexto internacional, condiciones de mercado favorables para el uso del aprendizaje federado en la nube y en arquitecturas de datos federados, como, por ejemplo, las definidas por instituciones como IDSA o Gaia-X, con innovaciones de gran interés para abordar importantes problemas económicos, empresariales y sociales ligados a la existencia de silos en el almacenamiento y la explotación de los datos en la economía. “MLEDGE hará que la tecnología avanzada del aprendizaje federado sea accesible para más organizaciones e individuos, incluidas pymes y agencias gubernamentales, y favorecerá la creación de negocios sostenibles para todos los actores de la cadena de valor (expertos/proveedores de aprendizaje automático, proveedores de servicios en la nube y de datos, industria tradicional y digital, sector público y el mundo académico, etc.)”, comenta Nikolaos Laoutaris, Research Professor en IMDEA Networks e Investigador Principal del proyecto en el instituto.
El proyecto será fundamental para el desarrollo de infraestructuras Cloud y ML/FL en España y para el fomento de la I+D+i nacional. Contribuirá a los Objetivos de Desarrollo Sostenible establecidos por las Naciones Unidas para 2030 y promoverá el desarrollo sostenible de redes eficientes y soluciones FL a través del trabajo práctico que puede impactar de manera sustancial y positiva en el medio ambiente.
En cuanto a las soluciones tecnológicas se pueden destacar:
1. Economía tradicional (construcción, finanzas, salud, etc.). El caso de uso será desarrollado por una empresa para mejorar procesos, o la toma de decisiones (por ejemplo, en tiempo real) basadas en datos o modelos provenientes de FL.
2. Economía digital. Un ejemplo se puede dar en el ámbito de la salud digital, como explotar la información de dispositivos móviles o tecnologías ‘wearable’. Otro sería el entrenamiento de modelos de publicidad digital.
3. Optimización de infraestructuras CloudEdge. Una funcionalidad clave para MLEDGE, que empleará algoritmos de machine learning entrenados de forma federada.
MLEDGE (Aprendizaje Automático en la Nube y en el Borde) cuenta con financiación (enero 2023-junio 2025) del Ministerio de Asuntos Económicos y Transformación Digital, Unión Europea NextGeneration-EU.
(1) Estrategia europea de datos para el período 2025-2030