- Miércoles, 14 Febrero 2024
La mayor parte del cálculo en las redes neuronales más modernas comprende operaciones lineales, como las multiplicaciones de matrices y vectores y las convoluciones. Las operaciones lineales también pueden desempeñar un papel importante en la criptografía. Aunque existen procesadores dedicados, como las GPU y las TPU, que permiten realizar operaciones lineales en gran paralelo, estos dispositivos consumen mucha energía y el escaso ancho de banda de la electrónica sigue limitando su velocidad de funcionamiento. La óptica es más adecuada para este tipo de operaciones por su paralelismo inherente y su gran ancho de banda y velocidad de cálculo.
Construidas a partir de un conjunto de superficies finas diseñadas espacialmente, las redes neuronales profundas difractivas (D2NN), también conocidas como redes difractivas, forman una arquitectura informática óptica de reciente aparición capaz de realizar tareas de cálculo de forma pasiva a la velocidad de propagación de la luz a través de un volumen ultrafino. Estos ordenadores ópticos para tareas específicas se diseñan digitalmente mediante el aprendizaje de las características espaciales de las superficies difractivas que los componen. Tras este proceso de diseño único, las superficies optimizadas se fabrican y ensamblan para formar el hardware físico de la red óptica difractiva.
En su reciente publicación en Advanced Photonics Nexus, un equipo de investigadores dirigido por Aydogan Ozcan, catedrático y titular de la Cátedra Volgenau de Innovación en Ingeniería de la UCLA, ha presentado un método para realizar operaciones lineales de valor complejo con redes difractivas bajo iluminación espacialmente incoherente. El mismo grupo había demostrado anteriormente que las redes difractivas con suficientes grados de libertad pueden realizar transformaciones lineales arbitrarias de valor complejo con luz espacialmente coherente con un error insignificante. En cambio, con luz espacialmente incoherente, estas redes pueden realizar transformaciones lineales arbitrarias de las intensidades ópticas de entrada si los elementos de la matriz que definen la transformación son reales y no negativos. Dado que las fuentes de iluminación espacialmente incoherentes son más frecuentes y de más fácil acceso, cada vez es más necesario que los procesadores difractivos espacialmente incoherentes manejen datos que vayan más allá de los valores no negativos.
Al incorporar pasos de preprocesamiento y postprocesamiento para representar números complejos mediante un conjunto de números reales no negativos, los investigadores de la UCLA han ampliado la capacidad de procesamiento de las redes difractivas espacialmente incoherentes al dominio de los números complejos. Demostraron que estos procesadores difractivos incoherentes pueden diseñarse para realizar una transformación lineal de valor complejo arbitraria con un error insignificante si existe un número suficiente de características difractivas optimizables de sólo fase dentro del diseño, que se escala con las dimensiones de los espacios de vectores complejos de entrada y salida.
Los investigadores mostraron la aplicación de este novedoso esquema mediante el cifrado y descifrado de imágenes de valor complejo utilizando redes difractivas espacialmente incoherentes. Aparte de la encriptación visual de imágenes, estos procesadores difractivos espacialmente incoherentes también podrían ser útiles en otras aplicaciones, por ejemplo, en vehículos autónomos para el procesamiento ultrarrápido y de bajo consumo de escenas naturales.
Realización de transformaciones lineales de valor complejo utilizando redes difractivas espacialmente incoherentes (a) Flujo de trabajo del modelo de red difractiva espacialmente incoherente: un elemento de valor complejo del vector de entrada se representa mediante un conjunto de valores de intensidad reales y no negativos (mosaico). El patrón de intensidad de entrada resultante se introduce en la red difractiva incoherente. A la salida, se sintetiza un elemento vectorial de valor complejo a partir de un conjunto predefinido de píxeles de intensidad (demosaicing). (b) Aplicación de encriptación de imágenes. Las letras "U" y "C" se codifican en la amplitud y la fase de una imagen compleja, que se codifica digitalmente y, a continuación, se descodifica utilizando la red difractiva espacialmente incoherente. La imagen compleja descifrada coincide muy bien con la imagen original.
Crédito de la imagen: Ozcan Lab @ UCLA.
Véase el artículo:
Xilin Yang, Md Sadman Sakib Rahman, Bijie Bai, Jingxi Li y Aydogan Ozcan, "Complex-valued universal linear transformations and image encryption using spatially incoherent diffractive networks", Advanced Photonics Nexus (2023) https://doi.org/10.1117/1.APN.3.1.016010.