Si una cosa se le está dando cada vez mejor a la inteligencia artificial es la generación de imágenes. Basándose en un modelo inicial las inteligencias artificiales actuales pueden generar una imagen similar, colorear o escalar a mayor resolución. Esto último es algo que la IA de Google hace muy bien, tanto que convierte fotografías totalmente pixeladas en fotografías de alta resolución.
Una investigación reciente del departamento de inteligencia artificial de Google muestra cómo los nuevos avances en este aspecto permiten crear increíbles imágenes. El modelo de aprendizaje automático de la compañía es capaz de tomar una foto sin apenas resolución y escalarla para conseguir detalles únicos.
Modelos de difusión
A la hora de escalar fotografías por inteligencia artificial existen diferentes métodos para conseguirlo. El utilizado por Google es uno llamado modelos de difusión. Se trata de un modelo generativo que comenzó a implementarse en 2015 pero ha sido recientemente cuando este enfoque ha sido de utilidad para Google.
Según explican, el sistema toma como entrada una imagen de baja resolución y a partir de ahí construye una imagen de alta resolución pro su cuenta. Para ello Google dice que primero han entrenado a la IA para bajar la resolución de las imágenes y hacerlas extremadamente pixeladas. A partir de ahí «aprende a revertir este proceso, comenzando por el ruido puro y eliminando progresivamente el ruido para alcanzar una distribución objetivo a través de la guía de la imagen de entrada de baja resolución»
Con este método Google consigue mejorar especialmente los retratos de personas. Sin embargo va un paso más allá y con una segunda IA es capaz de escalar aún más las fotografías. De resoluciones de 32 x 32 px es capaz de llegar hasta a 1024 x 1024 px. Para esto primero las transforma a 64 x 64 px y toma esa nueva fotografía como referencia para subir a 128 x 128 px, luego el proceso de nuevo y así hasta la resolución deseada.
Los resultados son sin duda espectaculares, permite crear fotografías genuinamente detalladas prácticamente de la nada. Si bien hay algunos errores mínimos (por ejemplo a la hora de generar las transparencias de las gafas), las fotografías pueden pasar por reales sin problema alguno. De hecho, si no se sabe el contexto probablemente una persona normal y corriente no identificaría que son escaladas por una IA.
¿El uso de esto? Efectivamente, mejorar fotografías tomadas por los usuarios es una aplicación directa y clara para esto. Por ejemplo para mejorar la resolución de las fotografías tomadas con cámaras móviles, que no siempre son las mejores. Sin embargo también puede ser de utilidad en otros sectores como la medicina para mejorar las fotografías médicas.
Vía | Business Insider
Más información | Google AI Blog