¿Es posible conseguir una imagen de buena calidad partiendo de una foto muy pequeña, borrosa o súper pixelada? Los investigadores de Brain Team, una división de Google dedicada a la inteligencia artificial, se propusieron conseguirlo, llegaron a resultados satisfactorios y compartieron los avances en un paper que detalla el funcionamiento de los sistemas propuestos.

Para convertir fotografías pixeladas en imágenes de alta resolución emplearon dos modelos: SR3, que refiere a un trabajo de súper resolución, y CDM, que apunta a la “difusión en cascada”.

“SR3 exhibe un gran rendimiento en tareas de superresolución con diferentes factores de aumento, en rostros e imágenes naturales”, dicen los investigadores en el estudio publicado. “Además, mostramos la eficacia de SR3 en la generación de imágenes en cascada, donde los modelos generativos están encadenados con modelos de superresolución”, añaden, indicando que el sistema entrega un rendimiento satisfactorio.

Ejemplos de cómo se va mejorando la imagen con SR3.

Los detalles del ingenio

El mencionado SR3 es un método dedicado a la “Súper Resolución de Imagen vía Refinamiento Repetido”. Detrás del concepto técnico encontramos un sistema que toma como entrada una foto de baja calidad y construye una de alta resolución “a partir de ruido puro”. La clave es la conformación de un elemento más completo, partiendo de información más escueta.

Esa tecnología opera de un modo singular: suma ruido a las imágenes, es decir, efectos no deseados, alteración de brillo y color, modificación de pixeles, etcétera. Una vez que la foto es irreconocible, el sistema invierte el proceso, elimina ese ruido y recrea la fotografía. Los investigadores indicaron que con este proceso partieron de imágenes pequeñas de 32 x 32 píxeles y las transformaron en fotos de 1024 x 1024 píxeles.

El siguiente paso es la mencionada tecnología CDM. En palabras de los especialistas de Google Brain, se trata de un “modelo de difusión condicional de clase, entrenado con datos de ImageNet para generar imágenes naturales de alta resolución”. ¿Cómo funciona? Comienza con un modelo de resolución baja y continúa con una secuencia de modelos que aumentan la calidad, de allí el concepto de “cascada”. En concreto, escala en forma gradual la resolución para conseguir el resultado final.

Tal como nota en Business Insider en su repaso sobre estos avances de la división de Google, aún no hay anuncios oficiales respecto a cómo estas tecnologías beneficiarán a los usuarios, es decir, de una eventual llegada de las tecnologías descritas a los servicios disponibles en el mercado.