La inteligencia artificial dibuja rostros humanos.

Algunas veces con los amigos he llegado bromear sobre el hecho de cuando el uso de estas herramientas se volverá tan natural que, mientras estemos en línea, no podremos distinguir entre si estamos interactuando con una persona real, de carne y hueso, o con un computador con la capacidad de interactuar con lenguaje natural y que pueda ser capaz de generar imágenes que simulen las gesticulaciones. Y el punto cae en que la realidad supera la ficción y que estos resultados pudieran ser obtenidos en el corto a mediano plazo.

Si bien el diseño digital ha sido un mercado que ha marcado tendencia por su relevancia dentro de las redes sociales, el día de hoy hay una nueva oportunidad de crecimiento en este sector con una nueva técnica de inteligencia artificial que es capaz de generar rostros humanos, y básicamente sería capaz de replicar cualquier tipo de imágenes.

Si tuviste dificultad para ubicar cuál de ellos es obra de un modelo de inteligencia artificial, tenemos que ser sinceros al decirte que todos son imágenes generadas por medio de redes neuronales, esto es obra de un equipo de Nvidia encargado de entrenar modelos de redes neuronales para la generación de imágenes artificiales (Articulo completo aquí) ¿increíble no?

Esta capacidad de hacer réplicas de imágenes de manera tan realista tiene distintas áreas de aplicación. ¿Te imaginas el poder tener fotografías generadas de manera artificial? sin necesidad de conseguir modelos y camarógrafos para las tomas. Sitios como Pixabay o Pexels ya no tendrán que depender de su comunidad de personas para generar nuevas imágenes, podrán tomar sus propias fotografías para que estas repliquen los gestos, caras y caracteristicas de las fotos con que están entrenando sus modelos para tener nuevo material.

Y aunque algunos consideran que esto puede representar un riesgo, la verdad es que las empresas pueden reducir costos amplios al poder tener de una manera más económica el tipo de imágenes que están buscando.

Algunas personas ya han empezado a experimentar con entrenamiento de imágenes como son gatos o edificios. Gracias a tensorflow, uno de los frameworks mas utilizados para machine learning, nos encontramos la librería pix2pix, la cual fue implementada en el sitio de Christopher Hesse, donde puedes realizar bocetos de gatos o edificios que después serán procesados para construir modelos realistas de las imágenes.

Y aunque los resultados no siempre parecieran naturales, tenemos que recordar que este sitio fue hecho en 2017, y en los últimos dos años la publicación de papers sobre técnicas similares ha crecido de manera exponencial. Hesse en su sitio muestra también cómo se pueden transformar bocetos de paisajes a imágenes que asemejan una fotografía digital, tarde o temprano estaremos conviviendo con exposiciones artísticas donde parte de las obras no serán hechas por artistas, si no por cientificos de datos e inteligencia artificial que habrán entrenado sus redes neuronales para pintar oleos.

La tecnología detrás de la generación de imágenes son las las redes adversariales generativas (GAN, por sus siglas en inglés) y es básicamente un arreglo matemático más complejo de las redes neuronales comunes donde interactúan a pares y de manera contraria para obtener resultados óptimos, mientras una red intenta generar una imagen de la nada, la otra intenta detectar si está imagen es verdaderamente buena para pasar por real.

Y no solo funciona para las imágenes, con este modelo también han sido realizados modelos para la generación de nuevos audios a partir del entrenamiento de una GAN, de manera que se tengan audios puros obtenidos a partir de una red neuronal.

Dentro de otros casos de uso podemos encontrarnos la mejora de los modelos de traducción de texto, conversión texto-voz y voz-texto, generación de imagenes cada vez más complejos que vayan más allá de un rostro humano.

Si bien aún hay mucho trabajo que hacer desde las áreas de investigación, la realidad es que desde 2014 el crecimiento de publicaciones relacionadas a este tema ha sido manera exponencial y con esto crecen las áreas de oportunidad para transferencia tecnológica dentro de las empresas. La siguiente imagen muestra la cantidad de papers publicados al respecto de las GAN.

Explosive growth — All the named GAN variants cumulatively since 2014. Credit: Bruno Gavranović

No les perdamos el ojo que ya sea para generar rostros humanos, audios u algún otro, sin duda las GAN seguirán asombrandonos los próximos años.

¿Puedes saber cuales de ellos fueron generados por computadora?

Pix2pix dibuja gatos y edificios.

Casos de uso para audio

La escalada de las GAN aun no termina.

COVID-19 Virtual Assistant helps in diagnose.

Las cocinas en la nube son la nueva tendencia en restaurantes.

Servicios

Recursos

Contacto