Ganó un concurso de arte con una obra hecha por una inteligencia artificial, y se metió de lleno en una polémica de alto vuelo
Fuente: La Nación ~ ¿Cómo se define la autoría de una obra de arte cuando intervino un algoritmo en la mayor parte de su generación? El debate que abren las varias herramientas que hay para crear imágenes a partir de descripciones.
Jason Allen participó en un concurso de la Feria Estatal de Colorado, en la sección bellas artes, en la categoría “Artes digitales / fotografía digitalmente manipulada”, que permite la presentación de imágenes retocadas digitalmente más allá de una corrección menor o una calibración de colores o iluminación hechas con Photoshop o algo similar, para mostrar algo imposible, una composición que esté claramente intervenida por la mano humana.
Allen usó una herramienta de moda llamada Midjourney, que permite generar una imagen a partir de una descripción hecha en texto, ganó el concurso, y generó una controversia que da la vuelta al mundo: ¿califica como una imagen manipulada por software, cuando todos los pixeles de la imagen fueron elegidos por un algoritmo? ¿Alcanza con que haya sido él quien hizo la elección de las palabras que dispararon, en ese software, la generación de la imagen ganadora, para darle el premio?
TL;DR — Someone entered an art competition with an AI-generated piece and won the first prize.
Yeah that’s pretty fucking shitty. pic.twitter.com/vjn1IdJcsL— Genel Jumalon ✈️ Nan Desu Kan (@GenelJumalon) August 30, 2022
Es, por lejos, uno de los temas más discutidos por estos tiempos, ya que se trata de una herramienta que está llegando lentamente a las manos del público en general, y que para muchos significa el fin de los ilustradores y los bancos de imágenes, cuando se puede tener cualquier composición que se pueda soñar con solo describirla.
Inteligencias artificiales para crear imágenes desde textos
Lo último en tecnología, para divertirse, ilustrar informes, trabajos prácticos o incluso notas como esta, son robots que pueden “dibujar” lo que queremos a partir de órdenes simples.
Lo único que hace falta es imaginación. Un osito cariñoso peleando con un dragón. Darth Vader tomando mate en el glaciar Perito Moreno. Una mariposa volando con un hobbit que lleva un anillo, una daga y un libro. Lo que se nos ocurra tiene que ser ingresado en texto para que una inteligencia artificial -o dicho de otra forma, un robot programado para hacer esta tarea- nos haga un dibujo.
El más conocido es DALL-E 2, lanzado este año como un experimento de la compañía OpenAI, para crear imágenes “originales y realistas”, combinando diferentes estilos o características, a partir de texto. Faltó aclarar que podemos hacer que las creaciones tengan un estilo renacentista, surrealista, cubista o lo que se nos ocurra.
La idea surgió por el recurso inverso: los robots primero empezaron a catalogar imágenes para pasarlas a texto -algo habitual en buscadores como Google, que intentan “entender” lo que hay en una foto. Hasta que a alguien se le ocurrió hacerlo al revés: con una biblioteca cuasi infinita, crear imágenes desde texto.
Con el tiempo surgieron muchos otros robots dibujantes. Google lanzó IMAGEN, basado en el Transformador de transferencia de texto a texto (T5), que había sido presentado en 2020, pero ahora fue orientado a la creación de imágenes. Aseguran que tiene un nivel de detalle más preciso que otras, como DALLE-2.
Una de las más recientes es Midjourney, que crea imágenes en alrededor de un minuto. Lo interesante es que su versión beta ya es pública, cualquiera la puede probar, y se puede integrar a Discord. Por ahora dan 25 imágenes sin costo, y si queremos más habrá que suscribirse por 10 dólares al mes que dan acceso a 200 imágenes
En junio de 2022 las revistas The Economist y Cosmopolitan usaron esta tecnología para crear una imagen para sus portadas. ¿Fue fácil? Según explicaron no, pero a mayor nivel de detalle en el texto, más “acertado” será el resultado que entregue la Inteligencia Artificial.
https://www.instagram.com/reel/CfEwohiJdXW/embed/captioned/?cr=1&v=14&wp=540&rd=https%3A%2F%2Fwww.lanacion.com.ar&rp=%2Ftecnologia%2Fgano-un-concurso-de-arte-con-una-obra-hecha-por-una-inteligencia-artificial-y-se-metio-de-lleno-en-nid02092022%2F#%7B%22ci%22%3A3%2C%22os%22%3A8491%2C%22ls%22%3A1215%2C%22le%22%3A4194%7D
Cómo funcionan y para qué sirven las IA que dibujan
Los bots, con órdenes en texto, crean dibujos que pueden ser incluso de estilo realista, para parecer fotos. Estas Inteligencias artificiales estudian millones de imágenes para entender la relación entre lo que se ve y el texto que las describe. Si nosotros escribimos “playa”, buscará en su base de datos fondos de playa y usará el que le parezca más adecuado. Si en el mismo texto ponemos “Yoda” también hará lo mismo por el maestro Jedi de Star Wars. Si la orden dada en texto era “Yoda en la playa tomando sol”, buscará opciones en su amplia base de datos para crear la imagen solicitada. Cuanto más detalle tenga la orden, más preciso será el resultado.
Usar estos sistemas no es sencillo. En realidad, lo que no es fácil es acceder a las plataformas o programas. Muchos están en modo beta, de pruebas. Otros se usan por invitación. Y algunos simplemente están sobrecargados por los infinitos pedidos. Pero si logramos acceder a ellos solamente tenemos que escribir una oración con la imagen que queremos para que el robot la haga. La descripción puede ser corta, como “chica tomando un café” o larga, como “un periodista escribiendo una nota en una computadora en un edificio cerca del río al atardecer mientras las olas golpean contra un muelle y el sol ilumina el agua mientras los peces se asoman”.
Para evitar confusiones, hace poco Dall-E lanzó un manual, que en su primera página aclara que “todo lo que vean no es real: las fotos no son fotos reales, las pinturas no son pinturas reales y las personas, lugares o gente no existen. Todo fue creado por una Inteligencia Artificial”.
¿Para qué sirven estos bots? Además de para jugar, crear lo que se nos ocurra o hacerlo viral en Twitter, estos dibujos tienen otros usos. Muchos medios, por ejemplo, están usando las creaciones para ilustrar artículos periodísticos. Esta nota usa de apertura una imagen creada por una inteligencia artificial.
También en TikTok
TikTok también lanzó hace poco una función interesante: un creador de “fondos” virtuales, AI Green Screen, para usar en sus contenidos. De esta forma podemos introducir algunas palabras o frases, como “atardecer en la torre Eiffel” o “superficie de Marte surrealista y con Gremlins saltando por todas partes” para que la IA lo arme y lo usemos en nuestro video corto. Simple, efectivo y, muchas veces, divertido.
Si queremos usar Midjourney tenemos que unirnos al servidor en este link, ir al “Newcomer Room” y escribir lo que queramos crear -en inglés- poniendo antes el comando “/imagine” (de imaginar). El bot nos dará cuatro imágenes diferentes y tendremos la opción de pedirlas en más resolución, o de solicitar alguna versión alternativa si no es exacto lo que esperábamos.
Selfie de Jon Snow en «La Batalla de los Bastardos» #midjourney pic.twitter.com/2XpxyGbFeR— Inti Acevedo (@inti) August 19, 2022
El problema de los bots: racismo y sexismo
Los sistemas automatizados se basan en algoritmos para sus creaciones. La falla, que ya fue reconocida en la plataforma Dall-E, es que tiene sesgos de las personas que las crearon. Algunos ejemplos que ya fueron expuestos: al poner ciertos trabajos, se inclina por dibujar a hombres blancos. En cambio si se le pide algo “sexy” se inclinan por crear ilustraciones de mujeres.
La falla es que con las órdenes en inglés muchas veces no se hace referencia al género del protagonista del dibujo. Pero Dall-E parece elegir siempre a personas de un mismo género para ciertas categorías. Esto pasó al pedir algo sexy, pero también con otras palabras claves como “asistente”: siempre elige personajes femeninos
La propia plataforma, OpenIA, aclara debajo de cada dibujo, en una pestaña llamada “Sesgos y limitaciones”, que todavía no pudieron evitar que la Inteligencia Artificial reproduzca estos estereotipos machistas y patriarcales, porque son parte de la base de imágenes de las que “aprendió” a dibujar. Están intentando pulir los datos, pero hasta ahora no tuvieron éxito. Lo mismo pasa con el racismo: la computadora suele dibujar personas blancas. Es una visión occidental, y católica, creada justamente por programadores que también son blancos.