Las imágenes al estilo Studio Ghibli de ChatGPT muestran su poder creativo, pero generan nuevos problemas de derechos de autor

Si tenés sólo unos segundos, leé estas líneas:

En los últimos días, las redes sociales se inundaron de imágenes que parecen pertenecer a una película de Studio Ghibli, como El viaje de Chihiro.
Esto ocurrió tras la última actualización de ChatGPT por parte de OpenAI. La actualización mejoró significativamente las capacidades de generación de imágenes de ChatGPT, permitiendo a los usuarios crear imágenes convincentes al estilo Ghibli en tan solo unos segundos.
Los sistemas de inteligencia artificial generativa (IA) como ChatGPT se entienden mejor como “motores de estilo”. Y lo que estamos viendo ahora es que estos sistemas ofrecen a los usuarios más precisión y control que nunca. Pero esto también está planteando nuevas preguntas sobre los derechos de autor y la propiedad creativa.

Las redes sociales se han inundado recientemente de imágenes que parecen pertenecer a una película de Studio Ghibli. Selfies, fotos familiares e incluso memes han sido reimaginados con la suave paleta de colores pastel característica de la famosa compañía de animación japonesa fundada por Hayao Miyazaki.

Esto ocurrió tras la última actualización de ChatGPT por parte de OpenAI. La actualización mejoró significativamente las capacidades de generación de imágenes de ChatGPT, permitiendo a los usuarios crear imágenes convincentes al estilo Ghibli en tan solo unos segundos. Ha sido enormemente popular, tanto que el sistema colapsó debido a la alta demanda de los usuarios.

Los sistemas de inteligencia artificial generativa (IA) como ChatGPT se entienden mejor como “motores de estilo”. Y lo que estamos viendo ahora es que estos sistemas ofrecen a los usuarios más precisión y control que nunca.

Pero esto también está planteando nuevas preguntas sobre los derechos de autor y la propiedad creativa.

Cómo crea imágenes el nuevo ChatGPT

Los programas de IA generativa funcionan produciendo resultados en respuesta a las solicitudes de los usuarios, incluidas las solicitudes para crear una imagen.

Las generaciones anteriores de generadores de imágenes de IA utilizaban modelos de difusión. Estos modelos refinaban gradualmente datos aleatorios y ruidosos hasta convertirlos en una imagen coherente. Pero la última actualización de ChatGPT utiliza lo que se conoce como un “algoritmo autoregresivo”.

Este algoritmo trata las imágenes más como un lenguaje, descomponiéndolas en “tokens”. Así como ChatGPT predice las palabras más probables en una oración, ahora puede predecir diferentes elementos visuales en una imagen por separado.

Esta tokenización permite que el algoritmo separe mejor ciertos elementos de una imagen y su relación con las palabras en una solicitud. Como resultado, ChatGPT puede crear imágenes con mayor precisión a partir de solicitudes específicas de los usuarios que las generaciones anteriores de generadores de imágenes. Puede reemplazar o cambiar características específicas mientras conserva el resto de la imagen, y mejora el problema de largo tiempo de generar texto correcto en las imágenes.

Una ventaja particularmente poderosa de generar imágenes dentro de un modelo de lenguaje grande es la capacidad de aprovechar todo el conocimiento ya codificado en el sistema. Esto significa que los usuarios no necesitan describir cada aspecto de una imagen con doloroso detalle. Pueden simplemente referirse a conceptos como Studio Ghibli, y la IA entiende la referencia.

La reciente tendencia de Studio Ghibli comenzó con OpenAI, antes de difundirse entre ingenieros de software de Silicon Valley y luego incluso gobiernos y políticos, incluidos usos aparentemente improbables como la Casa Blanca creando una imagen “Ghiblificada” de una mujer llorando siendo deportada y el gobierno de la India promoviendo la narrativa del Primer Ministro Narendra Modi de una “Nueva India”.

Entendiendo la IA como “motores de estilo”

Los sistemas de IA generativa no almacenan información en un sentido tradicional. En su lugar, codifican texto, hechos o fragmentos de imágenes como patrones o “estilos” dentro de sus redes neuronales.

Entrenados con grandes cantidades de datos, los modelos de IA aprenden a reconocer patrones a múltiples niveles. Las capas inferiores de la red pueden capturar características básicas como las relaciones entre palabras o texturas visuales. Las capas superiores codifican conceptos más complejos o elementos visuales.

Esto significa que todo – objetos, propiedades, géneros de escritura, voces profesionales – se transforma en estilos. Cuando la IA aprende sobre el trabajo de Miyazaki, no está almacenando fotogramas reales de Studio Ghibli (aunque los generadores de imágenes a veces pueden producir imitaciones cercanas de imágenes de entrada). En cambio, está codificando la “Ghibli-idad” como un patrón matemático, un estilo que puede aplicarse a nuevas imágenes.

Lo mismo ocurre con plátanos, gatos o correos electrónicos corporativos. La IA aprende la “banana-idad”, “gato-idad” o “correo corporativo-idad”, patrones que definen lo que hace que algo sea reconociblemente un plátano, un gato o una comunicación profesional.

La codificación y transferencia de estilos ha sido durante mucho tiempo un objetivo expreso en la IA visual. Ahora tenemos un generador de imágenes que lo logra con una escala y control sin precedentes.

Este enfoque desbloquea posibilidades creativas notables tanto en texto como en imágenes. Si todo es un estilo, entonces estos estilos pueden combinarse y transferirse libremente. Es por eso que nos referimos a estos sistemas como “motores de estilo”. Intenta crear un sillón en el estilo de un gato o en estilo élfico.

La controversia sobre los derechos de autor: cuando los estilos se convierten en identidad

Aunque la capacidad de trabajar con estilos es lo que hace que la IA generativa sea tan poderosa, también está en el centro de la creciente controversia. Para muchos artistas, hay algo profundamente inquietante en ver que sus enfoques artísticos distintivos se reducen a solo otro “estilo” que cualquiera puede aplicar con un simple texto de solicitud.

Hayao Miyazaki no ha comentado públicamente sobre la reciente tendencia de que las personas utilicen ChatGPT para generar imágenes al estilo de su famosa animación. Pero él ya ha sido crítico con la IA anteriormente.

Todo esto también plantea nuevas preguntas sobre los derechos de autor y la propiedad creativa.

Tradicionalmente, la ley de derechos de autor no protege los estilos, solo expresiones específicas. No puedes registrar los derechos de autor de un género musical como el “ska” o un movimiento artístico como el “impresionismo”.

Esta limitación existe por una buena razón. Si alguien pudiera monopolizar un estilo entero, eso sofocaría la expresión creativa de todos los demás.

Pero hay una diferencia entre estilos generales y aquellos altamente distintivos que se vuelven casi sinónimos de la identidad de alguien. Cuando una IA puede generar trabajos “al estilo de Greg Rutkowski” – un artista polaco cuyo nombre se reportó haber sido utilizado en más de 93,000 solicitudes en el generador de imágenes de IA Stable Diffusion – esto podría amenazar tanto su sustento como su legado artístico.

Algunos creadores ya han tomado medidas legales.

En un caso presentado a finales de 2022, tres artistas formaron una clase para demandar a varias compañías de IA, argumentando que sus generadores de imágenes fueron entrenados con sus obras originales sin permiso, y ahora permiten a los usuarios generar trabajos derivados que imitan sus estilos distintivos.

A medida que la tecnología evoluciona más rápido que la ley, se están realizando esfuerzos para desarrollar nueva legislación que intente equilibrar la innovación tecnológica con la protección de las identidades creativas de los artistas.

Cualquiera que sea el resultado, estos debates resaltan la naturaleza transformadora de los motores de estilo de la IA, y la necesidad de considerar tanto su potencial creativo sin explotar como protecciones más matizadas para los estilos artísticos distintivos.

Esta nota fue originalmente publicada por The Conversation el 01/04/2025.

Temas

Recursos utilizados

Parte de este texto fue escrito por Chequeado con asistencia de herramientas de inteligencia artificial (IA) y supervisión de nuestros editores.

Comentarios

Marcelo Otero11 de abril de 2025 a las 10:27 pmLos dibujantes estamos viendo la posibilidad de que se prohíba el uso de estilos a los sistemas de IA generativa, ya que la ley se lo permite a los humanos, pero las máquinas no tienen esos derechos por no ser sujetos, además plagian los estilos ya que no razonan, solo copian y procesan, (actividad que también es ilegal), y eso altera el espíritu de la ley que es promover el desarrollo de corrientes artísticas para el bien de todos, la IA, como lo vimos en estos días con estudio Ghibli, extermina al creador del estilo y a sus posibles seguidores inundando de copias y copias hasta el agotamiento y fastidio.

Valoramos mucho la opinión de nuestra comunidad de lectores y siempre estamos a favor del debate y del intercambio. Por eso es importante para nosotros generar un espacio de respeto y cuidado, por lo que por favor tené en cuenta que no publicaremos comentarios con insultos, agresiones o mensajes de odio, desinformaciones que pudieran resultar peligrosas para otros, información personal, o promoción o venta de productos.

Muchas gracias