The Independent Sentinel #52
Una línea temporal, un premio a la inteligencia y el umbral de la imitación
¡Hola! Mi nombre es Javier Fuentes y estás leyendo una nueva edición de The Independent Sentinel, la newsletter sobre Inteligencia Artificial en la que además de hablar del presente y el futuro, hablamos del pasado para entender todo lo que está ocurriendo.
Si quieres que cada nueva edición te llegue al correo, puedes suscribirte aquí:
Hoy hablamos de programación asistida, de la medida de la inteligencia y de un pintor que vendió un solo cuadro a lo largo de su vida.
¡Arrancamos! 🏇
1. Tendencias 📈
💻 Programando sin programar
Si llevas siguiendo desde hace algún tiempo esta publicación, te habrás dado cuenta de que hablo muy a menudo (tal vez demasiado) sobre la velocidad a la que todo está ocurriendo.
Supongo que es algo que deja de asombrarme debido a lo malos que somos los humanos entendiendo el crecimiento exponencial. En las últimas semanas, he estado hablando bastante sobre los orígenes y la evolución de la IA y por ello me he decidido a hacer un breve recorrido por los hitos tecnológicos de las últimas décadas que nos han traído hasta aquí.
Creo que es útil ya que, al menos para mí, conocer el origen de las cosas me ayuda a entenderlas mucho mejor. Por ello, me puse a elaborar una lista de hitos relevantes en la evolución de la IA con el fin de hacer un breve recorrido en esta primera sección de esta edición.
Como siempre, me iba a poner a hacer a mano una infografía pero, para esta ocasión, quería algo más interactivo y “navegable”. En esta situación vi que era un momento idóneo para probar algo que llevaba algún tiempo deseando probar: ¿Por qué no programar esta infografía usando la ayuda de un agente de IA?
El reto: hacer todo sin programar o editar ni una sola línea de código.
La herramienta: Los nuevos Replit Agents
El objetivo: Crear un timeline interactivo con los principales hitos en el desarrollo de la IA
Déjame que te describa el proceso completo y mi experiencia desarrollando por primera vez un aplicativo (sencillo) desde cero usando Replit y su nuevo agente.
Prompt inicial
El prompt inicial fue tan sencillo como definir brevemente la aplicación que quería construir y adjuntar un fichero con los hitos (que previamente había generado con ChatGPT):
“I want to make an interactive timeline with these milestones about AI history”
Sólo con esto, el agente de Replit comienza a planificar de forma mágica los pasos a seguir para construir la aplicación. Es realmente impresionante ver cómo va creando la estructura de ficheros para crear la aplicación:
Sin decirle nada, ha decidido usar HTML, CSS y JS para el front y python con el framework Flask para el back.
Tras generar la estructura, el agente empieza la programación en cada uno de los ficheros, dando lugar a una primera versión de esta sencilla aplicación:
Refinamiento
Después de este primer prototipo, me dediqué a ir proponiendo cambios y mejoras, siempre mediante prompt y sin añadir o modificar ni una sola línea de código por mi parte. Esta parte requirió de diversas iteraciones para ir ajustando el resultado a lo que tenía en mente.
Despliegue
Cuando ya estaba todo hecho, quedaba la parte final: el despliegue. Y sí, el agente de Replit es capaz de preparar el aplicativo para su despliegue y puesta en funcionamiento al menos para una web sencilla como en este caso.
Debo decir que esperaba que todo fuese ya fluido en este caso y, sin embargo, hacer que que todo funcionase bien en producción, me requirió varios prompts adicionales para ir probando opciones.
Reflexiones finales
El prototipado ha cambiado para siempre, crear primeras versiones de una aplicación nunca ha sido tan fácil y, lo que es más importante, solo será más y más fácil a partir de ahora. Los de hoy, son los peores agentes que tendremos jamás.
Hacer cambios sobre el prototipo es más o menos sencillo. El agente es capaz de interpretar correctamente lo que se le pide y trasladarlo a código de manera eficaz. Dos notas:
Al implementar algunas funcionalidades rompe otras, así que es bueno indicar que se desarrolle esa funcionalidad dejando el resto como está.
Me ha fascinado la capacidad del agente de tomar un “pantallazo” del resultado en el Webview para poder autoevaluar su desempeño. Brutal.
La parte del despliegue ha sido la parte más tediosa, preparar todos los ficheros fuente para su despliegue ha sido un proceso un poco desesperante por los continuos cambios y errores encontrados. ¡Y eso que era una simple web estática!
Supongo que estarás deseando ver cómo ha quedado la prueba, puedes verlo clickando en la imagen.
Tras este experimento, he estado indagando sobre otras alternativas de desarrollo y estas son las conclusiones que he podido recabar respecto a los 4 principales productos de desarrollo asistido:
Esta pequeña prueba que he realizado constata lo que vengo diciendo desde hace meses. La IA generativa, ya sea en formato modelo o agente es fantástica para la creación de prototipos, pero encuentra dificultades aún cuando queremos construir sistemas complejos, robustos, customizados, seguros y escalables.
Este es, sin duda, el reto que queda por abordar, ir de la idea la puesta en producción de manera sencilla y sin fricción. Estoy seguro de que se conseguirá, pero es necesario manejar las expectativas, que algo funcione en un prototipo, no quiere decir que lo vaya a hacer en un desarrollo final.
🏆 El premio ARC
Desde los orígenes de la IA moderna, ha habido una pregunta que nos hemos hecho recurrentemente: ¿Cuándo llegaremos a la Inteligencia Artificial General (AGI)?
Con el tremendo impulso que ha tomado la Inteligencia Artificial, vemos que este hito podría estar cada vez más cerca y esta pregunta cobra más relevancia cada día.
Parece ahora que lo más importante no es tanto si llegaremos a la AGI, sino cómo sabremos si hemos alcanzado la AGI
La definición consensuada de la AGI es algo como esto:
AGI: Sistema que puede automatizar la mayoría del trabajo económicamente valioso
Aunque ilustrativa, esta definición no parece ser la más adecuada para definir este hito, y esto es lo que justamente nos vino a explicar François Chollet, creador de la célebre biblioteca de funciones Keras, en su también célebre paper “On the measure of Intelligence”.
Para Chollet, los sistemas AGI serán aquellos que puedan adquirir nuevas habilidades para las que no han sido entrenados de manera eficiente o, de manera más formal:
The intelligence of a system is a measure of its skill-acquisition efficiency over a scope of tasks, with respect to priors, experience, and generalization difficulty.
- François Chollet, "On the Measure of Intelligence"
El propio François lo explica aquí:
En base a todo esto, Chollet creó el marco de referencia ARC-AGI (ARC corresponde a Abstraction and Reasoning Corpus) compuesto por tareas de entrenamiento y evaluación. Este es un ejemplo del tipo de ejercicio que debería poder resolver el modelo en evaluación:
El objetivo de ARC-AGI es comparar la inteligencia artificial con la humana para lo que provee a los modelos de un conocimiento inicial (“priors”) para que la competición sea justa. Por ejemplo, este lista de cosas sería conocimiento inicial que se le pasa a los modelos ya que es una información que todos los humanos ya hemos adquirido desde niños:
Objectness
Objects persist and cannot appear or disappear without reason. Objects can interact or not depending on the circumstances.Goal-directedness
Objects can be animate or inanimate. Some objects are "agents" - they have intentions and they pursue goals.Numbers & counting
Objects can be counted or sorted by their shape, appearance, or movement using basic mathematics like addition, subtraction, and comparison.Basic geometry & topology
Objects can be shapes like rectangles, triangles, and circles which can be mirrored, rotated, translated, deformed, combined, repeated, etc. Differences in distances can be detected.
Esta competición arrancó en 2019, la fecha de la publicación del paper de Chollet y desde entones, el concurso se ha hecho mas y más conocido. A día de hoy, ya se ha creado el ARC Prize 2024 con un premio para el ganador de más de un millón de dólares.
A día de hoy, ningún modelo ha superado la prueba. Ningún modelo ha llegado a alcanzar 85% necesario para considerar la prueba como superada.
Sorprendentemente, incluso el modelo o1 de OpenAI con capacidades avanzadas de razonamiento, no ha estado a la altura de las expectativas, consiguiendo un modestísimo 21%.
¿Llegaremos a tener modelos capaces de superar la prueba ARC-AGI? Si los tuviésemos, ¿cuándo ocurrirá esto? Nadie tiene una respuesta para esto pero lo que es seguro, es que estamos hoy más cerca de lo que hemos estado nunca.
2. Historias 📔
🎼 ¿Quieres banda sonora? ¡Dale al Play!
👨🏻🎨 Los orígenes del artista
Vincent Van Gogh nació en Marzo de 1853 en Groot-Zundert, un pequeño pueblo católico de los Países Bajos. Vincent era el mayor de 6 hermanos en una familia acomodada muy religiosa y siempre tuvo una relación muy cercana con uno de sus hermanos: Theo.
Después de estudiar teología, Vincent desempeñó muy variados trabajos, fue misionero evangelista, predicador, comerciante de arte profesor y librero, sin que lograse durar demasiado en ninguno de estos trabajos
Sin embargo, a los 27 años su vida tomo un giro radical y focalizó toda su energía en el dibujo y la pintura.
¿El resultado? Ser considerado a día de hoy como uno de los artistas más relevantes e influyentes de la historia.
💡 Un genio atormentado
Van Gogh no era una persona feliz. Durante toda su vida sufrió problemas de salud mental y su vida se vio marcada por la pobreza, la soledad y la incomprensión. Pese a todo, esto no le impidió buscar y representar la belleza del mundo que le rodeaba a través de sus obras.
Tras decidir dedicarse completamente a la pintura en 1880, el arte se convirtió a la vez en su refugio y vía de escape frente a su vida.
Creó sus primeros óleos ya en 1882 y, en 1885 pintó la que sería su primera obra maestra, “Los comedores de patatas”, obra inspirada en su etapa como predicador en una zona minera de Holanda.
Después de sus primeros años como pintor, en 1886 se mudó a Paris junto con su hermano Theo, que le había estado financiado durante todo este periodo.
Allí conoció e hizo buenas migas con con artistas con Degas, Gauguin, Toulouse-Lautrec o Pisarro y comenzó a mejorar y a transformar su técnica pictórica.
Se podría decir que esta etapa en París fue la más feliz de su vida, aunque la felicidad era algo bastante esquivo para Vincent.
Ya en 1888, Vincent se mudó al sur de Francia en busca de una vida más tranquila, dónde compartió taller con Gauguin y pintó su famosa serie de girasoles.
🎨 Un creador prolífico
Pese a pintar durante solo 10 años, desde los 27 años hasta su prematura muerte a los 37, Van Gogh fue uno de los pintores más prolíficos de la historia.
Van Gogh pintó más de 900 cuadros y muchos más dibujos y esbozos. Haciendo los números, vemos que, durante esta década, creó una obra cada 36 horas 🤯
Su obra no se reduce a pinturas y dibujos, sino que también fue prolífico en la faceta epistolar, ya que escribió multitud de cartas y postales, principalmente dirigidas a su hermano Theo al que escribía con frecuencia casi diaria.
La obra de Van Gogh es extensa y variada, dese sus inicios más oscuros y costumbristas, a su pintura más luminosa después de verse influenciado por los impresionistas y el arte japonés, estilo que culminó en su última época con sus obras más coloridas y vívidas.
Sin embargo, y pese a todo, su obra solo empezó a ser conocida y valorada después de su muerte.
🖼 El pintor que vendió un solo cuadro
Pese a sus orígenes acomodados, la pobreza fue una constante en la vida de Van Gogh. Durante gran parte de su vida sobrevivió gracias a la ayuda de su hermano y su dieta consistía principalmente en pan, café y alcohol.
Tal era la escasez en la que estaba inmerso que apenas podía permitirse contratar modelos para sus cuadros, por lo que se veía obligado a posar él mismo para su obras. Esta y no otra es la razón por la que se dispone de tantos autorretratos del artista holandés.
Otro “truco” que usaba para ahorrar, era pintar sobre lienzos ya pintados cuyo resultado no había sido de su agrado, así que es más que posible que haya obras debajo de las obras de Van Gogh.
Meses antes de su muerte, Van Gogh vendió el único cuadro que llegaría a vender en su vida. El cuadro era “El viñedo Rojo” y se vendió 1888 (poco antes de su muerte) por 400 francos (unos 20€ al cambio actual).
Para la historia queda la anécdota de que Van Gogh acabó cortándose una oreja después de una tremenda discusión con su compañero y amigo Gauguin. Se dice también que realmente se la corto Gauguin y que él dijo que se había autolesionado para evitarle problemas a su amigo.
En 1889, Van Gogh fue internado en un centro psiquiátrico debido a sus continuos problemas de salud mental y allí pintó algunas obras tan conocidas como la noche estrellada.
En ese centro estuvo recluido hasta que en 1890, acabara suicidándose con un disparo de escopeta en su pecho. Moriría dos días después, con unas últimas palabras dignas de la tristísima vida que tuvo: “The sadness will last forever’”
🪞 Imitando al genio
La obra de van Gogh ha sido tremendamente influyente para otros artistas y su trágica historia personal ha estado recurrentemente presente en el cultura popular, desde libros a canciones y películas.
Tan es así que la obra de Van Gogh ha sido imitada innumerables veces y ya no solo por humanos, sino también por máquinas, como es el caso de los modelos de difusión que, como sabemos, son capaces de imitar estilos y autores con una pasmosa precisión.
A este respecto, se publicaba recientemente un paper dedicado a entender el proceso de imitación que hacen los modelos de generación de imágenes Este es un asunto muy relevante ya que al alimentar a estos modelos para su entrenamiento con millones de imágenes, se podrían infringir leyes del copyright.
En la publicación, llamada “How Many Van Goghs Does It Take To Van Gogh? Finding the Imitation Threshold”, los autores se preguntan cómo estimar el número de imágenes mínimo necesario a partir del cual un modelo de difusión puede “imitar” un estilo o a un artista.
Los autores proponen en el paper un nuevo problema llamado FIT (Finding the Imitiation Threshold) y una metodología propia llamada MIMETIC2 para encontrar este “umbral de imitación”.
Según el estudio realizado en la publicación, este umbral de imitación se encuentra entre las 200 y 600 imágenes dependiendo del del tipo y modelo de obras. Esto implica que hacen falta este número de muestras de un estilo artístico o autor para que un modelo sea capaz de imitarlo.
Respondiendo a la pregunta del paper, harían falta entre 200 y 600 Van Goghs para que un modelo de generación de imágenes pudiese imitar su estilo
Estos hallazgos serán de una tremenda utilidad para resolver disputas sobre derechos de autor y propiedad intelectual a la hora de diseñar y usar modelos generativos.
El FIT es un buen ejemplo de los nuevos tipos de problemas que están apareciendo debido a la evolución de la IA y MIMETIC2 es un buen ejemplo de las soluciones que deberemos ir buscando.
Ojalá Van Gogh pudiese saber que ya no solo es que sea uno de los artistas más reconocidos e imitados del mundo sino que, además, es también objeto de imitación por parte de unas sofisticadas máquinas que son capaces de pintar como él. Estoy seguro de que esto le podría haber hecho, al menos, un poco más feliz.
¡Gracias como siempre por leer hasta aquí!
¿Te gusta The Independent Sentinel? ¡Ayúdame a llegar a más entusiastas de la IA!
Si tienes comentarios o quieres iniciar una conversación, recuerda que puedes hacerlo aquí.
Si te has perdido alguna edición de la newsletter o quieres volver a leerlas, puedes acceder a todas aquí.
Si quieres escuchar todas las canciones de The Independent Sentinel, echa un vistazo a esta lista de Spotify.
Me ha encantado el caso de uso con Replit Agent, mil gracias. Escuché hace unas semanas a Cesar Miguelanez hablar del producto en la tertulia de Itnig y ya me puso las expectativas altas. Veremos mucha evolución de este concepto en 2025 💪