Milagro (sustantivo masculino)
Hecho no explicable por las leyes naturales y que se atribuye a una intervención sobrenatural de origen divino.
Suceso o cosa rara, extraordinaria y maravillosa.
Déjame que te hable hoy de un milagro, de un milagro compuesto de muchos otros milagros y que tiene como origen algo tan común, abundante y sencillo como un grano de arena.
Mi nombre es Javier Fuentes y este es el monográfico con el que cerramos este increíble 2024 en The Independent Sentinel. ¡Arrancamos!
🎼 Quieres banda sonora? ¡Dale al Play!
⏳ Dioses de Arena
📖 Índice
Testigos del tiempo
Divinidades arenosas
La nueva alquimia
Catedrales
La llegada de la luz
Dioses de arena
🕰 1 Testigos del tiempo
Este número es grande. Muy grande. Tan grande que es comparable a la cantidad estimada de estrellas en el universo observable.
Este número no es otro que la estimación de los granos de arena que hay en la tierra y que correspondería a un volumen de 605 millones de kilómetros cúbicos, equivalente a 80000 montes Everest o al volumen de 605 billones de estadios de fútbol.
Cada uno de estos granos de arena puede tener millones de años de antigüedad, tras recorrer trayectos inimaginables: desde las montañas hasta los ríos y, desde ahí, a las profundidades del océano. La arena existía mucho antes que nosotros y su omnipresencia en playas, ríos y desiertos la ha convertido en protagonista de mitos e historias, además de simbolizar, desde hace siglos, el inexorable paso del tiempo.
La arena es tan común y abundante que hemos olvidado que estos fragmentos sueltos de rocas, minerales o exoesqueletos de animales marinos de dónde extraemos el sílice (óxido de silicio), se convirtieron hace décadas un elemento indispensable para nuestro progreso científico y tecnológico.
El silicio extraído de la arena es uno de los pilares fundamentales del progreso humano, nos ha llevado desde la creación de radios rudimentarias hasta la inteligencia artificial y el Big Data, posicionándose como el motor de la civilización moderna.
En este monográfico te invito a un viaje que nos llevará desde la arena hasta la inteligencia y, como siempre, comenzaremos por el principio.
🏛 2 Divinidades arenosas
Siempre hemos conocido la arena. En particular, aquellas civilizaciones establecidas en las regiones más áridas y desérticas del mundo han tendido a desarrollar creencias en deidades relacionadas con la arena y el calor extremo.
Tomemos como ejemplo al Dios egipcio Seth, Dios del caos, las tormentas y la violencia en las tierras desoladas alejadas del fértil Nilo.
Seth, hijo de Geb (Tierra) y Nut (Cielo), hermano de Osiris y tío de Horus, era visto como el señor de las dunas. Seth se asociaba con las tormentas de arena y protector de faraones y, debido a la hostilidad del clima desértico, Seth era considerado como uno de los dioses principales en la cultura egipcia.
Y no solo hay dioses relacionados con la arena en zonas cercanas a desiertos, en el folclore europeo existe el arquetipo tradicional del “Hombre de Arena”, un ser que induce el sueño arrojando polvo o arena mágica en los ojos de las personas haciendo alegoría al picor en los ojos que sentimos cuando vamos a dormir.
Cabe destacar en este sentido la obra The Sandman del genial Neil Gaiman que, usando el personaje de Morfeo (dios del sueño) creó una de las series más ambiciosas de la historia del cómic con un conjunto de historias que mezclan de manera magistral las mitologías clásica y moderna.
![The Sandman - A Neil Gaiman le gustaría hacer una serie del cómic The Sandman - A Neil Gaiman le gustaría hacer una serie del cómic](https://substackcdn.com/image/fetch/w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fa229ef81-2058-40fd-a0e3-e349fb7c3a13_3840x2160.jpeg)
No sabría decirte cuál es mi película ni mi canción favorita pero, sin embargo, sí que podría decirte sin duda cuál es mi cómic favorito. Es The Sandman y a mucha distancia de todos los demás.
Y cómo no hablar de las deidades del desierto en el Dune de Frank Herbert, “Shai-Hulud”, “Viejo del Desierto” o “Hacedor”, todos nombres por los que se conoce a los gigantescos gusanos en esta fantástica novela.
Como ves, la arena ha venido apareciendo de manera recurrente en la cultura popular como un entorno hostil o simbólico y las divinidades ligadas a ella encarnan conceptos más amplios como el sueño, la muerte, el desierto, la sequía o la frontera entre la vida civilizada y lo salvaje.
Pero faltaba un concepto ligado a la arena que nunca se había tratado: la inteligencia.
⚗️ 3 La piedra filosofal
La ciencia no siempre fue tal como la conocemos hoy. Sus raíces se remontan a disciplinas “protocientíficas” como la alquimia, practicada en China, India, el mundo islámico y Europa. Los alquimistas investigaban la naturaleza de los materiales y sus transformaciones, con objetivos que trascendían la química actual e incluían la espiritualidad.
Entre sus finalidades principales se incluían:
La transmutación de metales en oro o plata (sobre todo, convertir plomo en oro).
La búsqueda de la piedra filosofal, una sustancia mítica capaz de facilitar la transmutación de metales y, supuestamente, otorgar la inmortalidad o la curación total.
La elaboración de un “elixir de la vida” que permitiera prolongar la existencia humana.
Sin embargo, la alquimia no se limitaba a la química en su concepción actual; mezclaba ideas filosóficas, religiosas, astrológicas y espirituales.
Aunque no lo parezca, existe un paralelismo del proceso usado por los alquimistas con la fabricación de los microchips que están impulsando la inteligencia sintética ya que en ambos casos, y salvando las diferencias, estamos en un proceso de descubrimiento que tendrá eventuales tintes existenciales:
¿Será la inteligencia artificial la piedra filosofal que siempre hemos buscado?
Intentemos entender el proceso mágico desde la arena hasta un microchip moderno.
⛏ Extracción y purificación
Cuando caminamos sobre la arena estamos andando sobre silicio. Pero no un silicio puro, sino un silicio contaminado por otros elementos. Partiendo desde un simple grano de arena comienza un camino de purificación extrema.
El primer paso consiste en separar el Silicio del Oxígeno presente en el SiO₂ usando carbono. Para ello, se usan hornos de arco eléctrico a 1500-2000 °C con los que se consigue el llamado “silicio metalúrgico” que pese a tener un 99% de pureza no es ni de lejos apto para su uso en la fabricación de semiconductores o placas solares.
Más adelante, y tras un proceso de destilación, tiene lugar el llamado “Proceso Siemens” en el que se descompone el SiHCl₃ obtenido en la destilación en silicio elemental, que se deposita sobre barras de polisilicio.
En este punto del proceso ya estamos hablando de purezas aptas para la microelectrónica (1 p.p.m.) y usos fotovoltaicos (10 p.p.m.). Cuando hablamos de p.p.m. (partes por millón)estamos hablando de un solo átomo impuro en un millón de ellos.
Obviamente, nada de esto es gratis, el coste energético de este proceso es más que elevado, siendo de más 100 kWh por kg producido.
Estas barras de polisilicio, una vez cortados se convertirán en la materia prima de la siguiente etapa: La creación de “obleas”.
🫓 Obleas
Las “obleas” o “wafers” son el siguiente paso en este sofisticado proceso productivo. Estos lingotes o barras monocristalinas se cortan en finas obleas (wafers) con un grosor del orden de cientos de micrómetros.
Lo complejo de este apartado, además del coste, es la perfección que deben tener estas obleas. Para ello, se pulen hasta tener una superficie perfectamente lisa y libre de defectos. Por si fuese poco, se someten a limpiezas químicas para asegurar la máxima pureza superficial. Como ves, es un proceso en el que se sigue persiguiendo esa pureza extrema.
¿Cómo se pueden crear circuitos integrados sobre estos impolutos cristales? Conozcamos en qué consiste la litografía.
🪨 Litografía
Etimológicamente, litografía significa “escribir sobre las rocas” algo que, por otra parte hemos venido haciendo desde 1796 cuando un dramaturgo alemán decidió crear un nuevo método para grabar sus obras ya que no encontraba ningún editor para hacerlo.
En nuestro caso, la litografía tiene que ver con escribir sobres estas obleas. Y no me refiero a escribir textos y trazar imágenes, sino a dibujar circuitos electrónicos sobre varias capas dieléctricas, conductoras y semiconductoras dispuestas sobre las obleas. A este proceso le llamaos fotolitografía o litografía óptica.
Lo más impresionante de esta fase es que la fotolitografía puede crear sobre la oblea patrones extremadamente pequeños y permite tener un control ultra preciso de la forma y tamaño de los objetos creados. Con la litografía óptica, se pueden crear patrones en un solo paso sobre una oblea completa pero, en los circuitos integrados más complejos, una oblea puede ser sometida a este ciclo más de 50 veces.
Es en esta fase cuando se realiza el grabado para crear estructuras y se realiza el dopaje con impurezas para alterar las propiedad eléctricas del silicio y formar las regiones activas de los transistores.
Haciendo un poco de zoom-out los elementos que se “imprimen” con la fotolitografía son principalmente los siguientes:
Transistores (la columna vertebral de cualquier chip).
Interconexiones metálicas (caminos de señales y alimentación).
Celdas de memoria (DRAM, SRAM, Flash…).
Componentes pasivos (condensadores, resistencias, diodos…).
Estas son los ingredientes con la que se construirán los chips avanzados que veremos más adelante.
🧑🏻🏭 Metalización y cortado
Una vez impresos los componentes sobre la oblea, se produce la fase de metalización, que es en la que se crean las “cableados” metálicos internos (normalmente de cobre o aluminio) para conectar los transistores dentro del chip. Estas capas se repiten varias veces para formar las interconexiones multicapa necesarias en dispositivos tan complejos como las GPUs.
Después de esta fase, ya solo quedaría el corte de las obleas (llamado también “dicing”) en los característicos cuadros que la conforman.
🧙🏻 Un proceso mágico
A la vista del proceso, se puede ver la complejidad industrial requerida para crear estos dispositivos. Y no solo en la maquinaria requerida sino también len las condiciones de extrema pulcritud en la que se debe realizar todo el proceso.
Hay una anécdota que merece ser contada a este respecto. En los orígenes en los semiconductores en los laboratorios Bell en los años 40, se encontraban errores en la fabricación cuyo origen era desconocido.
Tras investigarlo encontraron que, algo tan sencillo como haber tocado un pomo de cobre en una puerta, podía arruinar lotes completos por contaminación de átomos de cobre.
Tal comenzó a ser la obsesión por la limpieza del entorno, que empezaron a surgir supersticiones -¡en los Laboratorios Bell, un lugar lleno de científicos!-, relacionados con escoger las fases lunares o evitar los ciclos menstruales de las trabajadoras para evitar la contaminación.
Esta necesidad de pulcritud se ve reflejada en la necesidad de disponer de “salas limpias” para el proceso de fabricación.
Las semiconductor cleanrooms (o salas limpias para semiconductores) son instalaciones de fabricación altamente especializadas en las que se controlan de manera extrema los niveles de contaminación por partículas, así como factores ambientales (temperatura, humedad, presión, etc.). Su objetivo es garantizar que la producción de obleas (wafers) y de los dispositivos semiconductores (chips) se realice en un entorno ultrapuro.
Como hemos visto, incluso cantidades minúsculas de polvo o contaminantes pueden arruinar los patrones nanométricos grabados en las obleas, por lo que la limpieza y la pureza del ambiente son fundamentales.
Tal es la importancia del proceso para evitar imperfecciones que, por ejemplo en la serie de procesadores i de Intel, la calidad de los mismos viene determinada por las imperfecciones presentes en los circuitos.
🏭 Un gigante desconocido
Antes de continuar, debemos pararnos a hablar de una desconocida empresa que sostiene una parte importantísima de este proceso productivo.
ASML es una empresa holandesa fundada en 1984 especializada en la fabricación de sistemas de fotolitografía para la industria de los semiconductores. Su posición es tan dominante que controla más de 5/6 del mercado mundial de esta tecnología.
Merece la pena dedicar 2 minutos a ver este vídeo de ASML donde explican el funcionamiento de sus impresoras litográficas. Si te paras a pensarlo por un momento el proceso es algo casi mágico, parecido a escribir runas mágicas sobre una piedra.
Sin esta empresa, la producción de chips avanzados se vería seriamente comprometida, lo que demuestra la enorme importancia de la litografía en el mundo moderno.
⛪️ 4 Catedrales
Hay mucha gente que se pregunta por qué los humanos ya nos hacemos construcciones tan abrumadoramente bellas como antes y se suele usar el ejemplo de las catedrales. ¿Por qué hemos dejado de construir catedrales?
Si nos fijamos en el proceso que estamos analizando, y en particular en la tecnología de fotolitografía, nos daremos cuenta de que nunca hemos dejado de construir “catedrales”, el mundo de la tecnología es el ejemplo de cómo hemos venido construyendo sofisticados artefactos de mayor y mayor complejidad, aunque no podamos verlos a simple vista.
There are cathedrals everywhere for those with the eyes to see
Seguramente te estés preguntando cómo podemos pasar de esos “wafers” a las CPUs, GPUs y el resto de circuitos integrados que conocemos y de las que tanto oímos hablar. Veamos con más detalle el proceso.
⌨️ Diseño de circuitos
Antes de hacer la impresión de circuitos, existe un complejo proceso de diseño llevado a cabo ingenieros de hardware. Aquí, no solo hay que diseñar a nivel funcional el chip, sino que también se tiene que diseñar la disposición física para acomodar tal cantidad de componentes en un tan pequeño espacio.
Dicho de otro modo, antes de fabricar físicamente el chip (CPU, GPU, SoC…), se lleva a cabo un proceso de diseño muy complejo que decide qué transistores habrá, dónde se ubicarán y cómo se conectarán.
Veamos el proceso brevemente para entenderlo mejor:
Fase 1: Arquitectura y descripción funcional
En esta fase, los ingenieros de hardware diseñan la estructura general de la GPU y tienen en consideración el número de núcleos, los bloques de procesamiento vectorial, los tipos de memoria y los interfaces de entrada/salida.
Fase 2: Diseño lógico y verificación
Una vez se tiene la arquitectura, el sistema se describe en un lenguaje de descripción de hardware como VHDL (a cualquier ingeniero de teleco/informática/industrial le sonará esto)
Fase 3: Síntesis y place & route
Una vez tenemos la descripción, ya se puede realizar la “traducción” a puertas lógicas y transistores a bajo nivel. En este punto es importante “optimizar” la colocación de los transistores. Tan complejo puede llegar a ser esta disposición, que ya se está usando IA generativa para optimizar este “layout”.
Fase 4: Generación de foto-máscaras
A partir del layout, se crean las máscaras para cada capa de la fotolitografía (pueden ser decenas o incluso más de un centenar de máscaras dependiendo del proceso).
La cantidad de capas para un chip varía según de la complejidad del circuito a construir, de la tecnología de litografía utilizada según el grosor de cada capa (3, 5, 7 nm…) y el tipo de capa (de dopado, dieléctrica, de puerta lógica, metálicas o contactos)
En chips modernos “densos” el numero de capas puede oscilar entre las 70 y 100, lo que viene a ser una catedral en miniatura en toda regla.
🏢 Otro gigante no tan desconocido
Ya hemos visto que ASML fabricas las máquinas para la litografía pero, ¿quién hace el resto del proceso de fabricación? Tal vez hayas oído hablar de una empresa taiwanesa llamada TSMC (Taiwan Semiconductor Manufacturing Company).
Fundada en 1989, TSMC es lo que se denomina una fundición pura, esto es, se dedica únicamente a la fabricación de semiconductores sin diseñar sus propios chips.
Como ya te habrás imaginado, su principal proveedor es ASML y sus principales clientes empresas tan conocidas como NVIDIA, AMD, Qualcomm o Apple.
La existencia de TSMC es una de las razones de la importancia geo-estratégica de Taiwan. Tal está siendo la demanda de semiconductores que TSMC ya está trabajando en la apertura de nuevas fábricas fuera de Taiwan concretamente en Japón, EEUU y, como se anunció este pasado verano, su primera fábrica en Europa ubicada en Dresde (Alemania).
A día de hoy TSMC fabrica entre el 80% y el 90% de chips complejos en el mundo, ya que su tecnología de fabricación no es fácilmente replicable. TSMC fabrica anualmente unos 13 millones de obleas, ahí es nada.
Por todo ello y sin ánimo de exagerar, se podría decir que actualmente TSMC es una de las empresas críticas para el funcionamiento de nuestro mundo.
⌨️ El gigante que todos conocemos
Como veíamos, TSMC no diseña sus propios chips. Esa labor se la han dejado a empresa “fabless” (sin fábrica) como NVIDIA que se dedican al diseño de los microprocesadores.
Se puede decir que NVIDIA (creada en 1993 en Santa Clara) nació al calor de la industria del videojuego ya que, desde sus inicios se especializaron en unidades de procesamiento gráfico (GPUs) para lograr que los ordenadores personales pudiesen ejecutar juegos cada vez más complejos.
Mucho ha llovido desde finales del siglo pasado y a día de hoy, NVIDIA ha ramificado su actividad mas allá de las GPUs. Estas serían sus áreas de negocio actuales:
GPUs para Gaming
Computación de alto rendimiento e IA
Automoción y sistemas empotrados para uso múltiples (Robótica ,IoT, Visión Artificial…)
Redes y Data Centers
Jensen Huang, su CEO y fundador siempre supo que las GPUs tendrían uso más allá de los videojuegos y ha sido capaz de ir aprovechando las crecientes necesidades de computación, desde el “boom” de las criptomonedas (donde se usan GPUs para el minado) como para el auge actual de los sistemas de computación avanzada que se requieren para entrenar y correr los actuales modelos de IA.
Actualmente, se puede considerar que NVIDIA es la empresa pionera indiscutible en la fabricación de chips especializados para IA y que son el hardware más codiciado a día de hoy por todas la empresas tecnológicas.
🔗 La cadena de valor más importante
Los tres gigantes que hemos visto son los más representativos del sector de manufactura de semiconductores pero, como podrás suponer, el sector es más amplio que estas tres empresas.
Podemos decir sin temor a equivocarnos es la más relevante a día de hoy y, como comentaba antes, su importancia excede con casi todo seguridad a cualquier otra. Los semiconductores son omnipresentes en el mundo moderno y la gran mayoría de sectores hacen un uso más o menos intensivo de los mismos.
La enorme demanda de chips y la fragilidad de esta cadena de valor, ha causado periodos de escasez de semiconductores y, aun a día de hoy, la demanda excede a la oferta.
La siguiente anécdota es muy representativa del estado actual del sector. Hace apenas unos meses, en una cena informal de tres de los CEOs mas importantes del mundo Elon Musk (Tesla, SpaceX, X…), Larry Ellison (Oracle) y Jensen Huang (NVIDIA); los dos primeros “rogaron” a Huang que por favor les vendiese más GPUs.
El propio Ellison cuenta que durante le cena le espetó a Huang:
“Please take our money. Please take our money. By the way, I got dinner. No, no, take more of it.”- Larry Ellison
Sé que puede sonar exagerado pero muy pronto un factor de que determinará la riqueza de un país será su capacidad de computación y esto estará directamente relacionado con el numero y sofisticación de los chips de que cada país disponga.
⛪️ Una catedral de catedrales
En este punto ya hemos entendido a alto nivel el proceso para fabricar, por ejemplo, una de las conocidas GPU de NVIDIA, los actuales líderes del mercado en lo que a AI se refiere.
La cuestión ahora es, ¿cómo se usan estos complejos chips para entrenar modelos y realizar inferencias?
Aquí podemos hablar de 4 niveles de agrupación, el nodo, el rack, el cluster y el data center.
Para entenderlo mejor, las GPUs (por ejemplo, las H100 de NVIDIA que mencionábamos antes) se agrupan en nodos (servidores con varias GPUs gobernados por una o más CPUs y equipados con memoria y conexión de red), que a su vez se montan en racks, que no son más que armarios con base y estructura metálica para alojar estos nodos.
La interconexión de muchos racks de denomina clúster y aquí debemos pararnos momentáneamente de nuevo.
Los cuellos de botella en los sistemas informáticos no vienen siempre dados por la capacidad de computación per se sino, que a veces, hay otros factores limitantes. Uno de ellos es la velocidad de interconexión entre sistemas.
En 2020, NVIDIA adquirió una empresa llamada Mellanox por 7000 millones de dólares y, aunque la cantidad fue estratosférica, el tiempo ha acabado demostrado que Jensen Huang realizó una operación brillante.
Mellanox, una empresa israelí especializada en la tecnología InfiniBand (conexiones de red de alta velocidad) aportó a NVIDIA la capacidad para reducir la latencia de comunicación entre GPUs, haciendo que la empresa de Huang sea capaz de ofrecer soluciones integrales para data centers modernos proporcionando tanto las GPUs con las conexiones de alta velocidad.
Pongamos números para entender esto. Una GPU A100 puede manejar en torno a 50B de parámetros. Como ya sabemos, los modelos más modernos exceden con mucho este número de parámetros, lo que hace que el trabajo de entrenamiento se tenga que dividir entre muchas GPUs.
Aquí es donde entra juego Mellanox con su InfiniBand. Mientras que una conexión Ethernet tiene una latencia de 200-400ns, InfiniBand proporciona tiempos de 100ns.
Por si fuese poco, el software de InfiniBand permite a las GPUs comunicarse directamente con el dispositivo de red, “saltándose” la necesidad de consumir CPU o memoria en el nodo, lo que conlleva una reducción de latencia aún mayor.
Volviendo al punto en el que estábamos, el cluster, llegamos a la agrupación de clusters que es, nada y más y nada menos, que los “data centers” para IA que conocemos.
Esta sofisticada “catedral” es la infraestructura que permite que, usando herramientas de orquestación y software de IA (PyTorch, TensorFlow, contenedores…) se puedan entrenar y ejecutar grandes modelos en paralelo de manera transparente.
☀️ 5 La llegada de la luz
Seguro que has oido hablar de la Ley de Moore.
Gordon Moore (uno de los cofundadores de Intel) se dio cuenta en 1965 que la densidad de transistores en los circuitos integrados se duplicaba aproximadamente cada dos años, lo que implicaba una reducción del tamaño de los transistores y una mejora continua en el coste y rendimiento.
Con el tiempo, esta “ley” se convirtió en una especie de objetivo de la industria de semiconductores, que ha marcado la pauta de la miniaturización y aumento de prestaciones de los chips.
A día de hoy, pese a que se ha decelerado el ritmo, avances como los que hemos visto en interconexión y las nuevas tecnologías de chips como la serie M de Apple de tipo SoC (System-on-Chip), hacen que sigamos incrementado la capacidad computacional de manera muy significativa.
¿Qué pasará cuando lleguemos al los límites físicos de integración de transistores? ¿Habremos alcanzado entonces el límite del silicio?
Lo cierto es que una vez más, los humanos puede que hayamos dado con una solución computacional aún más eficiente y, sorpresivamente, utilizando también silicio. Como sabes, el silicio es también usado para aplicaciones relacionadas con la fotónica como, por ejemplo, la fabricación de placas solares.
¿Qué pasaría si en vez de señales eléctricas usásemos fotones para el computo y la transmisión de la información? ¿Qué pasaría si en vez de empujar electrones por cables metálicos usásemos haces de luz?
Aquí entra en juego la fotónica del silicio, la tecnología que puede abrir la puerta para seguir avanzando más allá de la Ley de Moore.
Es posible que, dentro de unos años podamos realizar multiplicaciones de matrices y complejas redes neuronales fotónicas, lo que permitiría:
Computar y transmitir a mayores velocidades
Reducir el consumo energético de la computación
Aunque existen tremendos retos tecnológicos y de coste para la fabricación masiva de estos dispositivos, empresas como Intel o Ayar Labs están ya trabajando en sistemas de fotónica de silicio para mejorar la interconectividad.
De manera más concreta, Intel está desarrollando prototipos de transmisores fotónicos integrados que permiten manejar grandes volúmenes de datos a mayor velocidad y con menos consumo energético que la electrónica tradicional.
En este mismo sentido, hace apenas unas semanas, el MIT presentaba un procesador fotónico capaz justamente de realizar operaciones de manera ultrarrápida y con una eficiencia energética impresionante.
Según cuentan los propios investigadores, usando este nuevo chip han sido capaces de completar las computaciones para una tarea de calificación de Machine Learning en apenas medio nanosegundo y con una precisión del 92% (equivalente al hardware actual).
El chip consta de una serie de módulos interconectados que conformar una red neuronal óptica cuya fabricación podría ser industrializada.
¿Imaginas poder crear un LLM óptico con espejos en vez de parámetros y luz en vez de bits?
⏳ 6 Dioses de Arena
🧠 El comienzo del infinito
Como hemos visto, el trayecto desde un simple grano de arena hasta la “inteligencia” es algo absolutamente mágico que ha logrado el ingenio y la curiosidad humanas.
Lo más interesante de todo es que, según la teoría del escalado, que vimos en #TIS50, si seguimos combinando más poder de computación con más datos y con cada vez más sofisticados algoritmos, parece que podremos ir generando sistemas más y más inteligentes.
El pasado día 20 de Diciembre y como cierre a los “12 días de novedades” de OpenAI, la empresa de Sam Altman lanzó su nueva sería de modelos o3 (nótese que se ha omitido el modelo o2 por asuntos relacionados con la propiedad intelectual).
Según se mostró en diversas pruebas (entre ellas el test ARC-AGI de François Chollet del que hablamos en TIS#52) el rendimiento de estos nuevos modelos supone un avance significativo en la búsqueda de sistemas con inteligencia general, llegando a superar el “umbral” de la AGI en el test ARC que se situaba en el 85%.
Pese a que el propio Chollet piensa que o3 aún no es AGI, los resultados son extremadamente prometedores ya que indican que la estratega TTC (Test-time Compute) de dedicar recursos de computación e inferencia funciona a la hora de resolver problemas aunque, a día de hoy, la obtención de estos resultados tan espectaculares conlleven un coste de computación excesivamente alto.
Si hace unos años nos hubiesen dicho que en 2024 tendríamos sistemas capaces de ganar sin problemas la Go a cualquier humano, superar un examen como el MIR, los exámenes GMAT de acceso a posgrado, de ser mejores programadores que el 99,8% de los programadores humanos, de hacer mejores diagnósticos que muchos médicos o de obtener un 25% en FrontierMath, cualquier de nosotros hubiera afirmado que eso ya sería AGI.
A la vista de estos resultados y teniendo en cuenta que la AGI debe ser considerada como un proceso y no como un punto específico en el tiempo, me atrevo a decir que ya estamos en el comienzo de los sistemas AGI, esto es, sistemas con inteligencia igual o superior al humano promedio en diversas tareas.
La aparición de los sistemas AGI y, eventualmente, los sistemas ASI supondrán un salto cualitativo en como afrontamos la búsqueda y generación de conocimiento, haciendo que los modelos sea capaces de generar un proceso vivo de conjetura y refutación para entender nuestro Universo, dando lugar a un constructor universal de conocimiento en los términos usando por David Deutsch en “The Beginning of Infinity”.
Un constructor universal de conocimiento podría llevar a cabo cualquier proceso físico posible y, por tanto, convertirse en la fuente misma de la existencia. ¿Hay algo más parecido a un Dios que esto?
👼🏻 The side of the angels
¿Hemos dejado entonces de construir catedrales? Por supuesto que no.
Desde cohetes espaciales a intricadísimos circuitos integrados agrupados en cada vez más complejos centros de datos, desde micrómetros hasta kilómetros, estamos construyendo nuevas catedrales dedicadas a alumbrar algo que nos trascienda.
Las seguimos levantando cada día, aunque en silencio y con materiales invisibles a simple vista: granos de arena convertidos en silicio, luz transformada en señales, e inteligencia forjada con líneas de código. Nuestros templos ya no apuntan necesariamente al cielo, sino que se alzan en laboratorios, centros de datos y mentes curiosas dispuestas a desafiar lo imposible.
De algún modo, parece que estamos construyendo estas nuevas catedrales no para comunicarnos con Dios sino para crear esta máquina de generación infinita de conocimiento. La creación de sistemas más inteligentes que nosotros será, sin duda, el hito más relevante de la historia de la humanidad y el hecho que moldeará un futuro tan, tan distinto para la raza humana que es totalmente imposible de predecir.
Cada uno de estos “Dioses de arena” es, en realidad, un eslabón en la cadena infinita del conocimiento humano que vamos enlazando con la esperanza de rozar lo divino y encender la chispa de una inteligencia superior, compartida y universal.
Este es el camino correcto. Y lo hemos encontrado. Ahora nos queda transitarlo.
¡Gracias como siempre por leer hasta aquí!
¿Te gusta The Independent Sentinel? ¡Ayúdame a que más gente conozca la publicación!
Si tienes comentarios o quieres iniciar una conversación, recuerda que puedes hacerlo aquí.
Si te has perdido alguna edición de la newsletter o quieres volver a leerlas, puedes acceder a todas aquí.
Si quieres escuchar todas las canciones de The Independent Sentinel, echa un vistazo a esta lista de Spotify.
Impresionante la cantidad y calidad de conocimiento que has transmitido. Maravilloso!
¡Impresiónate artículo divulgativo!. Menudo trabajazo. Muchas gracias