The Independent Sentinel #54
La paradoja de Jevons, una puerta a las estrellas y el cálculo de la espera
¡Hola! Te doy la bienvenida una vez más a The Independent Sentinel, la newsletter en la que miramos al pasado para entender tanto lo podría cambiar en el futuro como lo que jamás lo hará.
Si deseas suscribirte para recibir cada edición en tu correo electrónico, puedes hacerlo fácilmente aquí:
En esta primera edición del año hablaremos de modelos chinos que sacuden al mundo, del mayor proyecto de computación de la historia y de lo que nos puede enseñar la ciencia ficción sobre innovación corporativa.
¡Despegamos! 🚀
1. Tendencias 📈
🧩 La paradoja de Jevons
Terremoto. Esta es la palabra con la que podemos definir lo que ha ocurrido esta semana en el mundo de la Inteligencia Artificial. El movimiento tectónico que ha causado este terremoto ha sido el lanzamiento de un nuevo LLM de origen chino llamado DeepSeek-R1 y que está haciendo tambalearse los cimientos la industria de la IA y la computación.
R1 es un modelo de “razonamiento” que usa TTC (test-time compute) similar al ya conocido modelo o1 de OpenAI y, aparentemente, equivalente en prestaciones.
Que un modelo de un laboratorio desconocido como DeepSeek consiga estos resultados es ya de por sí impresionante, pero lo es más aún cuando se sabe que:
El modelo se ha liberado open-source con licencia MIT
El coste de uso es 1/20 parte de lo que cuesta o1
El coste del entrenamiento se dice que ha sido de 5.58 millones de dólares, una cantidad ínfima en comparación con los 500 millones que se rumorea costó entrenar el modelo o1 de OpenAI. (Esta aseveración no está exenta de polémica ya que se dice que el equipo de DeepSeek tiene y ha usado muchos más recursos de los que se dice amparados por el gobierno Chino)
Para el entrenamiento, se dice que han usado 50,000 GPUs de NVIDIA frente a las 500,000 que, una vez mas, se supone que ha utilizado OpenAI.
Independientemente de la veracidad de toda la información alrededor de DeepSeek, hay un grandísimo trabajo de ingeniería volcado en este modelo, y esto es algo tremendamente positivo ya que, hasta el momento, estábamos viendo como los desarrolladores de modelos estaban aplicando enfoques de “fuerza bruta” para mejorar la capacidad de los modelos a expensas del gasto computacional. Me refiero, por ejemplo, a este tipo de acciones técnicas que han puesto en juego los creadores de DeepSeek:
Usar 8 bits en vez de 32 bits para la representación de parámetros en coma flotante
Compresión de índices key-value (los “mapas” para buscar información durante el proceso de inferencia) para consumir menos VRAM (la memoria de las GPUs)
Predicción de múltiples tokens en vez de uno cada vez, aportando así una mayor velocidad en la generación
División del modelo en mini-redes especializadas (MoE - Mixture of Experts) para evitar activar la red completa en cada petición.
Pero lo más interesante de todo, no es ya tanto su coste de uso y entrenamiento, la licencia o la optimización técnica, sino que el enfoque que los desarrolladores han dado a este modelo que incluye varias innovaciones que merece la pena desarrollar:
Cold- Start Data: El modelo ha contado con más de 1000 ejemplos cuidadosamente seleccionados en el post-entrenamiento para evitar salidas incoherentes (mal formato, mezcla de idiomas, etc.)
DeepSeek no usa el típico esquema SFT (Supervised fine-tuning) si no que se basa únicamente en RL (Reinforcement Learning - Aprendizaje por Refuerzo) para autodescubrir estrategias de razonamiento mediante prueba y error.
Esta última innovación diría que es la más relevante de DeepSeek ya que marca un nuevo paradigma de aprendizaje autónomo que puede pavimentar el camino para los futuros avances de la IA.
Además, el hecho de que sea open-source es un paso de gigante hacia la democratización de la IA. Una democratización que pasa por la existencia de un entorno competitivo de empresas proporcionando soluciones de creciente sofisticación al existir información abierta.
Sin ir más lejos, muy poco después del lanzamiento de R1, ya se ha publicado una versión 100% abierta para replicar este modelo llamada Open R1.
En Mayo del año 2023, en un documento interno Google reconocía que no tenían “moat”, es decir, que no había ninguna ventaja competitiva respecto a los competidores en la carrera de los grandes modelos de lenguaje. Y no solo eso, también decían que OpenAI tampoco tendría una ventaja competitiva duradera.
We have no moat and nor does OpenAI
En su momento, pareció que esta frase era una justificación ante la ventaja que había tomado OpenAI después de que fuesen los propios investigadores de Google los que habían comenzado esta revolución con la creación de los modelos Transformer.
No obstante, el tiempo está dando la razón a Google ya que parece que realmente el Open Source puede plantar cara a los modelos propietarios. Y esta es, sin duda, la mejor noticia que nos podrían haber dado como consumidores.
El impacto del lanzamiento de DeepSeek no se ha quedado únicamente en apartado técnico, sino que ha tenido también enormes implicaciones desde un punto de vista financiero.
¿Qué ocurre con toda industria de semiconductores y por supuesto con todos los grandes rivales con LLMs una vez se ha demostrado que se puede hacer más con menos?
La respuesta de los mercados se ha hecho esperar casi una semana pero, el pasado lunes, los índices bursátiles se tiñeron de rojo en respuesta a esta revelación.
¿Tiene sentido esta reacción de los mercados a la aparición de DeepSeek? Seguramente no, y déjame que apuntale esta afirmación con la llamada “Paradoja de Jevons”.
La Paradoja de Jevons explica que el progreso tecnológico, de manera contraintuitiva, conduce al incremento de la eficiencia con la que se usan los factores de producción (en nuestro caso sería la computación) y que, al caer el precio de uso, se promueve su demanda. Esto hace que, finalmente, se acabe usando aún más este recurso.
Esta paradoja lleva el nombre de William Stanley Jevons, economista inglés que en su obra “The coal question” observó que el consumo del carbón en Inglaterra se incremento después de que James Watt mejorase la máquina de vapor creada por Thomas Newcomen.
En estos tiempos y en el caso que nos ocupa, podemos decir que, según vaya creciendo la eficiencia computacional de la IA, muchos más casos de aplicación empezarán a ser viables, lo que hará que la demanda (tanto en entrenamiento como, sobre todo, en inferencia) sea mucho mayor de lo que es ahora.
Este último punto es muy interesante ya que, en un mundo donde la inteligencia sea barata y accesible, la generación de valor pasará a la capa de aplicación y lo importante ya no serán tanto los modelos sino lo que hacemos con ellos. La IA se habrá convertido en una commodity. Una commodity de importancia equivalente o superior a la propia energía.
💫 Una puerta a las estrellas
Como indicaba al comienzo, este mes de Enero ha sido un mes de noticias muy relevantes para la IA. Además de DeepSeek, hace una semana, durante la toma de posesión de Donald Trump, Sam Altman (OpenAI), Masayoshi Son (SoftBank) y Larry Ellison (Oracle) anunciaron una inversión de 500 billones americanos (1/3 del PIB español) para la construcción de StarGate, una gigantesca infraestructura de procesamiento de datos cuyo objetivo no es otro que construir una super inteligencia artificial (ASI).
La construcción de una AGI/ASI parece ya la carrera espacial de este siglo y Stargate podría asimilarse a el Proyecto Manhattan contemporáneo.
En esta ocasión, la ubicación escogida no ha sido al desierto de Los Álamos sino una gran superficie en Abilene (Texas) sobre la que ya se está construyendo desde hace meses.
El anuncio, como no podía ser de otra manera, ha generado un revuelo inusitado debido a las implicaciones técnicas, políticas y estratégicas de este proyecto.
💵 Financiación
$500,000,000,000 es un número que cuesta hasta imaginar y supondría la mayor inversión en infraestructura tecnológica de la historia de la humanidad. Las inversiones en infraestructura realizadas en los últimos años por Amazon, Microsoft o Meta palidecen ante la magnitud del proyecto Stargate.
La pregunta obvia ahora es, ¿cómo se va a pagar esto?. Hasta el momento ya se han comprometido una quinta parte de los fondos (100,000 millones), pero el resto aún esta por determinar como se obtendrá. Elon Musk ya ha mostrado públicamente que duda de la capacidad del consorcio para “levantar” tal cantidad de dinero.
Obviamente, este tweet provocó la respuesta directa de sam Altman. La polémica está servida.
Sea como fuere, levantar y, sobre todo, desplegar tal cantidad de fondos es un proyecto de una complejidad inmensa que, personalmente me entusiasma. Movilizar tantos recursos para un objetivo tan específico me parece algo digno de alabar. Y sí, sé que te estarás preguntando ¿Cuál es este objetivo de Stargate?
🎯 Objetivos
El objetivo de StarGate es ambicioso ya que esperan que esta sea la infraestructura con el volumen de computación necesario para cercarnos a la AGI y quién sabe si a la ASI.
Más allá del objetivo tecnológico, StarGate tienen una componente político-estratégica ya que la actual administración americana quiere posicionare como la superpotencia en IA en la carrera por conseguir la AGI en competencia con China.
Los paralelismos entre la situación actual y la llegada a la luna o la guerra fría son manifiestos y es que, como ya sabemos y a veces olvidamos, la historia tiende a repetirse.
⚡️ Energía
Ya hemos hablado de la inversión inicial requerida pero, ¿qué hay de los costes operativos? ¿cómo se podrá alimentar tal monstruo computacional?
La energía podría ser el principal cuello de botella en esta faraónica empresa. Debido a la demanda energética, se optará probablemente por un mix energético que incluya:
Planta de gas natural
Energía solar y almacenamiento con baterías
Subestaciones eléctricas y red local
Reactores nucleares modulares pequeños (SMR)
Montar un grid como este debe ser el sueño (o la peor pesadilla) para cualquiera que se dedique a la ingeniería energética.
🇪🇺 El papel de Europa
Pese a la ilusión que personalmente me hace que se arranque un proyecto así, me entristece como Europeo no ya que no vayamos a ganar esta carrera hacia la AGI sino que, por lo que parece, ni siquiera participemos en ella.
Considero de una importancia estratégica inconmensurable que Europa redefina su estrategia industrial en general y en particular la concerniente a la IA para fomentar la generación de un entorno favorable para que prospere nuestro propio tejido industrial en este ámbito.
Esta revolución industrial puede que sea la última que hagamos los humanos y, por ello, no podemos permitirnos perder el tren en esta época de transformación radical.
Es cierto que hoy estamos muy atrás, pero creo que el talento y la iniciativa de los Europeos de debe poner en valor para, al menos, poder participar en en del desarrollo de las tecnologías que redefinirán el mundo.
2. Historias 📔
🎼 ¿Quieres banda sonora? ¡Dale al Play!
💫 Un mensaje a las estrellas
En 1977 salían de la tierra unas de nuestras primeras naves espaciales: Las sondas Voyager 1 y 2. El objetivo de estas sondas era explorar el resto de planetas del Sistema Solar mediante 10 instrumentos instalados a bordo.
Ambas sondas fueron diseñadas como sistemas triaxiales estabilizados para asegurar que la antena de alta ganancia apuntase siempre a la tierra con el fin de recibir y transmitir información.
Ambas sondas han superado con creces sus objetivos iniciales. Originalmente destinadas a estudiar Júpiter y Saturno, ampliaron su misión para explorar Urano y Neptuno, proporcionando imágenes y datos sin precedentes de estos planetas y sus lunas.

Posteriormente, al adentrarse en el espacio, han ofrecido información de incalculable valor sobre la heliosfera y su interacción con el medio interestelar (el espacio entre las estrellas), desafiando y ampliando nuestras teorías sobre esta región.
A modo de curiosidad, en primavera del año pasado se recuperó la comunicación con la sonda Voyager 1 con la que se había perdido el contacto desde hacía meses. Los ingenieros de la NASA, sabiendo que la sonda seguía recibiendo datos de la tierra, reconfiguraron en remoto y con éxito el código de la FDS (el subsistema de datos de vuelo) para que volviese a enviar datos a la tierra. Una auténtica proeza de la ingeniería.
Además del equipamiento científico, cada una de las sondas contenía una copia del “disco de oro” con información para cualquiera que pudiese encontrar la sonda en el espacio.
📀 El disco de oro
Antes de lanzamiento de las sondas se decidió que ambas llevasen información sobre nuestra civilización para el caso hipotético de que la sonda se topase con alguna civilización extraterrestre.
Esta información se almacenó en un disco fonográfico de 12 pulgadas hecho en cobre y chapado en oro que, además de incluir sonidos, incluía información para reconstruir imágenes sobre la vida y la cultura en la tierra.
Paremos por un momento y veamos con más detalle la información contenida en la cubierta del disco:
El disco contiene información sobre cómo usar el propio disco (velocidad de rotación, forma de onda de salida y como verificar su correcto uso), así como la ubicación de nuestro sol y los “momentos spin” de un protón y un electrón de un átomo de hidrógeno.
En términos prácticos, esta última referencia es clave porque comunica una unidad básica de medida a cualquier ser que pudiera encontrar el disco, permitiéndoles comprender la información binaria grabada en él, como el tiempo y la frecuencia asociada con la transición del átomo de hidrógeno (aproximadamente 21 cm en longitud de onda o 1.420 GHz en frecuencia). Esto hace que la información sea comprensible de manera universal, independientemente del origen del observador.
Si alguna civilización inteligente fuese capaz de entender la cubierta y reproducir el disco de manera correcta, se encontraría con 115 imágenes en formato analógico, sonido y música de la tierra y saludos en varios idiomas.
🌁 Imágenes
Entre las imágenes contenidas en el disco has escenas de nuestro planeta, imágenes con unidades de medias, constantes físicas, construcciones humanas y, por supuesto, fotos sobre nuestra anatomía y nuestras costumbres.
🔈 Música y Sonidos
En el disco también hay música y sonidos variados: el llanto de un bebé, un beso, un tren, código Morse, un perro ladrando, el sonido de ua herramienta y multitud de otros sonidos de nuestro día a día.
Además de meros sonidos, hay varias composiciones musicales de diversos sitios de la tierra, desde música tribal a música clásica pasando por canciones rock como “Johnny B. Goode” de Chuck Berry.
Puedes escucharlo aquí:
📨 Mensajes para el Universo
Por último, el disco contiene saludos humanos en 55 idiomas humanos distintos, desde el Acadio (una antigua lengua mesopotámica), hasta el idioma Wu, un dialecto chino hablado en la región oriental de China.
El celebérrimo Carl Sagan desempeñó un papel fundamental en la creación del disco y seleccionó gran parte de los contenidos destinados a civilizaciones extraterrestres.
Desde luego que Carl volcó todo su conocimiento y buena fe en crear este mensaje hacia lo desconocido pero ¿fue esto una buena idea? Puede que no…
🌲 El bosque oscuro
No sé si has leído la saga “El problema de los tres cuerpos” del autor chino Liu Cixin pero, si no lo has hecho, te animo a que des una oportunidad a esta fantástica obra de ciencia-ficción.
En el segundo libro de la saga, “El bosque oscuro”, Cixin Liu propone una idea en la que no he dejado de pensar desde que leí el libro. Liu hablaba en la novela de la Teoría del Bosque Oscuro, teoría que daría que da una solución posible a la Paradoja de Fermi de la que hablé largo y tendido en TIS#32 .
La premisa de la teoría es que no es que no haya más civilizaciones en el Universo, sino que todas ellas permanecen “en silencio” y ocultas para evitar atraer amenazas de otras civilizaciones.
La razón de este silencio sería asegurar la supervivencia ya que, en principio, se debería desconfiar de cualquier otra civilización, incluso si parece benigna en un comienzo.
Este silencio cósmico tendría sentido ya que si, por ejemplo, alguna otra civilización encontrase nuestras sondas Voyager, lo más sensato estratégicamente para ellos sería hacer un ataque preventivo para garantizar su supervivencia.
Por ello, y teniendo en cuenta esta teoría, el envío del disco de oro habría sido un evento catastrófico ya que estaría indicando la posición de la tierra, suponiendo la benevolencia alienígena e ignorando que puede haber otras civilizaciones compitiendo por recursos escasos.
¿Fue entonces el nuestro un acto de esperanza o de temeridad? Te lo dejo para reflexión.
Y te lanzo otra pregunta. Aún sin el mensaje, ¿tuvo sentido alguno haber lanzado las sondas en el año 77?
🕰️ El cálculo de la espera
Además de la teoría del Bosque Oscuro de la novela de Liu CIxin, hubo otra idea que me dejó igualmente pensativo: “El cálculo de la espera”.
La paradoja es la siguiente: si una civilización está progresando lo suficientemente rápido, no convendría lanzar en el presente una nave espacial a un objetivo lejano; una nave lanzada después pero equipada con mejor tecnología, llegaría antes a cualquiera que fuese el destino.
El resultado paradójico es que la nave pionera, con años de ventaja, a la larga podría llegar más tarde que otra que se construyera en el futuro con tecnología superior lo que da lugar a la pregunta ¿Merece la pena lanzar ya o es mejor esperar?
La sonda Voyager 1 se lanzó en 1977 con los recursos disponibles en ese momento. Hoy, sin duda, podríamos crear una versión mucho más sofisticada y veloz usando propulsión iónica o reactores nucleares pero, si hubiéramos esperado todo este tiempo, nos habríamos perdido más de 45 años de descubrimientos y datos revolucionarios sobre los confines de nuestro sistema solar.
Aun con sus limitaciones tecnológicas, las misiones Voyager se convirtieron en los primeros objetos humanos en llegar al espacio interestelar. Su travesía nos ha brindado información clave de Júpiter, Saturno y la heliosfera, cambiando para siempre nuestra comprensión del cosmos. Si la hubiéramos diseñado con la tecnología de hoy, habría sido “superior” a nivel técnico, pero habríamos perdido casi medio siglo de exploración, aprendizajes e hitos científicos.

Esto es exactamente el “cálculo de la espera”, En un mundo donde la tecnología avanza a pasos agigantados, siempre tendremos la tentación de esperar a la “siguiente gran mejora”, pero si postergamos indefinidamente, corremos el riesgo de caer en el inmovilismo.
¿Qué por qué te cuento esto? Por es justamente el cálculo de la espera, el factor que determinará como las empresas empezarán a lidiar con la innovación en los tiempos de la IA.
🤖 El fin de la innovación (as we know it)
El cálculo de la espera es perfectamente extrapolable al ámbito de la innovación a nivel empresarial.
¿Realmente merece la pena invertir en nuevos proyectos a sabiendas de que es posible que la IA solucione nuestro problema a una fracción del coste en un futuro próximo?
Al igual que en exploración espacial, en el mundo de los negocios y la inteligencia artificial existe la tentación de posponer grandes proyectos porque “quizá dentro de un año tendré algoritmos más potentes o modelos más rápidos”, pero esto entraña riesgos que no podemos desdeñar:
Coste de oportunidad: mientras esperas, tus competidores pueden adelantar resultados, iterar prototipos o captar el mercado.
Aprendizaje temprano: lanzar una versión menos avanzada ahora permite ganar experiencia, recopilar datos y aprender a lidiar con problemas de implementación.
Evolución paralela: la tecnología mejora mientras tú ya estás en marcha, y podrás integrar esas mejoras más adelante con un personal ya conocedor de esta tecnología.
En resumen, el cálculo de la espera nos demuestra que no se trata solo de la velocidad, el poder de cómputo o la perfección tecnológica, sino de cuánto valor se genera al tener algo en marcha. Más vale tener un “Voyager” que revolucione décadas, que no tener nada mientras seguimos aguardando la nave espacial de nuestros sueños.
Si me preguntasen, como alguien que ha trabajado durante años en innovación, lo más inteligente sería usar una estrategia híbridas: empezar a desplegar iniciativas de IA a la vez que nos preparamos para adoptar con agilidad las mejoras tecnológicas que vayan surgiendo.
Al igual que en la saga de “El problema de los tres cuerpos”, la clave es decidir qué fase del desarrollo justifica lanzarse al “espacio” (o al mercado) y en qué momento seguir esperando para aprovechar el próximo gran salto tecnológico.
Así, aunque la tentación de esperar a la “mejor versión” siempre está ahí, muchas veces lo verdaderamente valioso es empezar antes que los demás, ir puliendo e iterando la solución y, cuando lleguen las nuevas tecnologías, integrarlas de la manera más eficaz posible.
¿Cuánto vale no hacer nada y esperar? ¿Cuánto vale arriesgarse?
Aquellas empresas que sean capaces de entender y calcular mejor el coste de la espera, serán aquella que tendrán ventaja en un mundo tan cambiante como el que viene.
¡Gracias como siempre por leer hasta aquí!
¿Te gusta The Independent Sentinel? ¡Ayúdame a que más gente conozca la publicación!
Si tienes comentarios o quieres iniciar una conversación, recuerda que puedes hacerlo aquí.
Si te has perdido alguna edición de la newsletter o quieres volver a leerlas, puedes acceder a todas aquí.
Si quieres escuchar todas las canciones de The Independent Sentinel, echa un vistazo a esta lista de Spotify.
Si, r1 es más de lo que parece.