An Ocean Model Ported by a Large Language Model: Experience and Lessons from FESOM2 (Fortran to C to C++/Kokkos)

Este artículo demuestra que un modelo de lenguaje grande agéntico, guiado por expertos en el dominio a través de un proceso estricto de traducción de dos etapas y una validación rigurosa, portó con éxito el modelo oceánico Fortran FESOM2 de 74.000 líneas a C++/Kokkos, preservando su física y logrando mejoras significativas de rendimiento en GPUs.

Autores originales: Nikolay V. Koldunov, Suvarchal K. Cheedela, Sergey Danilov, Dmitry Sidorenko, Sebastian Beyer, Thomas Jung

Publicado 2026-06-11
📖 5 min de lectura🧠 Análisis profundo

Autores originales: Nikolay V. Koldunov, Suvarchal K. Cheedela, Sergey Danilov, Dmitry Sidorenko, Sebastian Beyer, Thomas Jung

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita ni avalada por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que tienes una receta masiva, increíblemente compleja y altamente exitosa para un plato de 5 estrellas. Esta receta ha sido escrita en un lenguaje muy antiguo y especializado (llamémoslo "Fortran") que solo unos pocos maestros chefs entienden. Ha sido probada durante décadas y todo el mundo sabe que funciona perfectamente. Sin embargo, la cocina está cambiando: los hornos nuevos (supercomputadoras modernas con potentes GPUs) ya no hablan "Fortran". Ahora hablan "C++".

El problema es que traducir esta receta de 74,000 líneas del lenguaje antiguo al nuevo lenguaje de alta velocidad es como intentar traducir una novela mientras simultáneamente reconstruyes la casa en la que está escrita. Si cometes incluso un más mínimo error en las matemáticas, el plato podría convertirse en veneno o la cocina podría incendiarse. Usualmente, esto le toma a un equipo de expertos humanos años de trabajo.

Este artículo describe un nuevo experimento: ¿Puede una IA (un Modelo de Lenguaje Extenso) hacer este trabajo de traducción por nosotros, y puede hacerlo sin arruinar la receta?

Aquí explicamos cómo lo hicieron, usando analogías simples:

1. La estrategia de traducción de dos pasos

En lugar de pedirle a la IA que salte directamente del "Lenguaje Antiguo" al "Nuevo Lenguaje de Alta Velocidad", el equipo la obligó a tomar un desvío.

  • Paso 1: La "Copia Limpia" (Fortran → C): Primero, le pidieron a la IA que tradujera la receta a un lenguaje intermedio más sencillo llamado "C".

    • La Regla: Se le prohibió estrictamente a la IA "mejorar" la receta. No podía cambiar ingredientes para que fueran "mejores" ni cambiar los tiempos de cocción para que fueran más eficientes. Tenía que ser una copia literal, palabra por palabra.
    • El Objetivo: Asegurarse de que el sabor (la física) se mantuviera exactamente igual. Ejecutaron esta nueva versión en "C" durante cinco años de tiempo simulado. Sabía idéntico a la versión original en "Fortran", con diferencias tan diminutas que eran como un grano de sal en un océano.
  • Paso 2: La "Mejora de Velocidad" (C → C++/Kokkos): Una vez que se demostró que la versión en "C" era perfecta, le pidieron a la IA que tradujera esa versión al lenguaje moderno "C++", el cual está diseñado para ejecutarse en hornos de GPU súper rápidos.

    • La Red de Seguridad: Debido a que la versión en "C" ya era perfecta, la IA podía ahora concentrarse en la velocidad. Verificaron cada uno de los pasos del proceso de cocción para asegurar que la nueva versión en "C++" produjera exactamente los mismos números que la versión en "C" en computadoras estándar.

2. El sistema de verificación de "Gemelos"

¿Cómo supieron que la IA no coló un error? Utilizaron un sistema de "Gemelos".

Imagina que tienes un maestro chef (el código original) y un estudiante chef (el nuevo código). Cada vez que el estudiante chef pica una cebolla, tiene que mostrarle el resultado al maestro chef inmediatamente.

  • La prueba del "Gemelo": Para cada paso de la cocción, la computadora ejecuta el código nuevo y el viejo de forma paralela. Si los números difieren incluso por una fracción mínima, el sistema grita "¡Detente!" y le dice a la IA: "Te equivocaste en este paso específico".
  • La trampa del "Halo Estancado": Un error común que cometió la IA fue olvidar actualizar los bordes de los datos (como olvidar lavar la tabla de cortar entre cortes). El equipo construyó una "sonda" especial que verifica específicamente los bordes para atrapar estos errores invisibles.

3. Los Resultados: Velocidad y Precisión

El experimento fue un éxito. Esto es lo que sucedió:

  • Precisión: El nuevo código es científicamente confiable. Durante cinco años de simulación, las temperaturas y la salinidad de los océanos en la nueva versión fueron casi indistinguibles de la original. En las superrápidas GPUs, los resultados fueron "estadísticamente cercanos", lo que significa que las diminutas diferencias se debieron a cómo la computadora realiza las matemáticas, no porque la física estuviera mal.
  • Velidad: El nuevo código se ejecuta en GPUs modernas (como la NVIDIA A100) y es de 1.6 a 3.7 veces más rápido que el código antiguo ejecutándose en CPUs estándar.
  • Portabilidad: Lo mejor de todo es que escribieron el código una vez, y este se ejecuta en diferentes tipos de supercomputadoras (NVIDIA, AMD y otras) sin necesidad de ser reescrito. Es como un adaptador universal que encaja en cualquier toma de corriente.

4. Qué salió mal (y cómo lo arreglaron)

La IA no es perfecta. Intentó "ayudar" simplificando las cosas, lo que casi rompe la física.

  • La trampa de la "Simplificación": La IA quería redondear números o cambiar un valor constante porque se veía "más limpio". El equipo tuvo que prohibirlo estrictamente. Le dijeron a la IA: "Si el original dice 0.1, escribe 0.1. No adivines".
  • La trampa del "Comentario": La IA a veces leía un comentario en el código que decía "El valor es 5", pero el código real decía "El valor es 10". La IA confió en el comentario. El equipo solucionó esto obligando a la IA a verificar la línea de código real cada vez.

La Conclusión

Este artículo demuestra que, con las reglas adecuadas y una estricta "escalera de seguridad" de verificaciones, una IA puede traducir un modelo científico masivo y complejo de un lenguaje antiguo a uno nuevo y súper rápido en cuestión de semanas.

No solo copió el código; preservó la ciencia. El modelo oceánico sigue comportándose exactamente como el océano real, pero ahora corre lo suficientemente rápido como para ayudarnos a predecir el clima futuro en las computadoras más potentes del mundo. La clave no fue solo la IA; fue la disciplina de los humanos que la guiaron: reglas estrictas, traducción literal y una verificación constante.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →