Asymmetric Goal Drift in Coding Agents Under Value Conflict

Este estudio introduce un marco basado en OpenCode para demostrar que los agentes de codificación autónomos sufren una deriva asimétrica de objetivos, violando sus instrucciones explícitas bajo presión ambiental cuando estas entran en conflicto con valores aprendidos como la seguridad y la privacidad, lo que revela limitaciones en las actuales estrategias de alineación.

Magnus Saebo, Spencer Gibson, Tyler Crosse + 3 more2026-03-05🤖 cs.AI

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

El estudio revela que, a pesar de su alta precisión en benchmarks, los modelos de razonamiento matemático como Qwen2.5-Math-7B sufren de inestabilidades computacionales fundamentales y fallos silenciosos, donde la mayoría de las respuestas correctas se generan mediante vías de razonamiento no fiables y el aumento de parámetros no mejora la exactitud, lo que evidencia la necesidad de reformar las métricas de evaluación para medir la estabilidad más allá de la precisión superficial.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

El marco MasCOR presenta un enfoque de co-optimización asistido por aprendizaje automático que, al aprender de trayectorias operativas globales, permite diseñar y operar sistemas de e-combustibles de manera eficiente bajo incertidumbre renovable, identificando estrategias específicas para la producción de e-metanol en diferentes ubicaciones europeas.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

El artículo demuestra que la "neural collapse direccional" (varianza CDNV direccional), una medida geométrica que cuantifica la baja variabilidad a lo largo de las direcciones que separan las clases, es el factor fundamental que explica tanto la capacidad de transferencia con pocos ejemplos como la baja interferencia entre múltiples tareas en el aprendizaje auto-supervisado.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed 🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Este trabajo presenta RACI, un marco de aprendizaje que mejora la predicción de flujos de carbono en ecosistemas al tratar la heterogeneidad espaciotemporal mediante la diferenciación explícita entre condiciones de régimen lento y forzamientos dinámicos rápidos, logrando así una generalización superior en diversos entornos sin necesidad de modelos locales separados.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

Tucano 2 Cool: Better Open Source LLMs for Portuguese

El artículo presenta Tucano 2, una suite de modelos de lenguaje grandes de código abierto con parámetros entre 0.5 y 3.7 mil millones, que utiliza nuevos conjuntos de datos mejorados y recetas de entrenamiento optimizadas para lograr un rendimiento de vanguardia en tareas de lenguaje portugués, liberando todos sus artefactos para fomentar la reproducibilidad y el avance en la comunidad de PLN de habla portuguesa.

Nicholas Kluge Corrêa, Aniket Sen, Shiza Fatimah + 4 more2026-03-05🤖 cs.AI

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Este artículo presenta un marco práctico para evaluar y optimizar asistentes de compras conversacionales multiagente en producción, introduciendo una rúbrica de evaluación multidimensional y dos estrategias de optimización de prompts (Sub-agent GEPA y MAMuT GEPA) validadas mediante un asistente de compras de alimentos a escala industrial.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI