Weight Updates as Activation Shifts: A Principled Framework for Steering

Este trabajo establece un marco teórico que demuestra la equivalencia de primer orden entre las actualizaciones de pesos y los desplazamientos de activación, proponiendo un método de "adaptación conjunta" que supera a las técnicas anteriores de ajuste fino y de dirección de activación al lograr un rendimiento casi óptimo modificando solo el 0,04% de los parámetros del modelo.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Este trabajo propone una descomposición funcional de anillo tensorial reparametrizada que utiliza representaciones neuronales implícitas y un análisis en el dominio de la frecuencia para superar las limitaciones de los métodos tradicionales, logrando así una recuperación superior de datos multidimensionales tanto en mallas como fuera de ellas.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Este trabajo propone un marco acústico compacto que fusiona características multirrama y una unidad de memoria Legendre (LMU) con una fusión de ensamble posterior calibrada para mejorar la clasificación de llantos infantiles en escenarios de dominio cruzado, logrando una generalización superior y una implementación eficiente en dispositivos.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Este estudio presenta el primer marco de patología computacional multimodal, basado en un Transformer de inyección clínica y un MAE adaptado al dominio, que logra una alta precisión (90,1%) en la predicción del pronóstico de nefritis lúpica pediátrica utilizando únicamente biopsias teñidas con PAS y datos clínicos estructurados.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong Lu2026-03-09🤖 cs.LG

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

El artículo presenta JAWS, una estrategia de regularización probabilística que modula dinámicamente la fuerza de la regularización según la complejidad física local para mejorar la estabilidad a largo plazo, la fidelidad de las ondas de choque y la generalización en modelos de operadores neuronales, superando las limitaciones de las técnicas de regularización global y los métodos de optimización de trayectorias de largo horizonte.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Este artículo establece fundamentos teóricos para la decodificación restringida por gramáticas, demostrando que la equivalencia lingüística no garantiza eficiencia computacional al introducir una métrica de costo de ambigüedad estructural, probar límites inferiores de complejidad y derivar acotaciones precisas de distorsión para el muestreo condicional en arquitecturas de transformadores.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

Este artículo propone una reordenación algebraica intuitiva de la descomposición de la covarianza de Yates para la puntuación Brier, que expresa el error de pronóstico probabilístico como la suma de tres términos no negativos (desajuste de varianza, déficit de correlación y error de calibración global), haciendo así transparentes las condiciones de optimalidad para un pronóstico perfecto.

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

El artículo presenta IntSeqBERT, un modelo Transformer dual que integra representaciones de magnitud logarítmica y espectro de residuos módulo para predecir secuencias enteras del OEIS, logrando una precisión significativamente superior a los modelos basados en tokens al aprovechar la estructura aritmética mediante un solucionador probabilístico basado en el Teorema Chino del Resto.

Kazuhisa Nakasho2026-03-09🤖 cs.LG

Autocorrelation effects in a stochastic-process model for decision making via time series

Este estudio demuestra mediante un modelo matemático que la autocorrelación negativa o positiva de una serie temporal óptica caótica optimiza la toma de decisiones en problemas de bandido multi-brazo dependiendo de si la suma de las probabilidades de recompensa es mayor o menor que uno, respectivamente.

Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida2026-03-09🔬 physics.optics

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

El artículo presenta un autocodificador de Koopman en tiempo continuo (CT-KAE) como un modelo sustituto ligero y estable que supera a las redes Transformer autoregresivas en la predicción a largo plazo de estados oceánicos, logrando un crecimiento de error acotado y una inferencia significativamente más rápida mediante la proyección de dinámicas no lineales a un espacio latente lineal.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artículo presenta un modelo teórico que demuestra cómo la inteligencia artificial genera un aparente paradoja al igualar las habilidades individuales mientras concentra el valor económico en activos complementarios, creando dos regímenes de desigualdad que dependen de la estructura tecnológica y las instituciones laborales, aunque sus predicciones específicas aún carecen de datos empíricos adecuados para ser validadas.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

El artículo presenta CDDS, un nuevo algoritmo de alineación multimodal que supera a los métodos existentes mediante un decoplamiento restringido de las representaciones en componentes semánticos y modales, junto con un muestreo de distribución para cerrar la brecha entre modalidades y garantizar la alineación de la verdadera semántica.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG