cs.LG artículos | Gist.Science

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Este artículo establece fundamentos teóricos para la decodificación restringida por gramáticas, demostrando que la equivalencia lingüística no garantiza eficiencia computacional al introducir una métrica de costo de ambigüedad estructural, probar límites inferiores de complejidad y derivar acotaciones precisas de distorsión para el muestreo condicional en arquitecturas de transformadores.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

Este artículo propone una reordenación algebraica intuitiva de la descomposición de la covarianza de Yates para la puntuación Brier, que expresa el error de pronóstico probabilístico como la suma de tres términos no negativos (desajuste de varianza, déficit de correlación y error de calibración global), haciendo así transparentes las condiciones de optimalidad para un pronóstico perfecto.

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

El artículo presenta IntSeqBERT, un modelo Transformer dual que integra representaciones de magnitud logarítmica y espectro de residuos módulo para predecir secuencias enteras del OEIS, logrando una precisión significativamente superior a los modelos basados en tokens al aprovechar la estructura aritmética mediante un solucionador probabilístico basado en el Teorema Chino del Resto.

Kazuhisa Nakasho2026-03-09🤖 cs.LG

Autocorrelation effects in a stochastic-process model for decision making via time series

Este estudio demuestra mediante un modelo matemático que la autocorrelación negativa o positiva de una serie temporal óptica caótica optimiza la toma de decisiones en problemas de bandido multi-brazo dependiendo de si la suma de las probabilidades de recompensa es mayor o menor que uno, respectivamente.

Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida2026-03-09🔬 physics.optics

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

El artículo presenta un autocodificador de Koopman en tiempo continuo (CT-KAE) como un modelo sustituto ligero y estable que supera a las redes Transformer autoregresivas en la predicción a largo plazo de estados oceánicos, logrando un crecimiento de error acotado y una inferencia significativamente más rápida mediante la proyección de dinámicas no lineales a un espacio latente lineal.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artículo presenta un modelo teórico que demuestra cómo la inteligencia artificial genera un aparente paradoja al igualar las habilidades individuales mientras concentra el valor económico en activos complementarios, creando dos regímenes de desigualdad que dependen de la estructura tecnológica y las instituciones laborales, aunque sus predicciones específicas aún carecen de datos empíricos adecuados para ser validadas.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

El artículo presenta CDDS, un nuevo algoritmo de alineación multimodal que supera a los métodos existentes mediante un decoplamiento restringido de las representaciones en componentes semánticos y modales, junto con un muestreo de distribución para cerrar la brecha entre modalidades y garantizar la alineación de la verdadera semántica.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

FuseDiff: Symmetry-Preserving Joint Diffusion for Dual-Target Structure-Based Drug Design

El artículo presenta FuseDiff, un modelo de difusión de extremo a extremo que genera de forma conjunta un ligando y sus dos poses de unión específicas para un diseño de fármacos de doble objetivo simétrico y topológicamente consistente, superando las limitaciones de los enfoques existentes mediante una fusión de contexto local dual y logrando un rendimiento superior en el acoplamiento molecular.

Jianliang Wu, Anjie Qiao, Zhen Wang, Zhewei Wei, Sheng Chen2026-03-09🤖 cs.LG

Learning Optimal Distributionally Robust Individualized Treatment Rules Integrating Multi-Source Data

Este artículo propone un método de reglas de tratamiento individualizado robusto (PDRO-ITR) que integra datos de múltiples fuentes para maximizar el valor de la política en el peor caso bajo desplazamiento posterior, demostrando mediante simulaciones y aplicaciones reales un rendimiento superior frente a enfoques existentes.

Wenhai Cui, Wen Su, Xingqiu Zhao2026-03-09🤖 cs.LG

Machine Learning for analysis of Multiple Sclerosis cross-tissue bulk and single-cell transcriptomics data

Este estudio presenta un pipeline de aprendizaje automático explicable que integra datos transcriptómicos de sangre y líquido cefalorraquídeo para identificar genes clave y vías biológicas, como la activación inmune y la regulación del virus de Epstein-Barr, que mejoran la comprensión de la patogénesis de la esclerosis múltiple y proponen nuevos biomarcadores.

Francesco Massafra, Samuele Punzo, Silvia Giulia Galfré, Alessandro Maglione, Simone Pernice, Stefano Forti, Simona Rolla, Marco Beccuti, Marinella Clerico, Corrado Priami, Alina Sîrbu2026-03-09🤖 cs.LG

Why Depth Matters in Parallelizable Sequence Models: A Lie Algebraic View

Este artículo utiliza una perspectiva de control algebraico de Lie para demostrar teóricamente que la profundidad de los modelos de secuencia paralelizables es fundamental para su expresividad, ya que reduce el error de aproximación de forma exponencial al corresponderse con torres de extensiones de álgebras de Lie, lo cual se valida mediante experimentos en problemas de seguimiento de estados.

Gyuryang Heo, Timothy Ngotiaoco, Kazuki Irie, Samuel J. Gershman, Bernardo Sabatini2026-03-09🤖 cs.LG

Prediction-Powered Conditional Inference

Este artículo presenta un método de inferencia condicional que combina la localización basada en kernels con predicciones de aprendizaje automático para estimar funcionales condicionales en escenarios con pocos datos etiquetados, logrando intervalos de confianza más precisos sin sacrificar la validez estadística.

Yang Sui, Jin Zhou, Hua Zhou, Xiaowu Dai2026-03-09🤖 cs.LG

Koopman Regularized Deep Speech Disentanglement for Speaker Verification

El artículo presenta DKSD-AE, un autoencoder estructurado que utiliza un operador de Koopman y normalización de instancia para desentrelazar dinámicamente las características del hablante del contenido lingüístico, logrando una verificación de voz competitiva y escalable sin necesidad de supervisión textual ni grandes modelos preentrenados.

Nikos Chazaridis, Mohammad Belal, Rafael Mestre, Timothy J. Norman, Christine Evers2026-03-09🤖 cs.LG

A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

Este artículo presenta un marco híbrido novedoso que combina heurísticas específicas del ferrocarril con aprendizaje por refuerzo (Q-learning) para optimizar eficientemente la clasificación de vagones en patios ferroviarios, abordando tanto configuraciones de acceso unilateral como bilateral mediante la descomposición del problema y la reducción del espacio de estados.

Ruonan Zhao, Joseph Geunes2026-03-09🤖 cs.LG

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Este estudio presenta un marco híbrido de GeoAI que integra MGWR, Random Forest y ST-GCN para modelar con alta precisión la heterogeneidad espaciotemporal de los flujos de tráfico multimodal y su interacción con el uso del suelo, demostrando su superioridad frente a modelos convencionales y ofreciendo una herramienta interpretable para la planificación urbana basada en evidencia.

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models

Este trabajo presenta BISE, una estrategia que identifica y extrae subredes libres de sesgo de modelos preentrenados convencionales mediante poda, logrando mitigar los sesgos algorítmicos sin necesidad de reentrenamiento ni datos adicionales.

Ivan Luiz De Moura Matos, Abdel Djalil Sad Saoud, Ekaterina Iakovleva, Vito Paolo Pastore, Enzo Tartaglione2026-03-09🤖 cs.LG

On the Value of Tokeniser Pretraining in Physics Foundation Models

El artículo demuestra que preentrenar el tokenizador con un objetivo de autoencoder antes de entrenar el modelo de dinámica mejora significativamente la eficiencia y precisión de los modelos fundacionales de física, especialmente cuando el preentrenamiento se realiza en el mismo sistema físico que la tarea final.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Este trabajo presenta el primer marco de verificación de robustez acoplada para detectores de keypoints basados en mapas de calor, que mediante un programa lineal entero mixto garantiza la robustez conjunta de todas las keypoints al considerar sus interdependencias, superando así las limitaciones conservadoras de los métodos decoupled anteriores.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

El artículo presenta behavior-dLDS, un modelo de sistemas dinámicos lineales descompuestos que permite disociar las dinámicas neuronales relacionadas con el comportamiento de las computaciones internas en grandes poblaciones de neuronas, demostrando su eficacia tanto en datos simulados como en grabaciones a gran escala de un pez cebra.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. Charles2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

El artículo presenta RACAS, un sistema agente basado en modelos de lenguaje que permite controlar robots de diversas plataformas mediante instrucciones en lenguaje natural sin necesidad de reentrenamiento ni modificaciones de código, demostrando su eficacia en robots terrestres, articulados y submarinos.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

← Anterior Siguiente →