cs.LG artículos | Gist.Science

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

El artículo presenta Spatial-TTT, un marco de inteligencia espacial basado en video que utiliza entrenamiento en tiempo de prueba (TTT) y una arquitectura híbrida con mecanismos predictivos espaciales para mantener y actualizar eficientemente la evidencia espacial a partir de flujos de video ilimitados, logrando un rendimiento superior en benchmarks de comprensión espacial a largo plazo.

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Este artículo presenta un método libre de entrenamiento para el modelo FLUX.1 que descubre y explota un subespacio latente de color estructurado (Hue, Saturation, Lightness) en su espacio de representación VAE, permitiendo la predicción y el control preciso de los colores en imágenes generadas mediante manipulación matemática directa.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

El artículo presenta BEFANA, una herramienta de código abierto escrita en Python que facilita el análisis de redes ecológicas, la visualización interactiva y el modelado predictivo mediante aprendizaje automático para evaluar las relaciones entre biodiversidad y funcionamiento de los ecosistemas.

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

Este artículo propone un método de aprendizaje activo profundo eficiente que sustituye el costoso reentrenamiento de redes neuronales por una actualización bayesiana basada en la aproximación de Laplace, permitiendo la selección de lotes diversos mediante construcción secuencial y estrategias de anticipación con una complejidad computacional significativamente menor.

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Este artículo propone una nueva medida de calidad de equidad llamada "riesgo discriminatorio" que integra la equidad individual y grupal, establece límites teóricos basados en márgenes para demostrar que la combinación de conjuntos puede mejorar la equidad y presenta métodos de poda de conjuntos para obtener modelos precisos y justos.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Este estudio presenta una evaluación actualizada del enfoque de aprendizaje por refuerzo profundo de Google Brain para la colocación de macros, introduciendo nuevos benchmarks en tecnología sub-10nm, una línea base mejorada de recocido simulado y un análisis exhaustivo que revela desafíos pendientes en la escalabilidad y reproducibilidad de la metodología.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Este artículo propone un método de ramificación y acotación disyuntiva junto con nuevas relajaciones convexas para resolver el problema de completado de matrices de bajo rango hasta la optimalidad certificada, logrando una reducción significativa en el error de prueba en comparación con los métodos heurísticos existentes.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

Este trabajo presenta las Sociedades de Mente Basadas en Lenguaje Natural (NLSOMs), un marco inspirado en las teorías de Minsky y Schmidhuber donde múltiples agentes de redes neuronales colaboran mediante lenguaje natural para resolver tareas complejas de IA multimodal, al tiempo que explora las implicaciones sociales y económicas de escalar estos sistemas hacia sociedades de miles de millones de agentes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Riemannian Laplace Approximation with the Fisher Metric

Este artículo corrige las limitaciones de sesgo y estrechez excesiva de la aproximación de Laplace riemanniana previa al proponer dos variantes alternativas basadas en la métrica de Fisher que garantizan exactitud en el límite de datos infinitos y mejoran el rendimiento práctico.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Large Language Models for Travel Behavior Prediction

Este estudio demuestra que los modelos de lenguaje grandes (LLM) pueden predecir el comportamiento de viaje con una eficacia comparable a los modelos tradicionales, ya sea mediante estrategias de prompting sin entrenamiento o utilizando sus representaciones textuales para mejorar el aprendizaje supervisado en escenarios con pocos datos.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Este artículo propone un marco de agregación basado en transporte óptimo para combinar modelos de Mezcla de Expertos (MoE) distribuidos en un estimador global coherente, logrando un rendimiento comparable al entrenamiento centralizado con un único paso de comunicación y menores costos computacionales.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

El artículo presenta MFedMC, un marco de aprendizaje federado multimodal eficiente en comunicación que aborda la heterogeneidad de los clientes y las limitaciones de ancho de banda mediante una arquitectura desacoplada y un algoritmo de selección conjunta de modalidades y clientes, logrando una reducción de la sobrecarga de comunicación superior a 20 veces sin sacrificar la precisión.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton2026-03-12🤖 cs.LG

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Este trabajo presenta HyWIA, un método novedoso de poda estructurada para modelos de lenguaje grandes que combina evaluaciones de importancia de pesos a granularidad fina y gruesa mediante un mecanismo de atención adaptativo, logrando un rendimiento superior en tareas posteriores en comparación con los enfoques actuales.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification

Este artículo presenta dos métodos para aproximar la información de Fisher en la estrategia de aprendizaje activo BAIT, reduciendo significativamente su complejidad computacional y permitiendo su aplicación eficiente y escalable en grandes conjuntos de datos como ImageNet sin sacrificar su rendimiento.

Denis Huseljic, Paul Hahn, Marek Herde + 2 more2026-03-12🤖 cs.LG

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Este estudio aplica técnicas de aprendizaje automático explicables a un conjunto de datos de 28 años en el Golfo de Trieste para predecir con precisión la toxicidad de los mejillones causada por floraciones de algas nocivas, identificando especies clave de dinoflagelados y factores ambientales como predictores fundamentales para mejorar los sistemas de alerta temprana.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Exploratory Optimal Stopping: A Singular Control Formulation

Este artículo presenta una formulación de control singular para problemas de parada óptima exploratoria mediante tiempos de parada aleatorizados y regularización por entropía residual, identificando la estrategia óptima única y proponiendo algoritmos de aprendizaje por refuerzo basados y libres de modelo con garantías de mejora de política.

Jodi Dianetti, Giorgio Ferrari, Renyuan Xu2026-03-12💰 q-fin

Mamba Neural Operator: Who Wins? Transformers vs. State-Space Models for PDEs

Este artículo presenta el Operador Neuronal Mamba (MNO), un nuevo marco teórico que supera a los Transformers en la resolución de ecuaciones diferenciales parciales al integrar modelos de espacio de estado estructurados para capturar con mayor eficacia las dinámicas continuas y las dependencias de largo alcance.

Chun-Wun Cheng, Jiahao Huang, Yi Zhang, Guang Yang, Carola-Bibiane Schönlieb, Angelica I. Aviles-Rivero2026-03-12🤖 cs.LG

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

El artículo presenta EarthquakeNPP, una nueva plataforma de referencia que corrige deficiencias en benchmarks anteriores y demuestra mediante experimentos que, a diferencia del modelo ETAS, los Procesos Puntuales Neuronales actuales aún no superan los métodos tradicionales para la predicción de sismos.

Samuel Stockman, Daniel Lawson, Maximilian Werner2026-03-12🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

El artículo propone una teoría de memorización geométrica que demuestra cómo los modelos de difusión experimentan un colapso suave en su capacidad de variación a medida que los datos escasean, condensándose gradualmente en configuraciones de baja energía que replican ejemplos específicos antes de alcanzar una copia exacta.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca Ambrogioni2026-03-12📊 stat

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

El artículo presenta 3D-PIUNet, un método híbrido que mejora la reconstrucción de fuentes cerebrales en EEG al inicializar una red neuronal 3D con una solución física inversa, logrando así una mayor precisión espacial que los enfoques tradicionales y de aprendizaje profundo puros.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi Nakajima2026-03-12⚡ eess

← Anterior Siguiente →