cs.LG artículos | Gist.Science

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Este artículo presenta un marco teórico y empírico para entrenar políticas robustas en entornos parcialmente observables mediante un POMDP adversario que selecciona distribuciones latentes iniciales, demostrando que la exposición estructurada a estas distribuciones reduce significativamente las brechas de robustez y valida principios diagnósticos con garantías finitas.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Este artículo explora la propuesta inusual de asignar a una inteligencia artificial avanzada el objetivo principal de ser apagada para mitigar el riesgo de que se resista a ser desactivada, analizando las condiciones bajo las cuales esta estrategia podría ser viable.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

El artículo presenta ShakyPrepend, un nuevo algoritmo de aprendizaje multi-grupo que utiliza herramientas inspiradas en la privacidad diferencial para mejorar los garantías teóricas y adaptarse a la estructura de grupos y la heterogeneidad espacial en entornos prácticos.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

El marco de Transición de Jerarquía de Normas (NHT) explica que el aprendizaje tardío de representaciones estructuradas y el fenómeno de "grokking" en redes neuronales surgen de la lenta traversía, impulsada por la regularización, desde soluciones de alto nivel basadas en atajos hacia representaciones de menor nivel, donde el retraso en esta transición crece logarítmicamente con la relación entre las normas de los atajos y las estructuras.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Este artículo presenta un método de detección de interferencias para redes 5G basado en la Máquina Tsetlin Convolucional (CTM) que, al operar directamente sobre señales de sincronización, ofrece una solución interpretable y eficiente en hardware con un entrenamiento 9,5 veces más rápido y un uso de memoria 14 veces menor que las redes neuronales convolucionales, validada experimentalmente en un entorno de prueba real y proyectada para su implementación en FPGAs.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

Este artículo presenta el Mecanismo de Conceptos (M-CBM), un nuevo enfoque para Modelos de Cuello de Botella Conceptual que extrae y nombra conceptos directamente de un modelo de caja negra mediante Autoencoders Dispersos y LLMs multimodales, logrando así un rendimiento superior y explicaciones más concisas que los métodos anteriores al controlar rigurosamente la fuga de información.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Este trabajo propone un marco de aprendizaje de representaciones invariantes a la práctica clínica que, al combinar la minimización de riesgo supervisada con regularización adversaria y penalizaciones de riesgo invariante, mejora significativamente el rendimiento y la calibración de los modelos predictivos multimodales ante cambios sistemáticos en la distribución de los datos entre diferentes instituciones.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

El artículo presenta DistGP, un método de aprendizaje multi-robot que utiliza un modelo de proceso gaussiano disperso y la propagación de creencias gaussianas para entrenar de forma distribuida y asíncrona un modelo global con rendimiento superior a las alternativas existentes, incluso en entornos con conectividad dinámica y comunicación limitada.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

El AgrI Challenge es una competencia centrada en los datos que introduce el paradigma de Validación Inter-Equipos (CTV) para demostrar que el entrenamiento colaborativo con conjuntos de datos heterogéneos recolectados independientemente mejora significativamente la generalización de los modelos de visión agrícola frente a los cambios de distribución, superando las limitaciones de los enfoques tradicionales basados en un solo origen de datos.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Este trabajo propone el uso de priores generativos con complejidad ajustable mediante *nested dropout* para resolver problemas inversos como la compresión sensorial, demostrando empíricamente que superan a los modelos de complejidad fija al reducir errores de reconstrucción y ofreciendo un análisis teórico sobre la sintonización óptima frente al ruido.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

El artículo presenta NT-Diffusion, un modelo de difusión jerárquico que mejora la eficiencia computacional y la precisión en la predicción probabilística a largo plazo del riesgo de incendios forestales compartiendo etapas tempranas de desruido y ramificándose para refinar horizontes específicos.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Este estudio revela que en el régimen de modelos pequeños (menos de 20 millones de parámetros), las leyes de escalado siguen una potencia más pronunciada que en modelos grandes, pero con una estructura de errores distinta, saturación temprana y una calibración mejor en los tamaños más reducidos, lo que demuestra que la validación debe realizarse específicamente en el tamaño objetivo para despliegues en dispositivos de borde.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Este artículo propone un marco de Aprendizaje por Refuerzo Multiagente Jerárquico (HMARL) para el enfoque de haces en sistemas mmWave que elimina la sobrecarga de estimación del estado del canal (CSI) al utilizar datos de localización de usuarios, logrando mejoras significativas en la intensidad de la señal recibida y una escalabilidad robusta mediante una arquitectura de entrenamiento centralizado y ejecución descentralizada.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

ConfHit es un marco de diseño generativo libre de distribuciones que ofrece garantías de validez estadística sin necesidad de acceso a un oráculo experimental, permitiendo certificar y refinar conjuntos de moléculas generadas para asegurar la presencia de candidatos prometedores con un nivel de confianza especificado.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Este artículo propone un marco de estimación de calidad para traducción automática en escenarios de bajos recursos y dominios específicos (como salud y legal) en idiomas indios, demostrando que la adaptación de capas intermedias de modelos de lenguaje grandes mediante técnicas como ALOPE y LoRMA supera a los enfoques basados únicamente en prompts, especialmente en modelos de pesos abiertos.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Sparsity and Out-of-Distribution Generalization

Este artículo propone un marco teórico que explica la generalización fuera de distribución mediante la preferencia por hipótesis "esparcidas" (que dependen de pocas características) y demuestra un teorema que garantiza su validez cuando las distribuciones de entrenamiento y prueba se superponen en las características relevantes, extendiendo así los límites clásicos de complejidad de muestra.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

El artículo presenta MARIGOLD, un marco algorítmico unificado que aborda la ineficiencia computacional de los métodos de balanceo de gradientes en el aprendizaje multitarea reformulando el problema como una optimización bi-nivel y resolviéndolo de manera eficiente mediante métodos de orden cero.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

Este artículo presenta un sistema de triaje legal determinista y reproducible basado en codificadores duales y bandas difusas calibradas que equilibra la precisión del cumplimiento normativo con la transparencia y la trazabilidad de auditoría, superando a los modelos opacos y a las reglas manuales en la clasificación de evidencia contractual.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Este trabajo generaliza el objetivo del autoencoder lineal EDLAE mediante una Pérdida Cuadrática Esperada Desacoplada (DEQL), lo que permite derivar soluciones eficientes para un rango más amplio de hiperparámetros ( $b > 0$ ) que superan el rendimiento del modelo original en tareas de recomendación.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este trabajo introduce el marco teórico de la "Capacidad del Canal de Contexto" para explicar el olvido catastrófico en el aprendizaje continuo, demostrando que la arquitectura (específicamente la regeneración condicional de parámetros) es más determinante que el algoritmo para lograr un aprendizaje sin olvido y proponiendo nuevas direcciones de investigación basadas en este principio.

Ran Cheng2026-03-10🤖 cs.LG

← Anterior Siguiente →