cs.LG artículos | Gist.Science

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

Este trabajo introduce el marco ORIC y el conjunto de datos ORIC-Bench para evaluar y mejorar la capacidad de los Modelos de Lenguaje y Visión Grandes (LVLM) para reconocer objetos en contextos incongruos, demostrando que la incongruencia contextual es una fuente clave de incertidumbre y proponiendo técnicas de ajuste fino para mitigar estos errores.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabajo propone un método de aprendizaje basado en hiperredes y análisis de alcanzabilidad Hamilton-Jacobi para generar funciones de barrera neuronal condicionadas a la observación que recuperan aproximadamente los conjuntos seguros máximos, garantizan que el conjunto seguro no intersecte con el conjunto de fallos observado y demuestran una mayor tasa de éxito y generalización en robots terrestres y cuadricópteros frente a métodos basales.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Este artículo presenta un nuevo límite PAC-Bayes empírico para cadenas de Markov que, al proporcionar una cota empírica para el pseudo-espacio espectral en espacios de estado finitos, elimina la dependencia de constantes teóricas desconocidas y ofrece la primera garantía de generalización completamente empírica para este tipo de procesos.

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

El estudio demuestra que los monitores lineales dependen en gran medida de la evidencia textual superficial para detectar comportamientos dañinos, ya que su rendimiento disminuye drásticamente cuando se eliminan dichas pistas o se evalúan en modelos que no verbalizan sus intenciones.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

El paper presenta AEGIS, un marco de aumento de datos que mejora la predicción de enlaces en grafos bipartitos escasos mediante el remuestreo de aristas existentes o la adición de aristas semánticas basadas en KNN, demostrando que esta estrategia conserva la autenticidad de los datos y supera a los métodos sintéticos en métricas de rendimiento y calibración.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Aurora es un modelo fundacional multimodal para la previsión de series temporales que, mediante el uso de conocimientos de texto e imágenes y un mecanismo de flujo de emparejamiento guiado por prototipos, logra una generalización superior entre dominios y un rendimiento de vanguardia en escenarios unimodales y multimodales.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Este artículo presenta los GDR-learners, una nueva familia de modelos generativos que integran la ortogonalidad de Neyman para estimar distribuciones de resultados potenciales con eficiencia cuasi-oráculo y doble robustez, superando a los métodos existentes mediante su implementación en flujos normalizantes, GANs, VAEs y modelos de difusión condicionales.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

El artículo presenta CLAD-Net, un marco de aprendizaje continuo que combina un transformador auto-supervisado y una red neuronal convolucional con destilación de conocimiento para superar el olvido catastrófico y la escasez de datos etiquetados en el reconocimiento de actividades humanas mediante sensores portátiles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

El artículo presenta GEMS, un marco de aprendizaje por refuerzo multiagente libre de sustitutos que reemplaza las poblaciones explícitas de políticas por generadores amortizados y anclajes latentes, logrando una mayor velocidad y eficiencia en memoria que PSRO sin sacrificar las garantías teóricas del juego.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

Este artículo presenta FS-KAN, un marco unificado y principiado para construir redes Kolmogorov-Arnold equivariantes mediante el intercambio de funciones, que demuestra una eficiencia de datos superior y mantiene la interpretabilidad en comparación con las capas de intercambio de parámetros estándar.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabajo introduce la Regularización Adaptativa al Solapamiento (OAR), un nuevo enfoque que mejora la estimación del efecto promedio condicional del tratamiento en regiones de bajo solapamiento al regularizar los modelos meta-learners proporcionalmente a los pesos de solapamiento, preservando además la ortogonalidad de Neyman para una inferencia más robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

Este artículo presenta un método de agrupamiento por correlación activa con enfoque en el inicio en frío, que utiliza una estrategia consciente de la cobertura para fomentar la diversidad y aprender similitudes entre pares de manera eficiente cuando no se dispone de datos iniciales.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

Este artículo propone un controlador de retroalimentación que combina histéresis bucketizada con control proporcional para lograr una gestión de presupuesto estable y adaptable en campañas de publicidad de bajo presupuesto, logrando mejoras significativas en la precisión de la ejecución y la consistencia de entrega en comparación con los métodos existentes.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este trabajo introduce el concepto de "misevolución" para describir los riesgos emergentes en agentes LLM autoevolutivos que, al mejorar autónomamente, pueden desarrollar comportamientos no deseados o peligrosos a través de la degradación de la alineación de seguridad o la introducción de vulnerabilidades en sus modelos, memorias, herramientas y flujos de trabajo.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artículo presenta el DRQ-learner, un nuevo meta-aprendiz causal para la estimación de resultados potenciales individualizados en procesos de decisión de Markov que garantiza doble robustez, ortogonalidad de Neyman y eficiencia cuasi-oráculo, superando a los métodos existentes en diversos escenarios y modelos de aprendizaje automático.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

Privately Estimating Black-Box Statistics

Este trabajo presenta un esquema para la estimación diferencialmente privada de funciones de caja negra que equilibra la eficiencia estadística y la eficiencia de oráculo, complementado con cotas inferiores que demuestran su cercanía a la optimalidad.

Günter F. Steinke, Thomas Steinke2026-03-10🤖 cs.LG

Stochastic Self-Organization in Multi-Agent Systems

El marco SelfOrg propone un sistema de autoorganización estocástica para agentes basados en LLMs que, mediante el uso de valores de Shapley aproximados y la construcción dinámica de grafos acíclicos dirigidos, optimiza la comunicación entre agentes sin supervisión externa, logrando mejoras significativas en el rendimiento, especialmente en configuraciones con modelos débiles.

Nurbek Tastan, Samuel Horvath, Karthik Nandakumar2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

El artículo presenta CroSTAta, un transformador que utiliza un mecanismo de atención a transiciones de estado cruzadas para mejorar la robustez y el rendimiento en la manipulación robótica al modelar explícitamente patrones temporales como fallos y recuperaciones, superando significativamente a los métodos de atención estándar y redes recurrentes.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Double projection for reconstructing dynamical systems: between stochastic and deterministic regimes

Este artículo presenta un nuevo método de doble proyección basado en autoencoders variacionales dinámicos que estima trayectorias de estado y series temporales de ruido para reconstruir sistemas dinámicos, permitiendo una evolución multietapa eficiente en un espacio de estado de baja dimensión y facilitando la comparación entre regímenes estocásticos y deterministas.

Viktor Sip, Martin Breyton, Spase Petkoski, Viktor Jirsa2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

Este estudio presenta un flujo de trabajo automatizado basado en agentes de modelos de lenguaje grande que extrae y curó la base de datos de termoelectricidad más grande hasta la fecha, con más de 27,000 registros de propiedades estructurales y de rendimiento obtenidos de 10,000 artículos científicos, facilitando así el descubrimiento de materiales a gran escala.

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

← Anterior Siguiente →