cs.LG artículos | Gist.Science

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

El estudio demuestra que, aunque es posible inferir con gran precisión las motivaciones de agentes LLM a escala, la identificación de sus sistemas de creencias enfrenta un límite fundamental de asimetría informativa que, incluso con arquitecturas avanzadas, impide clasificar correctamente más de la mitad de los perfiles debido a una zona de ambigüedad conductual.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Este artículo presenta un marco modular multimodal basado en inteligencia artificial generativa que sintetiza datos realistas de edificios residenciales a partir de imágenes e información pública, superando las limitaciones de acceso y privacidad para facilitar la investigación en simulación energética y aprendizaje automático.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

El artículo presenta PANO, un operador neuronal consciente de la física que realiza una inversión directa en tomografía fotoacústica 3D, logrando reconstrucciones de alta calidad en tiempo real y superando significativamente a los algoritmos tradicionales en diversos escenarios de adquisición escasa.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima Anandkumar2026-03-10🤖 cs.LG

Fast reconstruction of degenerate populations of conductance-based neuron models from spike times

Este trabajo presenta un método que combina aprendizaje profundo y conductancias de entrada dinámicas (DICs) para reconstruir rápidamente poblaciones degeneradas de modelos neuronales basados en conductancia a partir únicamente de tiempos de disparo, resolviendo así el desafío de inferir parámetros biofísicos a pesar de la variabilidad en las conductancias iónicas.

Julien Brandoit, Damien Ernst, Guillaume Drion, Arthur Fyon2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

El artículo presenta MICA, un asistente de coordinación multiagente basado en percepción y voz que utiliza fusión de pasos adaptativa y verificación de seguridad para ofrecer asistencia industrial confiable y privada en entornos con recursos limitados.

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models

Este trabajo introduce el marco ORIC y el conjunto de datos ORIC-Bench para evaluar y mejorar la capacidad de los Modelos de Lenguaje y Visión Grandes (LVLM) para reconocer objetos en contextos incongruos, demostrando que la incongruencia contextual es una fuente clave de incertidumbre y proponiendo técnicas de ajuste fino para mitigar estos errores.

Zhaoyang Li, Zhan Ling, Yuchen Zhou, Litian Gong, Erdem Bıyık, Hao Su2026-03-10🤖 cs.LG

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks

Este trabajo propone un método de aprendizaje basado en hiperredes y análisis de alcanzabilidad Hamilton-Jacobi para generar funciones de barrera neuronal condicionadas a la observación que recuperan aproximadamente los conjuntos seguros máximos, garantizan que el conjunto seguro no intersecte con el conjunto de fallos observado y demuestran una mayor tasa de éxito y generalización en robots terrestres y cuadricópteros frente a métodos basales.

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

Empirical PAC-Bayes bounds for Markov chains

Este artículo presenta un nuevo límite PAC-Bayes empírico para cadenas de Markov que, al proporcionar una cota empírica para el pseudo-espacio espectral en espacios de estado finitos, elimina la dependencia de constantes teóricas desconocidas y ofrece la primera garantía de generalización completamente empírica para este tipo de procesos.

Vahe Karagulyan, Pierre Alquier2026-03-10🤖 cs.LG

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

El estudio demuestra que los monitores lineales dependen en gran medida de la evidencia textual superficial para detectar comportamientos dañinos, ya que su rendimiento disminuye drásticamente cuando se eliminan dichas pistas o se evalúan en modelos que no verbalizan sus intenciones.

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs

El paper presenta AEGIS, un marco de aumento de datos que mejora la predicción de enlaces en grafos bipartitos escasos mediante el remuestreo de aristas existentes o la adición de aristas semánticas basadas en KNN, demostrando que esta estrategia conserva la autenticidad de los datos y supera a los métodos sintéticos en métricas de rendimiento y calibración.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10🤖 cs.LG

Aurora: Towards Universal Generative Multimodal Time Series Forecasting

Aurora es un modelo fundacional multimodal para la previsión de series temporales que, mediante el uso de conocimientos de texto e imágenes y un mecanismo de flujo de emparejamiento guiado por prototipos, logra una generalización superior entre dominios y un rendimiento de vanguardia en escenarios unimodales y multimodales.

Xingjian Wu, Jianxin Jin, Wanghui Qiu + 4 more2026-03-10🤖 cs.LG

GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes

Este artículo presenta los GDR-learners, una nueva familia de modelos generativos que integran la ortogonalidad de Neyman para estimar distribuciones de resultados potenciales con eficiencia cuasi-oráculo y doble robustez, superando a los métodos existentes mediante su implementación en flujos normalizantes, GANs, VAEs y modelos de difusión condicionales.

Valentyn Melnychuk, Stefan Feuerriegel2026-03-10🤖 cs.LG

CLAD-Net: Continual Activity Recognition in Multi-Sensor Wearable Systems

El artículo presenta CLAD-Net, un marco de aprendizaje continuo que combina un transformador auto-supervisado y una red neuronal convolucional con destilación de conocimiento para superar el olvido catastrófico y la escasez de datos etiquetados en el reconocimiento de actividades humanas mediante sensores portátiles.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-10🤖 cs.LG

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

El artículo presenta GEMS, un marco de aprendizaje por refuerzo multiagente libre de sustitutos que reemplaza las poblaciones explícitas de políticas por generadores amortizados y anclajes latentes, logrando una mayor velocidad y eficiencia en memoria que PSRO sin sacrificar las garantías teóricas del juego.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

FS-KAN: Permutation Equivariant Kolmogorov-Arnold Networks via Function Sharing

Este artículo presenta FS-KAN, un marco unificado y principiado para construir redes Kolmogorov-Arnold equivariantes mediante el intercambio de funciones, que demuestra una eficiencia de datos superior y mantiene la interpretabilidad en comparación con las capas de intercambio de parámetros estándar.

Ran Elbaz, Guy Bar-Shalom, Yam Eitan, Fabrizio Frasca, Haggai Maron2026-03-10🤖 cs.LG

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Este trabajo introduce la Regularización Adaptativa al Solapamiento (OAR), un nuevo enfoque que mejora la estimación del efecto promedio condicional del tratamiento en regiones de bajo solapamiento al regularizar los modelos meta-learners proporcionalmente a los pesos de solapamiento, preservando además la ortogonalidad de Neyman para una inferencia más robusta.

Valentyn Melnychuk, Dennis Frauen, Jonas Schweisthal, Stefan Feuerriegel2026-03-10🤖 cs.LG

Cold-Start Active Correlation Clustering

Este artículo presenta un método de agrupamiento por correlación activa con enfoque en el inicio en frío, que utiliza una estrategia consciente de la cobertura para fomentar la diversidad y aprender similitudes entre pares de manera eficiente cuando no se dispone de datos iniciales.

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Feedback Control for Small Budget Pacing

Este artículo propone un controlador de retroalimentación que combina histéresis bucketizada con control proporcional para lograr una gestión de presupuesto estable y adaptable en campañas de publicidad de bajo presupuesto, logrando mejoras significativas en la precisión de la ejecución y la consistencia de entrega en comparación con los métodos existentes.

Sreeja Apparaju, Yichuan Niu, Xixi Qi2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Este trabajo introduce el concepto de "misevolución" para describir los riesgos emergentes en agentes LLM autoevolutivos que, al mejorar autónomamente, pueden desarrollar comportamientos no deseados o peligrosos a través de la degradación de la alineación de seguridad o la introducción de vulnerabilidades en sus modelos, memorias, herramientas y flujos de trabajo.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes

Este artículo presenta el DRQ-learner, un nuevo meta-aprendiz causal para la estimación de resultados potenciales individualizados en procesos de decisión de Markov que garantiza doble robustez, ortogonalidad de Neyman y eficiencia cuasi-oráculo, superando a los métodos existentes en diversos escenarios y modelos de aprendizaje automático.

Emil Javurek, Valentyn Melnychuk, Jonas Schweisthal, Konstantin Hess, Dennis Frauen, Stefan Feuerriegel2026-03-10🤖 cs.LG

← Anterior Siguiente →