MASEval: Extending Multi-Agent Evaluation from Models to Systems

El artículo presenta MASEval, un marco de evaluación agnóstico que demuestra que las decisiones de implementación del sistema (como la topología y la lógica de orquestación) impactan el rendimiento tanto como la elección del modelo, permitiendo así una comparación sistemática de componentes completos de sistemas multiagente.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

Este estudio demuestra que los modelos centrados en el canal, como los simuladores de trazado de rayos, sobreestiman sistemáticamente el rendimiento de extremo a extremo en redes 5G privadas al ignorar la adaptación dinámica de las capas espaciales MIMO, mientras que un enfoque basado en datos mediante regresión de procesos gaussianos logra una predicción mucho más precisa al aprender directamente del rendimiento real del sistema.

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

Este artículo presenta FSbuHD, un nuevo modelo de selección de características para sistemas de información híbridos basado en la teoría de conjuntos difusos-rough que reformula el problema como una optimización utilizando distancias combinadas para superar las limitaciones de tiempo y ruido de los métodos tradicionales, demostrando su superioridad en modos normal y optimista mediante pruebas en conjuntos de datos UCI.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Este artículo presenta un marco ablativo integral para la predicción selectiva que introduce el método de apuestas informado por transferencia (TIB) para mejorar la cuantificación de incertidumbre en entornos con escasez de datos mediante el uso de perfiles de riesgo de dominios fuente, demostrando superioridad teórica y empírica sobre nueve familias de cotas existentes en múltiples benchmarks.

Abhinaba Basu2026-03-11🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

El artículo presenta FedLECC, una estrategia ligera de selección de clientes para el aprendizaje federado que agrupa a los dispositivos según la similitud de sus distribuciones de etiquetas y prioriza aquellos con mayor pérdida local, logrando así mejorar la precisión, reducir las rondas de comunicación y disminuir la sobrecarga en entornos con datos no IID.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

Este artículo presenta un marco de evaluación de privacidad multi-vectorial diseñado para cuantificar y auditar los riesgos de memorización en modelos de lenguaje genómico, demostrando que estos sistemas pueden memorizar secuencias sensibles y que se requiere una auditoría combinada para evaluar dicha vulnerabilidad de manera integral.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

El artículo presenta MedCBR, un marco de razonamiento basado en conceptos que integra guías clínicas y modelos de lenguaje-visión para mejorar la interpretabilidad y el rendimiento diagnóstico en imágenes médicas mediante la generación de narrativas clínicas estructuradas.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Este artículo propone un marco de aprendizaje por refuerzo jerárquico asistido por gemelo digital que optimiza conjuntamente la política de ajuste de inclinación de antenas y la estrategia de recolección de datos en redes móviles, logrando reducir la latencia de recopilación de datos físicos hasta un 28,01% en comparación con métodos existentes.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

El artículo presenta ULFS-KDPE, un estimador de plug-in sesgado basado en un modelo desfavorable universal dentro de un espacio de Hilbert de núcleo reproductor (RKHS), que permite estimar parámetros diferenciables en modelos no paramétricos alcanzando la eficiencia semiparamétrica sin necesidad de derivar ni evaluar explícitamente las funciones de influencia eficiente.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

El artículo presenta Semantic Level of Detail (SLoD), un marco que utiliza la difusión del núcleo de calor en variedades hiperbólicas para establecer una operación de zoom continua que controla la resolución semántica, identifica automáticamente los límites entre niveles de abstracción mediante brechas espectrales y demuestra su eficacia para descubrir jerarquías significativas en grafos de conocimiento reales como WordNet.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

El artículo presenta MAcPNN, un paradigma de aprendizaje mutuo inspirado en la teoría sociocultural de Vygotsky que utiliza redes neuronales progresivas continuas (cPNN) en dispositivos IoT autónomos para mejorar el rendimiento en flujos de datos mediante la colaboración selectiva ante cambios de concepto, reduciendo así la necesidad de comunicación constante en comparación con el aprendizaje federado.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG