From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents

El documento propone el marco de Evolución de Autonomía Jerárquica (HAE) para abordar las vulnerabilidades de seguridad emergentes en los agentes de IA mediante una taxonomía de amenazas y defensas organizadas en tres niveles: integridad cognitiva, interacción con herramientas y riesgos sistémicos en ecosistemas multiagente.

Xiaolei Zhang, Lu Zhou, Xiaogang Xu, Jiafei Wu, Tianyu Du, Heqing Huang, Hao Peng, Zhe Liu2026-03-10💻 cs

A Unified View of Drifting and Score-Based Models

Este artículo establece una conexión precisa entre los modelos de deriva y los basados en puntuación, demostrando que la deriva con núcleo gaussiano equivale a un objetivo de coincidencia de puntuaciones en distribuciones suavizadas y proporcionando un marco unificado que explica su relación con métodos como DMD y su validez en diversos regímenes.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

InterReal: A Unified Physics-Based Imitation Framework for Learning Human-Object Interaction Skills

El marco InterReal es un sistema unificado de aprendizaje por imitación basado en física que permite a los robots humanoides aprender y ejecutar habilidades de interacción humano-objeto en el mundo real mediante la mejora de la estabilidad de la política con datos aumentados y un aprendiz automático de recompensas, logrando un alto rendimiento en tareas como el agarre y empuje de cajas.

Dayang Liang, Yuhang Lin, Xinzhe Liu, Jiyuan Shi, Yunlong Liu, Chenjia Bai2026-03-10💻 cs

SketchGraphNet: A Memory-Efficient Hybrid Graph Transformer for Large-Scale Sketch Corpora Recognition

Este trabajo presenta SketchGraphNet, una arquitectura híbrida de grafos que combina paso de mensajes local con un mecanismo de atención global eficiente en memoria para el reconocimiento de bocetos a gran escala, y evalúa su rendimiento en un nuevo benchmark de 3,44 millones de grafos, logrando una alta precisión y reduciendo significativamente el uso de memoria y tiempo de entrenamiento en comparación con métodos anteriores.

Shilong Chen, Mingyuan Li, Zhaoyang Wang, Zhonglin Ye, Haixing Zhao2026-03-10💻 cs

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

Este artículo presenta un marco preentrenado informado por dinámicas neuronales que supera a los métodos dominantes al construir redes funcionales cerebrales personalizadas y generalizables en escenarios heterogéneos, logrando una representación precisa de los patrones de actividad neural sin depender de atlas predefinidos o suposiciones lineales.

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

El artículo presenta UniLongGen, una estrategia de inferencia sin entrenamiento que mejora la generación de imágenes interleaved a largo plazo mediante la curación dinámica del contexto para eliminar señales visuales interferentes que degradan la calidad de la generación.

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

COOL-MC: Verifying and Explaining RL Policies for Multi-bridge Network Maintenance

El artículo presenta COOL-MC, una herramienta que verifica y explica políticas de aprendizaje por refuerzo para el mantenimiento de redes de múltiples puentes, demostrando mediante verificación de modelos probabilísticos y análisis de explicabilidad que, aunque la política aprendida presenta una probabilidad de violación de seguridad del 3,5% y un sesgo sistemático hacia un puente específico, el marco permite un análisis formal e interpretable de dichas estrategias.

Dennis Gross2026-03-10🤖 cs.LG

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

Este trabajo introduce un marco de envenenamiento de hablantes dirigido para modelos de texto a voz de cero disparos, formalizando el problema de la supresión de identidades específicas y evaluando su eficacia en términos de equilibrio entre privacidad y utilidad, demostrando resultados sólidos hasta 15 hablantes pero limitaciones de escalabilidad a 100 debido al solapamiento de identidades.

Thanapat Trachu, Thanathai Lertpetchpun, Sai Praneeth Karimireddy, Shrikanth Narayanan2026-03-10💻 cs

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

Este trabajo presenta Nwāchā Munā, un corpus de voz en devanagari de 5,39 horas para el nepalí (Newari), y demuestra que la transferencia proximal desde el nepalí es una alternativa computacionalmente eficiente a los modelos multilingües masivos para el reconocimiento automático de voz en esta lengua en peligro.

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal2026-03-10💬 cs.CL

GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

El paper propone GRD-Net, una arquitectura que combina una red generativa adversarial con un módulo de atención a regiones de interés para detectar y localizar anomalías en inspecciones visuales industriales, aprendiendo tanto de productos defectuosos sintéticos como de datos reales sin depender de algoritmos de post-procesamiento sesgados.

Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma2026-03-10🤖 cs.LG

A Systematic Comparison of Training Objectives for Out-of-Distribution Detection in Image Classification

Este artículo presenta una comparación sistemática de cuatro objetivos de entrenamiento para la detección de distribuciones fuera de contexto en clasificación de imágenes, revelando que la Pérdida de Entropía Cruzada ofrece el rendimiento más consistente tanto en distribuciones cercanas como lejanas en comparación con las pérdidas de prototipo, tripletas y precisión promedio.

Furkan Genç, Onat Özdemir, Emre Akbas2026-03-10🤖 cs.LG

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

Este artículo presenta un marco de detección de anomalías semisupervisado basado en una arquitectura generativa adversarial con autoencoder residual, diseñado para inspección visual en línea de producción farmacéutica de alta velocidad que logra un alto rendimiento de detección y localización espacial dentro de las estrictas restricciones de tiempo y hardware.

Niccolò Ferrari, Nicola Zanarini, Michele Fraccaroli, Alice Bizzarri, Evelina Lamma2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Este artículo presenta una tubería de generación de datos sintéticos basada en un gemelo digital del Aeropuerto Internacional de Argel para entrenar un detector YOLO-OBB, demostrando que la combinación de estos datos con solo el 40% de las anotaciones reales iguala o supera el rendimiento de un modelo entrenado exclusivamente con datos reales completos, reduciendo así el esfuerzo de anotación entre un 25% y un 35%.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

El artículo presenta AtomicVLA, un marco unificado de planificación y ejecución que utiliza una biblioteca de habilidades atómicas y un mecanismo de expertos guiado por habilidades para superar las limitaciones de escalabilidad y aprendizaje continuo de los modelos VLA existentes en tareas robóticas de largo horizonte.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs