3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

El artículo presenta 3D-RFT, un marco pionero que aplica el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR) a la comprensión de escenas 3D basadas en video, optimizando directamente los modelos multimodales mediante funciones de recompensa derivadas de métricas de evaluación para lograr un rendimiento superior al estado del arte en tareas de percepción y razonamiento espacial.

Xiongkun Linghu, Jiangyong Huang, Baoxiong Jia + 1 more2026-03-06🤖 cs.AI

BioLLMAgent: A Hybrid Framework with Enhanced Structural Interpretability for Simulating Human Decision-Making in Computational Psychiatry

El artículo presenta BioLLMAgent, un marco híbrido que combina modelos de aprendizaje por refuerzo y agentes de lenguaje grande para simular la toma de decisiones humana en psiquiatría computacional, logrando un equilibrio entre realismo conductual e interpretabilidad estructural para probar hipótesis y estrategias de intervención.

Zuo Fei, Kezhi Wang, Xiaomin Chen + 1 more2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Este artículo presenta el Índice de Credibilidad mediante Estabilidad de Explicaciones (CIES), una métrica matemática diseñada para cuantificar la robustez de las explicaciones de la IA en entornos empresariales, demostrando que la estabilidad de las razones detrás de las predicciones es crucial para la toma de decisiones y ofreciendo un sistema de alerta confiable frente al ruido en los datos.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

S5-SHB Agent: Society 5.0 enabled Multi-model Agentic Blockchain Framework for Smart Home

Este artículo presenta el marco S5-SHB-Agent, una solución basada en blockchain y multiagentes impulsada por la visión de la Sociedad 5.0 que orquesta modelos de IA adaptativos y un sistema de gobernanza de cuatro niveles para gestionar de forma segura, transparente y controlada por los residentes los diversos aspectos de los hogares inteligentes.

Janani Rangila, Akila Siriweera, Incheon Paik + 3 more2026-03-06🤖 cs.AI

AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems

El artículo presenta AegisUI, un marco de trabajo que genera y analiza 4000 cargas de trabajo de interfaz de usuario para detectar anomalías conductuales mediante la comparación de tres algoritmos de detección, demostrando que un modelo de Random Forest alcanza el mejor rendimiento general (F1 0.843) mientras que un autoencoder ofrece una alternativa viable sin necesidad de etiquetas maliciosas.

Mohd Safwan Uddin, Saba Hajira2026-03-06🤖 cs.AI

The Trilingual Triad Framework: Integrating Design, AI, and Domain Knowledge in No-code AI Smart City Course

Este artículo presenta el marco "Trilingüe Triádico", que demuestra cómo la integración de diseño, inteligencia artificial y conocimiento de dominio en un curso de posgrado permite a los estudiantes transitar de ser usuarios pasivos a diseñadores activos de sistemas de IA sin código, fomentando así la alfabetización en IA y la agencia del aprendiz mediante un proceso de aprendizaje constructivista.

Qian Huang, King Wang Poon2026-03-06🤖 cs.AI

WebFactory: Automated Compression of Foundational Language Intelligence into Grounded Web Agents

El paper presenta WebFactory, un pipeline de aprendizaje por refuerzo automatizado y de ciclo cerrado que comprime eficientemente el conocimiento latente de los modelos de lenguaje en agentes de GUI capaces de generalizar, superando a los métodos actuales al entrenarse con datos sintéticos de solo 10 sitios web en lugar de grandes volúmenes de anotaciones humanas.

Sicheng Fan, Qingyun Shi, Shengze Xu + 5 more2026-03-06🤖 cs.AI

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

Este artículo presenta MUTEX, un marco basado en transformadores multilingües XLM-RoBERTa y campos aleatorios conditivos que logra el primer resultado de referencia supervisado para la detección de span tóxico en urdu a nivel de token, superando las limitaciones de los enfoques anteriores al abordar la complejidad lingüística y la codificación de código.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

A 360-degree Multi-camera System for Blue Emergency Light Detection Using Color Attention RT-DETR and the ABLDataset

Este estudio presenta un sistema avanzado de detección de luces azules de emergencia mediante un conjunto de cuatro cámaras de gran angular y el modelo RT-DETR mejorado con un bloque de atención al color, logrando una alta precisión y estimación de ángulos de aproximación para reforzar la seguridad vial y los sistemas ADAS.

Francisco Vacalebri-Lloret, Lucas Banchero, Jose J. Lopez + 1 more2026-03-06🤖 cs.AI

Cyber Threat Intelligence for Artificial Intelligence Systems

Este artículo examina la evolución de la inteligencia de amenazas cibernéticas para proteger sistemas de inteligencia artificial, analizando sus vulnerabilidades específicas, proponiendo una base de conocimientos con indicadores de compromiso y técnicas de similitud, e identificando brechas y direcciones futuras para un marco práctico de defensa.

Natalia Krawczyk, Mateusz Szczepkowski, Adrian Brodzik, Krzysztof Bocianiak2026-03-06🔒 cs.CR

Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile

El artículo presenta Jagarin, una arquitectura de tres capas que resuelve el dilema de ejecutar agentes de IA personales en móviles mediante un hibernado estructurado y un despertar bajo demanda, integrando un motor de alerta local (DAWN), un proxy de identidad de correo (ARIA) y un protocolo de comunicación máquina a máquina (ACE) para gestionar obligaciones sin comprometer la batería ni la privacidad.

Ravi Kiran Kadaboina2026-03-06🤖 cs.AI

GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement

El artículo presenta GEM-TFL, un marco de localización de falsificaciones temporales que cierra la brecha entre la supervisión débil y completa mediante una optimización basada en EM, un refinamiento temporal sin entrenamiento y un módulo de grafos para mejorar la precisión y robustez en la detección de manipulaciones en videos.

Xiaodong Zhu, Yuanming Zheng, Suting Wang + 4 more2026-03-06🤖 cs.AI