EgoWorld: Translating Exocentric View to Egocentric View using Rich Exocentric Observations

El paper presenta EgoWorld, un marco novedoso que supera las limitaciones de los métodos actuales al reconstruir vistas egocéntricas a partir de observaciones exocéntricas ricas (como nubes de puntos, poses de manos y descripciones textuales) mediante la reproyección de nubes de puntos y modelos de difusión, logrando un rendimiento de vanguardia y una generalización robusta en múltiples conjuntos de datos y escenarios del mundo real.

Junho Park, Andrew Sangwoo Ye, Taein Kwon2026-03-05🤖 cs.AI

From Ambiguity to Accuracy: The Transformative Effect of Coreference Resolution on Retrieval-Augmented Generation systems

Este estudio demuestra que la resolución de coreferencia mejora significativamente la eficacia de la recuperación y la calidad de las respuestas en los sistemas de Generación Aumentada por Recuperación (RAG), especialmente al aplicar estrategias de agrupación media y al beneficiar desproporcionadamente a los modelos más pequeños.

Youngjoon Jang, Seongtae Hong, Junyoung Son + 3 more2026-03-05🤖 cs.AI

HAMLET: A Hierarchical and Adaptive Multi-Agent Framework for Live Embodied Theatrics

El artículo presenta HAMLET, un marco jerárquico y adaptativo de agentes múltiples que utiliza modelos de lenguaje grandes para generar y ejecutar obras de teatro inmersivas e interactivas en tiempo real, donde los actores autónomos improvisan diálogos y manipulan objetos físicos en un entorno escénico, todo ello evaluado mediante un modelo crítico especializado.

Shufan Jiang, Sizhou Chen, Chi Zhang + 2 more2026-03-05🤖 cs.AI

From Privacy to Trust in the Agentic Era: A Taxonomy of Challenges in Trustworthy Federated Learning Through the Lens of Trust Report 2.0

Este artículo propone un marco para la Aprendizaje Federado Confiable (TFL) que, a través del "Trust Report 2.0", trasciende la privacidad tradicional para abordar la confianza como una condición operativa dinámica en la era de la IA agéntica, ofreciendo una taxonomía de desafíos y un plan de coordinación validado en el ámbito de la oncología.

Nuria Rodríguez-Barroso, Mario García-Márquez, M. Victoria Luzón + 1 more2026-03-05🤖 cs.AI

Text2VLM: Adapting Text-Only Datasets to Evaluate Alignment Training in Visual Language Models

El artículo presenta Text2VLM, un pipeline innovador que adapta conjuntos de datos de solo texto a formatos multimodales para evaluar la resistencia de los Modelos de Lenguaje Visual frente a ataques de inyección de prompts tipográficos, revelando vulnerabilidades críticas en los modelos de código abierto y proporcionando una herramienta escalable para mejorar su seguridad.

Gabriel Downer, Sean Craven, Damian Ruck + 1 more2026-03-05🤖 cs.AI

When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Este artículo presenta CoEA, un método de recomendación serendípica que supera las limitaciones de los sistemas tradicionales y de los marcos actuales basados en LLM mediante el módulo DSIE para modelar intereses grupales e individuales y el mecanismo PCO para lograr una optimización dinámica en bucle cerrado que equilibra relevancia y novedad.

Hongxiang Lin, Hao Guo, Zeshun Li + 6 more2026-03-05🤖 cs.AI

ERDES: A Benchmark Video Dataset for Retinal Detachment and Macular Status Classification in Ocular Ultrasound

Este artículo presenta ERDES, el primer conjunto de datos de acceso abierto de videos de ultrasonido ocular etiquetados para la detección de desprendimiento de retina y la clasificación del estado macular, junto con benchmarks de referencia generados mediante el entrenamiento de múltiples arquitecturas de aprendizaje profundo.

Yasemin Ozkut, Pouyan Navard, Srikar Adhikari + 4 more2026-03-05🤖 cs.AI

Effective Sample Size and Generalization Bounds for Temporal Networks

Este trabajo propone una metodología de evaluación dependiente de la dependencia temporal que controla el tamaño de muestra efectivo en lugar de la longitud bruta, estableciendo garantías de generalización para redes convolucionales temporales y demostrando empíricamente que una mayor dependencia puede reducir la brecha de generalización cuando se compara bajo este marco, a diferencia de las evaluaciones estándar.

Barak Gahtan, Alex M. Bronstein2026-03-05🤖 cs.AI

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering

El artículo presenta ObfusQAte, un marco innovador que evalúa la robustez de los modelos de lenguaje grandes mediante preguntas de respuesta factual obfuscadas en tres niveles (indirecta de entidades nombradas, distractores y sobrecarga contextual), revelando que estos modelos tienden a fallar o alucinar ante variaciones lingüísticas sutiles.

Shubhra Ghosh, Abhilekh Borah, Aditya Kumar Guru + 1 more2026-03-05🤖 cs.AI

Zono-Conformal Prediction: Zonotope-Based Uncertainty Quantification for Regression and Classification Tasks

Este artículo presenta la predicción zono-conformal, un método novedoso que utiliza zonotopos para cuantificar la incertidumbre en tareas de regresión y clasificación mediante un programa lineal eficiente, logrando garantías de cobertura estadística con menor conservadurismo que las técnicas existentes.

Laura Lützow, Michael Eichelbeck, Mykel J. Kochenderfer + 1 more2026-03-05🤖 cs.AI