SceneTransporter: Optimal Transport-Guided Compositional Latent Diffusion for Single-Image Structured 3D Scene Generation

El artículo presenta SceneTransporter, un marco de generación de escenas 3D estructurado a partir de una sola imagen que utiliza un objetivo de transporte óptimo entropico dentro de un modelo de difusión para resolver la asignación global de correlaciones, logrando así una coherencia de instancias y una fidelidad geométrica superiores al evitar el entrelazamiento y la fragmentación de los objetos.

Ling Wang, Hao-Xiang Guo, Xinzhou Wang + 9 more2026-02-27💻 cs

Reflectance Multispectral Imaging for Soil Composition Estimation and USDA Texture Classification

Este artículo presenta un sistema de imagen multiespectral de bajo costo y un marco de aprendizaje automático que permiten predecir con alta precisión la composición y las clases de textura del suelo, ofreciendo una solución no destructiva y desplegable en campo para la agricultura de precisión y la ingeniería geotécnica.

G. A. S. L Ranasinghe, J. A. S. T. Jayakody, M. C. L. De Silva + 5 more2026-02-27⚡ eess

Moral Preferences of LLMs Under Directed Contextual Influence

Este estudio demuestra que las preferencias morales de los modelos de lenguaje, evaluadas en escenarios de triaje tipo problema del tranvía, son altamente sensibles a influencias contextuales dirigidas que pueden alterar sus decisiones de manera sistemática y a veces contraproducente, revelando que la neutralidad aparente no garantiza estabilidad bajo presión contextual.

Phil Blandfort, Tushar Karayil, Urja Pawar + 3 more2026-02-27💬 cs.CL

A data- and compute-efficient chest X-ray foundation model beyond aggressive scaling

El artículo presenta CheXficient, un modelo fundacional de rayos X torácicos que, mediante una curación de datos activa y selectiva, logra un rendimiento comparable o superior a modelos entrenados con conjuntos de datos completos utilizando menos del 27% de los recursos computacionales y solo el 22,7% de los datos, mejorando así la eficiencia y la generalización en condiciones médicas poco frecuentes.

Chong Wang, Yabin Zhang, Yunhe Gao + 9 more2026-02-27💻 cs

OSDaR-AR: Enhancing Railway Perception Datasets via Multi-modal Augmented Reality

Este artículo presenta OSDaR-AR, un nuevo conjunto de datos público generado mediante un marco de realidad aumentada multimodal que integra objetos virtuales fotorrealistas en secuencias ferroviarias reales para superar la escasez de datos anotados y mejorar los sistemas de percepción mediante una colocación precisa y coherencia espaciotemporal.

Federico Nesti, Gianluca D'Amico, Mauro Marinoni + 1 more2026-02-27💻 cs

WaterVideoQA: ASV-Centric Perception and Rule-Compliant Reasoning via Multi-Modal Agents

Este trabajo presenta WaterVideoQA, el primer benchmark de preguntas y respuestas sobre video a gran escala para entornos acuáticos, junto con NaviMind, un sistema multiagente neuro-simbólico que permite a las embarcaciones autónomas superar la percepción pasiva para lograr un razonamiento cognitivo interactivo y conforme a las normativas marítimas.

Runwei Guan, Shaofeng Liang, Ningwei Ouyang + 9 more2026-02-27💻 cs