Cora: Correspondence-aware image editing using few step diffusion

Cora es un nuevo marco de edición de imágenes basado en difusión en pocos pasos que utiliza corrección de ruido consciente de la correspondencia y mapas de atención interpolados para lograr deformaciones no rígidas y modificaciones de objetos precisas, manteniendo la estructura, la textura y la identidad de la imagen original mejor que los métodos existentes.

Amirhossein Alimohammadi, Aryan Mikaeili, Sauradip Nag + 3 more2026-03-02💻 cs

SelvaBox: A high-resolution dataset for tropical tree crown detection

El artículo presenta SelvaBox, el conjunto de datos abierto más grande para la detección de copas de árboles tropicales en imágenes de drones de alta resolución, el cual, al contener más de 83.000 etiquetas manuales, demuestra que los modelos entrenados con él logran un rendimiento competitivo y superior en la detección de copas tanto en datos no vistos como en entornos multirresolución.

Hugo Baudchon, Arthur Ouaknine, Martin Weiss + 5 more2026-03-02💻 cs

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

Este trabajo presenta el uso de Máquinas de Refuerzo Explicables (EBM) como un algoritmo de aprendizaje automático interpretable y guiado por el conocimiento humano para identificar cúspides sobresalientes en imágenes satelitales, demostrando que, aunque su precisión es inferior a la de modelos más complejos, ofrece una estrategia transparente y colaborativa crucial para aplicaciones meteorológicas de alto riesgo.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG

pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models

El artículo presenta pFedMMA, un marco de aprendizaje federado personalizado que utiliza adaptadores multimodales para lograr un equilibrio óptimo entre la personalización local y la generalización global en modelos de visión y lenguaje, superando a los métodos existentes mediante una estrategia de comunicación eficiente que comparte únicamente proyecciones alineadas.

Sajjad Ghiasvand, Mahnoosh Alizadeh, Ramtin Pedarsani2026-03-02🤖 cs.LG

Animal behavioral analysis and neural encoding with transformer-based self-supervised pretraining

El artículo presenta BEAST, un marco escalable basado en transformers que utiliza aprendizaje auto-supervisado para analizar el comportamiento animal y la codificación neural sin depender de grandes cantidades de datos etiquetados, mejorando tareas como la estimación de postura y la segmentación de acciones en diversos contextos neuroconductuales.

Yanchen Wang, Han Yu, Ari Blau + 5 more2026-03-02🧬 q-bio

DA-Occ: Direction-Aware 2D Convolution for Efficient and Geometry-Preserving 3D Occupancy Prediction in Autonomous Driving

El artículo presenta DA-Occ, un marco de predicción de ocupación 3D basado en convoluciones 2D conscientes de la dirección que mejora la precisión geométrica y la eficiencia computacional al combinar proyecciones de puntuación de altura con el paradigma Lift-Splat-Shoot, logrando un equilibrio óptimo entre velocidad y exactitud para la conducción autónoma.

Yuchen Zhou, Yan Luo, Xiaogang Wang + 3 more2026-03-02💻 cs

Less is More: AMBER-AFNO -- a New Benchmark for Lightweight 3D Medical Image Segmentation

El artículo presenta AMBER-AFNO, un nuevo modelo de segmentación 3D de imágenes médicas que sustituye la atención multi-cabeza por operadores neuronales adaptativos de Fourier (AFNO) para lograr una complejidad computacional casi lineal y un tamaño de modelo compacto, obteniendo resultados competitivos o superiores en conjuntos de datos públicos.

Andrea Dosi, Semanto Mondal, Rajib Chandra Ghosh + 2 more2026-03-02⚡ eess

BeeNet: Reconstructing Flower Shapes from Electric Fields using Deep Learning

Este estudio presenta BeeNet, un modelo de aprendizaje profundo que reconstruye con precisión las formas geométricas de las flores a partir de sus campos eléctricos generados por la interacción con insectos cargados, demostrando que la electrorecepción puede proporcionar detalles espaciales ricos y resolviendo el problema de la imagen electrostática inversa.

Jake Turley, Ryan A. Palmer, Isaac V. Chenchiah + 1 more2026-03-02🧬 q-bio