Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity

Este estudo avalia a capacidade de métricas generativas de prever o desempenho do YOLOv11 em cenários de detecção de objetos com dados sintéticos, descobrindo que, embora a augmentação sintética traga ganhos significativos em regimes complexos, a correlação entre métricas globais e desempenho final é fortemente dependente do contexto e frequentemente enfraquece após o controle estatístico do volume de augmentação.

Vasile Marian, Yong-Bin Kang, Alexander Buddery2026-02-24🤖 cs.LG

Image-Based Classification of Olive Varieties Native to Turkiye Using Multiple Deep Learning Architectures: Analysis of Performance, Complexity, and Generalization

Este estudo compara dez arquiteturas de aprendizado profundo para classificar cinco variedades de azeitonas pretas nativas da Turquia, demonstrando que, em cenários com dados limitados, a eficiência paramétrica é mais crítica do que a profundidade do modelo, com o EfficientNetV2-S alcançando a maior precisão (95,8%) e o EfficientNetB0 oferecendo o melhor equilíbrio entre desempenho e complexidade computacional.

Hatice Karatas, Irfan Atabas2026-02-24💻 cs

Triggering hallucinations in model-based MRI reconstruction via adversarial perturbations

Este estudo demonstra que modelos generativos de ponta para reconstrução de imagens de ressonância magnética são altamente vulneráveis a pequenas perturbações adversariais que induzem alucinações indetectáveis por métricas tradicionais, sugerindo a necessidade de novas abordagens de detecção e treinamento adversarial para garantir a segurança do diagnóstico médico.

Suna Buğday, Yvan Saeys, Jonathan Peck2026-02-24⚡ eess

Rodent-Bench

O artigo apresenta o Rodent-Bench, um novo benchmark que avalia a capacidade de Modelos de Linguagem Multimodais (MLLMs) de anotar vídeos de comportamento de roedores, revelando que os modelos atuais, incluindo os mais avançados, ainda não possuem o desempenho necessário para atuar como assistentes confiáveis nessa tarefa devido a desafios significativos na segmentação temporal e na distinção de estados comportamentais sutis.

Thomas Heap, Laurence Aitchison, Emma Cahill + 1 more2026-02-24🤖 cs.AI

BloomNet: Exploring Single vs. Multiple Object Annotation for Flower Recognition Using YOLO Variants

Este artigo apresenta o conjunto de dados FloralSix e avalia o desempenho de várias arquiteturas YOLO na detecção de flores, demonstrando que a escolha entre anotações de objeto único ou múltiplo e o uso do otimizador SGD são fatores determinantes para a precisão em cenários de flores isoladas versus densas, com aplicações diretas na agricultura automatizada.

Safwat Nusrat, Prithwiraj Bhattacharjee2026-02-24🤖 cs.AI

DM4CT: Benchmarking Diffusion Models for Computed Tomography Reconstruction

O artigo apresenta o DM4CT, um benchmark abrangente que avalia dez métodos baseados em modelos de difusão e sete baselines estabelecidas para reconstrução de tomografia computadorizada, utilizando dados médicos e industriais, incluindo um novo conjunto de dados experimental de alta resolução, para analisar os desafios e o desempenho desses modelos em cenários reais.

Jiayang Shi, Daniel M. Pelt, K. Joost Batenburg2026-02-24⚡ eess

Effect of Patch Size on Fine-Tuning Vision Transformers in Two-Dimensional and Three-Dimensional Medical Image Classification

Este estudo demonstra que, ao ajustar finamente Vision Transformers em 12 conjuntos de dados de imagens médicas 2D e 3D, o uso de tamanhos de patch menores (1, 2 e 4) resulta em ganhos significativos de precisão em comparação com patches maiores, embora com maior custo computacional, e que a fusão das previsões desses modelos via ensemble oferece melhorias adicionais de desempenho.

Massoud Dehghan, Ramona Woitek, Amirreza Mahbod2026-02-24💻 cs

Systematic Analysis of Coupling Effects on Closed-Loop and Open-Loop Performance in Aerial Continuum Manipulators

Este artigo analisa sistematicamente os efeitos do acoplamento na modelagem dinâmica de manipuladores contínuos aéreos, demonstrando que, embora o modelo desacoplado apresente discrepâncias significativas em simulações de malha aberta, ele alcança precisão de rastreamento comparável ao modelo acoplado em controle de malha fechada, oferecendo simultaneamente menor custo computacional.

Niloufar Amiri, Shayan Sepahvand, Iraj Mantegh + 1 more2026-02-24💻 cs

Think with Grounding: Curriculum Reinforced Reasoning with Video Grounding for Long Video Understanding

O artigo apresenta o Video-TwG, um framework de aprendizado por reforço com currículo que introduz o paradigma "pensar com fundamentação" para permitir que modelos de linguagem de vídeo realizem fundamentação sob demanda em clipes específicos durante o raciocínio, superando assim as alucinações e a redundância temporal comuns na compreensão de vídeos longos.

Houlun Chen, Xin Wang, Guangyao Li + 4 more2026-02-24🤖 cs.AI