Field imaging framework for morphological characterization of aggregates with computer vision: Algorithms and applications

Questa tesi presenta un quadro di imaging sul campo basato sulla visione artificiale per la caratterizzazione morfologica degli aggregati da costruzione, sviluppando algoritmi avanzati di segmentazione e ricostruzione 3D che superano i limiti dei metodi tradizionali permettendo l'analisi sia di singole particelle che di ammassi complessi in scenari reali.

Haohang Huang2026-03-05🤖 cs.AI

InEdit-Bench: Benchmarking Intermediate Logical Pathways for Intelligent Image Editing Models

Il paper introduce InEdit-Bench, il primo benchmark dedicato alla valutazione della capacità dei modelli generativi multimodali di ragionare su percorsi logici intermedi nell'editing di immagini, rivelando attraverso una valutazione estesa le significative carenze attuali dei modelli esistenti nel gestire scenari complessi che richiedono dinamicità e coerenza causale.

Zhiqiang Sheng, Xumeng Han, Zhiwei Zhang + 6 more2026-03-05🤖 cs.AI

Polyp Segmentation Using Wavelet-Based Cross-Band Integration for Enhanced Boundary Representation

Il paper propone un modello di segmentazione dei polipi che integra rappresentazioni in scala di grigi e RGB attraverso un'interazione coerente nel dominio delle ondelette, sfruttando la maggiore contrasto dei bordi nella scala di grigi per migliorare la precisione nella localizzazione dei confini e superare le limitazioni dei metodi convenzionali basati solo su RGB.

Haesung Oh, Jaesung Lee2026-03-05💻 cs

QD-PCQA: Quality-Aware Domain Adaptation for Point Cloud Quality Assessment

Il paper propone QD-PCQA, un nuovo framework di adattamento di dominio consapevole della qualità che migliora la generalizzazione nella valutazione della qualità dei nuvoli di punti senza riferimento, superando i limiti delle metodologie esistenti grazie a strategie di allineamento delle caratteristiche ponderate per il ranking e di aumento guidato dalla qualità.

Guohua Zhang, Jian Jin, Meiqin Liu + 2 more2026-03-05💻 cs

Seeing as Experts Do: A Knowledge-Augmented Agent for Open-Set Fine-Grained Visual Understanding

Il paper presenta KFRA, un agente di ragionamento basato sulla conoscenza che supera i limiti degli approcci chiusi per l'analisi visiva fine-granulare in scenari aperti, integrando rilevamento, recupero web e localizzazione discriminativa in un ciclo di ragionamento interpretable che ha dimostrato prestazioni superiori su un nuovo benchmark dedicato.

Junhan Chen, Zilu Zhou, Yujun Tong + 3 more2026-03-05💻 cs

Small Object Detection in Complex Backgrounds with Multi-Scale Attention and Global Relation Modeling

Questo lavoro propone un framework innovativo per la rilevazione di oggetti piccoli in contesti complessi, che integra un downsampling con ondelette di Haar residue, una modellazione delle relazioni globali e un'attenzione ibrida cross-scala per preservare i dettagli fini e migliorare l'accuratezza della localizzazione, ottenendo risultati superiori rispetto agli stati dell'arte sulla benchmark RGBT-Tiny.

Wenguang Tao, Xiaotian Wang, Tian Yan + 2 more2026-03-05💻 cs