A dataset of medication images with instance segmentation masks for preventing adverse drug events

Il paper presenta MEDISEG, un nuovo dataset di immagini di farmaci con maschere di segmentazione istanza progettato per migliorare il riconoscimento dei medicinali in scenari reali complessi e prevenire errori terapeutici, dimostrando attraverso l'addestramento di modelli YOLOv8 e YOLOv9 la sua efficacia nel supportare sia l'addestramento supervisionato robusto che l'apprendimento con pochi esempi.

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

Spatially conditioned dynamics between population and built form

Questo studio sviluppa un framework spazialmente esplicito in Repubblica Ceca che, integrando classificazioni dettagliate dell'ambiente costruito con indicatori socio-demografici, dimostra come le caratteristiche della popolazione presentino relazioni lineari ma spazialmente condizionate con la forma urbana, evidenziando il ruolo cruciale di quest'ultima nel riprodurre le disuguaglianze socio-spaziali.

Anna Brazdova, Martin Fleischmann2026-03-12💻 cs

Evaluating Few-Shot Pill Recognition Under Visual Domain Shift

Questo studio valuta la capacità di sistemi di riconoscimento dei farmaci di adattarsi a scenari reali complessi tramite apprendimento few-shot, evidenziando come, sebbene la classificazione semantica sia efficace anche con pochi esempi, la localizzazione e il richiamo risentano significativamente di sovrapposizioni e occlusioni, sottolineando l'importanza cruciale di dati di addestramento realistici per il dispiegamento pratico.

W. I. Chu, G. Tarroni, L. Li2026-03-12💻 cs

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

Il paper presenta UltrasoundAgents, un framework gerarchico multi-agente che allinea il processo diagnostico ecografico al flusso di lavoro clinico attraverso una catena di ragionamento basata su evidenze strutturate e una strategia di addestramento progressivo decoupled, migliorando sia l'accuratezza diagnostica che la tracciabilità delle decisioni rispetto ai metodi esistenti.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

Il paper propone DIPE, un nuovo metodo di codifica posizionale che risolve il problema del "visual fading" nei modelli multimodali a lungo contesto, eliminando la penalità delle distanze inter-modali tipica del Multimodal RoPE e garantendo così una stabilità nel grounding visivo senza compromettere le prestazioni su contesti brevi.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

Questo studio indaga come fattori individuali, contestuali e di gruppo influenzino la percezione del sentiment nelle comunicazioni software, rivelando che tale percezione è instabile, fortemente dipendente dall'ambiguità del messaggio e scarsamente correlata a variabili esterne, suggerendo cautela nell'interpretazione dei risultati dell'analisi del sentiment.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs

VoxCare: Studying Natural Communication Behaviors of Hospital Caregivers through Wearable Sensing of Egocentric Audio

Il paper presenta VoxCare, un sistema indossabile scalabile che analizza in tempo reale i comportamenti comunicativi naturali degli operatori sanitari negli ospedali tramite l'estrazione di caratteristiche acustiche senza memorizzare l'audio grezzo, rivelando come tali pattern riflettano il carico di lavoro e lo stress per migliorare l'erogazione delle cure.

Tiantian Feng, Kleanthis Avramidis, Anfeng Xu, Deqi Wang, Brandon M Booth, Shrikanth Narayanan2026-03-12💻 cs

Data Augmentation and Convolutional Network Architecture Influence on Distributed Learning

Questo studio analizza come le architetture delle reti neurali convoluzionali influenzino l'accuratezza del modello e l'efficienza computazionale nell'apprendimento distribuito, fornendo indicazioni per ottimizzare il loro dispiegamento in scenari ad alta intensità di risorse.

Victor Forattini Jansen, Emanuel Teixeira Martins, Yasmin Souza Lima, Flavio de Oliveira Silva, Rodrigo Moreira, Larissa Ferreira Rodrigues Moreira2026-03-12💻 cs

Novel Architecture of RPA In Oral Cancer Lesion Detection

Questo studio presenta un'architettura innovativa per il rilevamento delle lesioni del cancro orale, dimostrando che l'uso di pattern di progettazione come il Singleton e l'elaborazione in batch nelle implementazioni OC-RPAv1 e OC-RPAv2 riduce drasticamente i tempi di previsione da 0,29 a 0,06 secondi per immagine, ottenendo un miglioramento dell'efficienza fino a 100 volte rispetto ai metodi RPA standard.

Revana Magdy, Joy Naoum, Ali Hamdi2026-03-12💻 cs