Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation

Questo lavoro propone l'uso di formulazioni differenziabili dell'errore medio di calibrazione L1 (mL1-ACE) come funzione di perdita ausiliaria per migliorare l'affidabilità e la calibrazione delle reti neurali nella segmentazione di immagini mediche, offrendo un controllo esplicito sul compromesso tra accuratezza e calibrazione senza compromettere significativamente le prestazioni di segmentazione.

Theodore Barfoot, Luis C. Garcia-Peraza-Herrera, Samet Akcay, Ben Glocker, Tom Vercauteren2026-03-12💻 cs

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

Questo studio analizza l'impatto di Shiksha Copilot, uno strumento di intelligenza artificiale collaborativa per la creazione di piani di lezione, nelle scuole governative del Karnataka, India, evidenziando come esso riduca il carico burocratico e lo stress degli insegnanti promuovendo al contempo una didattica basata sulle attività, pur rimanendo limitato da sfide sistemiche come la carenza di personale.

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya Vashistha2026-03-12💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

Questo studio analizza le percezioni di ascoltatori italiani riguardo ai sistemi di raccomandazione musicale, rivelando una mancanza di consapevolezza critica sul funzionamento degli algoritmi e sulle questioni di rappresentazione di genere, e sottolineando la necessità di integrare prospettive psicosociali nella progettazione di sistemi più affidabili e culturalmente sensibili.

Lorenzo Porcaro, Chiara Monaldi2026-03-12💻 cs

Speech-to-LaTeX: New Models and Datasets for Converting Spoken Equations and Sentences

Questo lavoro presenta il primo dataset open-source su larga scala e nuovi modelli per la conversione di equazioni e frasi matematiche parlate in LaTeX, superando significativamente le prestazioni dei metodi precedenti su benchmark specifici per l'inglese e il russo.

Dmitrii Korzh, Dmitrii Tarasov, Artyom Iudin, Elvir Karimov, Matvey Skripkin, Nikita Kuzmin, Andrey Kuznetsov, Oleg Y. Rogov, Ivan Oseledets2026-03-12💻 cs

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

Questo articolo propone un nuovo quadro di inferenza di livello 2 per dedurre le credenze degli agenti sugli obiettivi altrui, superando i limiti dei metodi tradizionali di livello 1 che assumono una conoscenza completa e condivisa, e dimostra la sua efficacia nel rilevare disallineamenti strategici in scenari reali come la guida urbana.

Hamzah I. Khan, Jingqi Li, David Fridovich-Keil2026-03-12💻 cs

From Law to Gherkin: A Human-Centred Quasi-Experiment on the Quality of LLM-Generated Behavioural Specifications from Food-Safety Regulations

Questo studio presenta la prima valutazione sistematica su soggetti umani che dimostra come i modelli linguistici di grandi dimensioni (LLM) possano assistere efficacemente nella derivazione di specifiche comportamentali Gherkin da normative sulla sicurezza alimentare, pur richiedendo una revisione umana sistematica per correggere omissioni e allucinazioni.

Shabnam Hassani, Mehrdad Sabetzadeh, Daniel Amyot2026-03-12💻 cs

Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

Il paper presenta Dolphin, un metodo efficiente per la separazione del parlato audio-visivo che utilizza un codificatore video leggero basato su semantica labiale discreta e un meccanismo di attenzione globale-locale multi-scala, ottenendo prestazioni superiori allo stato dell'arte con una significativa riduzione dei parametri e del tempo di inferenza.

Kai Li, Kejun Gao, Xiaolin Hu2026-03-12💻 cs

PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease

Il paper presenta PD-Diag-Net, un metodo di diagnosi automatica end-to-end per il morbo di Parkinson basato su risonanza magnetica cerebrale che integra conoscenze cliniche prioritarie per migliorare l'accuratezza diagnostica e l'interpretabilità, ottenendo risultati superiori rispetto agli stati dell'arte sia su dati esterni che nella diagnosi precoce.

Shuai Shao, Yan Wang, Shu Jiang, Shiyuan Zhao, Di Yang, Jiangtao Wang, Yutong Bai, Jianguo Zhang2026-03-12💻 cs

Seeing Space and Motion: Enhancing Latent Actions with Geometric and Dynamic Awareness for Vision-Language-Action Models

Il paper presenta Farsighted-LAM e SSM-VLA, nuovi framework che migliorano i modelli Vision-Language-Action integrando codifica spaziale geometrica, modellazione temporale multi-scala e un modulo di ragionamento visivo per superare le limitazioni nella comprensione spaziale e temporale, ottenendo prestazioni state-of-the-art in simulazione e nel mondo reale.

Zhejia Cai, Yandan Yang, Xinyuan Chang, Shiyi Liang, Ronghan Chen, Feng Xiong, Mu Xu, Ruqi Huang2026-03-12💻 cs

Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation

Il paper propone un framework di distillazione della conoscenza che combina modelli visione-linguaggio, reti neurali convoluzionali e una rete neurale a impulsi adattiva per abilitare il rilevamento di oggetti a vocabolario aperto su dati di eventi, superando la mancanza di informazioni testurali e preservando le caratteristiche temporali critiche.

Jinchang Zhang, Zijun Li, Jiakai Lin, Guoyu Lu2026-03-12💻 cs

Equivariant Splitting: Self-supervised learning from incomplete data

Il paper propone una nuova strategia di apprendimento auto-supervisionato basata su una definizione di equivarianza e su perdite di splitting, che permette di ottenere stime imparziali della funzione di perdita supervisionata e raggiungere prestazioni all'avanguardia in problemi inversi con dati incompleti, come la tomografia computerizzata e la risonanza magnetica accelerata.

Victor Sechaud, Jérémy Scanvic, Quentin Barthélemy, Patrice Abry, Julián Tachella2026-03-12💻 cs