AI-Assisted Moot Courts: Simulating Justice-Specific Questioning in Oral Arguments

Questo studio propone un framework di valutazione a due livelli per analizzare l'efficacia dei modelli AI nel simulare le domande specifiche dei giudici durante le arringhe orali, rivelando che, sebbene le domande generate siano percepite come realistiche e coprano bene i temi legali sostanziali, i modelli presentano ancora carenze significative come la scarsa diversità e la sycophancy che i metodi di valutazione ingenui non riescono a rilevare.

Kylie Zhang, Nimra Nadeem, Lucia Zheng + 2 more2026-03-06💻 cs

From Offline to Periodic Adaptation for Pose-Based Shoplifting Detection in Real-world Retail Security

Questo articolo presenta un framework di adattamento periodico per la rilevazione di furti nei negozi basato sulla postura, che utilizza il nuovo dataset reale RetailS per abilitare un rilevamento di anomalie scalabile, a bassa latenza e adattivo su dispositivi IoT di bordo, superando le prestazioni dei metodi offline tradizionali.

Shanle Yao, Narges Rashvand, Armin Danesh Pazho + 1 more2026-03-06💻 cs

Are Multimodal LLMs Ready for Surveillance? A Reality Check on Zero-Shot Anomaly Detection in the Wild

Questo studio dimostra che, sebbene i modelli linguistici multimodali possano essere adattati per il rilevamento di anomalie video tramite istruzioni specifiche, soffrono di un forte bias conservativo in modalità zero-shot che ne limita l'utilità pratica a causa di una scarsa capacità di recupero (recall) in ambienti reali.

Shanle Yao, Armin Danesh Pazho, Narges Rashvand + 1 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

Il paper presenta CONE, un modello ibrido pre-addestrato che utilizza un nuovo algoritmo di embedding composito per codificare numeri, intervalli e gaussiane insieme alle loro unità e attributi, preservando le relazioni semantiche e di distanza e ottenendo risultati superiori rispetto agli stati dell'arte in compiti di ragionamento numerico su dataset diversificati.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

Evaluating the Search Agent in a Parallel World

Il paper propone Mind-ParaWorld, un nuovo framework e benchmark interattivo che valuta gli agenti di ricerca in un "mondo parallelo" generato sinteticamente per superare le sfide di obsolescenza dei dati, ambiguità di attribuzione e variabilità delle fonti, rivelando come le prestazioni attuali siano limitate dalla capacità di giudicare la sufficienza delle prove e di prendere decisioni sul momento di arresto.

Jiawei Chen, Xintian Shen, Lihao Zheng + 7 more2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Questo commento paesaggistico valuta la famiglia GPT-5 come ragionatore clinico multimodale, evidenziando significativi progressi nel ragionamento testuale e nella sintesi multimodale rispetto a GPT-4o, pur rilevando che i modelli generalisti non sostituiscono ancora i sistemi specializzati in compiti critici di percezione come la neuroradiologia e la mammografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

DSA-SRGS: Super-Resolution Gaussian Splatting for Dynamic Sparse-View DSA Reconstruction

Il paper propone DSA-SRGS, il primo framework di gaussian splatting a super-risoluzione per la ricostruzione dinamica di angiografie digitali (DSA) da viste sparse, che integra un modulo di apprendimento della texture multi-fiducia e una densificazione radiativa sub-pixel per recuperare dettagli vascolari fini eliminando artefatti di sfocatura e aliasing.

Shiyu Zhang, Zhicong Wu, Huangxuan Zhao + 7 more2026-03-06💻 cs