Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation

Questo lavoro presenta un agente generativo neuro-simbolico che supera le allucinazioni fisiche dei modelli linguistici tradizionali validando autonomamente le assunzioni teoriche e completando i meccanismi fisici mancanti, come dimostrato nella simulazione coerente della pressurizzazione termica in arenaria a bassa permeabilità.

Yue Wua, Tianhao Su, Rui Hu, Mingchuan Zhao, Shunbo Hu, Deng Pan, Jizhong Huang2026-03-11💻 cs

Deblurring structural edges in variable thickness topology optimization via density-gradient-informed projection

Questo articolo propone un metodo di ottimizzazione topologica a spessore variabile che, combinando penalizzazione SIMP e una nuova proiezione informata dal gradiente di densità, elimina efficacemente le regioni a spessore ridotto e ripristina bordi strutturali nitidi senza compromettere la rigidità finale della struttura.

Gabriel Stankiewicz, Chaitanya Dev, Paul Steinmann2026-03-11💻 cs

TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions

Il paper presenta TIMID, una nuova architettura ispirata alla rilevazione di anomalie video che, sfruttando supervisione debole e un dataset di simulazione multi-robot, supera i limiti dei modelli esistenti nel rilevare errori temporali complessi durante l'esecuzione di compiti robotici ad alto livello.

Nerea Gallego (University of Zaragoza), Fernando Salanova (University of Zaragoza), Claudio Mannarano (University of Zaragoza, University of Torino), Cristian Mahulea (University of Zaragoza), Eduardo Montijano (University of Zaragoza)2026-03-11💻 cs

Test-time Ego-Exo-centric Adaptation for Action Anticipation via Multi-Label Prototype Growing and Dual-Clue Consistency

Questo articolo propone DCPGN, un nuovo metodo di adattamento in tempo di test che utilizza la crescita di prototipi multi-etichetta e la coerenza di indizi duali (visivi e testuali) per migliorare l'anticipazione delle azioni tra prospettive egocentriche ed esocentriche senza richiedere dati di addestramento nel dominio target.

Zhaofeng Shi, Heqian Qiu, Lanxiao Wang, Qingbo Wu, Fanman Meng, Lili Pan, Hongliang Li2026-03-11💻 cs

RA-SSU: Towards Fine-Grained Audio-Visual Learning with Region-Aware Sound Source Understanding

Questo lavoro introduce il nuovo compito di apprendimento audio-visivo "Region-Aware Sound Source Understanding" (RA-SSU), supportato dai dataset annotati f-Music e f-Lifescene e dal modello SSUFormer, che mira a ottenere una comprensione dettagliata delle sorgenti sonore a livello di regione e di fotogramma con prestazioni state-of-the-art.

Muyi Sun, Yixuan Wang, Hong Wang, Chen Su, Man Zhang, Xingqun Qi, Qi Li, Zhenan Sun2026-03-11💻 cs

ConfCtrl: Enabling Precise Camera Control in Video Diffusion via Confidence-Aware Interpolation

Il paper presenta ConfCtrl, un framework di interpolazione video consapevole della fiducia che risolve le sfide della sintesi di nuove viste da due immagini con grandi cambiamenti di prospettiva, permettendo ai modelli di diffusione di seguire traiettorie di camera precise e ricostruire regioni non visibili bilanciando proiezioni geometriche affidabili con correzioni residue apprese.

Liudi Yang, George Eskandar, Fengyi Shen, Mohammad Altillawi, Yang Bai, Chi Zhang, Ziyuan Liu, Abhinav Valada2026-03-11💻 cs

EmoSURA: Towards Accurate Evaluation of Detailed and Long-Context Emotional Speech Captions

Il paper introduce EmoSURA, un nuovo framework di valutazione basato sulla verifica atomica delle unità percettive rispetto al segnale audio originale, che supera i limiti delle metriche tradizionali e dei giudici LLM per fornire una valutazione più accurata e affidabile delle didascalie emotive lunghe e dettagliate.

Xin Jing, Andreas Triantafyllopoulos, Jiadong Wang, Shahin Amiriparian, Jun Luo, Björn Schuller2026-03-11💻 cs

BrainSTR: Spatio-Temporal Contrastive Learning for Interpretable Dynamic Brain Network Modeling

Il paper propone BrainSTR, un framework di apprendimento contrastivo spaziotemporale che migliora l'interpretabilità e la diagnosi delle malattie neuropsichiatriche identificando fasi critiche e sottoreti cerebrali dinamiche attraverso un'analisi adattiva e regolarizzata della connettività funzionale.

Guiliang Guo, Guangqi Wen, Lingwen Liu, Ruoxian Song, Peng Cao, Jinzhu Yang, Fei Wang, Xiaoli Liu, Osmar R. Zaiane2026-03-11💻 cs

VLM-Loc: Localization in Point Cloud Maps via Vision-Language Models

Il paper presenta VLM-Loc, un framework che sfrutta le capacità di ragionamento spaziale dei modelli visione-linguaggio su mappe a punto cloud trasformate in immagini BEV e grafi di scena per migliorare l'accuratezza della localizzazione basata su descrizioni testuali, accompagnato dal nuovo benchmark CityLoc per la valutazione sistematica.

Shuhao Kang, Youqi Liao, Peijie Wang, Wenlong Liao, Qilin Zhang, Benjamin Busam, Xieyuanli Chen, Yun Liu2026-03-11💻 cs

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

Il paper presenta RecThinker, un framework agenziale che trasforma i sistemi di raccomandazione da un approccio passivo a uno di indagine autonoma, utilizzando un paradigma di analisi-pianificazione-azione e strumenti specializzati per colmare le lacune informative e ottimizzare le raccomandazioni attraverso un addestramento ibrido supervisionato e per rinforzo.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng Dou2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Il documento propone un sistema di coerenza delle capacità (CCS) che mappa i modelli di consistenza della memoria sui meccanismi di revoca dell'autorizzazione, dimostrando tramite simulazione che la strategia RCC riduce drasticamente le operazioni non autorizzate rispetto ai metodi basati su TTL, eliminando la dipendenza dalla velocità di esecuzione degli agenti.

Vladyslav Parakhin2026-03-11💻 cs