DSFlash: Comprehensive Panoptic Scene Graph Generation in Realtime

DSFlash è un modello a bassa latenza per la generazione di grafi di scena panottici che, pur garantendo prestazioni all'avanguardia e una ricca informazione contestuale, raggiunge un'elaborazione in tempo reale di 56 fps ed è addestrabile con risorse computazionali limitate, rendendolo ideale per dispositivi edge e ricercatori con budget ridotti.

Julian Lorenz, Vladyslav Kovganko, Elias Kohout, Mrunmai Phatak, Daniel Kienzle, Rainer Lienhart2026-03-12💻 cs

In-Memory ADC-Based Nonlinear Activation Quantization for Efficient In-Memory Computing

Questo articolo presenta la quantizzazione K-Means a soppressione dei bordi (BS-KMQ), un nuovo metodo di quantizzazione non lineare che riduce i requisiti di risoluzione degli ADC e migliora l'efficienza energetica e le prestazioni nei sistemi di calcolo in memoria, ottenendo significativi guadagni di velocità ed energia rispetto alle tecniche esistenti.

Shuai Dong, Junyi Yang, Biyan Zhou, Hongyang Shang, Gourav Datta, Arindam Basu2026-03-12💻 cs

FP-Predictor - False Positive Prediction for Static Analysis Reports

Il paper presenta FP-Predictor, un modello basato su Graph Convolutional Network che utilizza i Code Property Graphs per prevedere con alta accuratezza i falsi positivi negli report di analisi statica della sicurezza, dimostrando una forte capacità di ragionamento orientato alla sicurezza pur presentando limitazioni nella rappresentazione del flusso di controllo interprocedurale.

Tom Ohlmer, Michael Schlichtig, Eric Bodden2026-03-12💻 cs

PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

Il paper introduce PET-F2I-41K, un ampio benchmark basato su 41.000 report reali, e PET-F2I-7B, un modello efficiente ottimizzato per la generazione di impressioni diagnostiche da immagini PET/CT, dimostrando che il fine-tuning specifico supera le prestazioni dei modelli generici e medici in zero-shot grazie a metriche cliniche innovative.

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

Safety-critical Control Under Partial Observability: Reach-Avoid POMDP meets Belief Space Control

Questo lavoro propone un'architettura di controllo stratificata e basata su certificati per POMDP critici per la sicurezza, che disaccoppia la ricerca dell'obiettivo, la raccolta di informazioni e la sicurezza in componenti modulari utilizzando funzioni di Lyapunov e barriera nello spazio delle credenze per garantire prestazioni in tempo reale e garanzie probabilistiche di sicurezza.

Matti Vahs, Joris Verhagen, Jana Tumova2026-03-12💻 cs

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

Il paper propone R4-CGQA, un framework basato sul recupero di informazioni che potenzia i modelli Vision Language Model per la valutazione della qualità delle immagini di computer grafica, affrontando la carenza di dataset descrittivi e migliorando la capacità di fornire spiegazioni testuali accurate attraverso l'analisi di sei dimensioni percettive chiave.

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi Lin2026-03-12💻 cs

Need for Speed: Zero-Shot Depth Completion with Single-Step Diffusion

Il paper presenta Marigold-SSD, un framework di completamento della profondità in zero-shot che utilizza un processo di diffusione a singolo passo per ottenere un'inferenza rapida ed efficiente, spostando il carico computazionale dal tempo di test al fine-tuning e garantendo prestazioni robuste su diversi benchmark senza necessità di ottimizzazione durante l'inferenza.

Jakub Gregorek, Paraskevas Pegios, Nando Metzger, Konrad Schindler, Theodora Kontogianni, Lazaros Nalpantidis2026-03-12💻 cs

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing

Questo articolo presenta un framework ASR multi-parlante basato su un solo encoder che distilla le conoscenze semantiche di un modello linguistico grande (LLM) per migliorare il riconoscimento in presenza di sovrapposizioni, mantenendo un'efficienza computazionale superiore e introducendo un meccanismo di routing dinamico basato sul numero di parlanti.

Hao Shi, Yusuke Fujita, Roman Koshkin, Mengjie Zhao, Yuan Gao, Lianbo Liu, Yui Sudo2026-03-12💻 cs

Exact Interpolation under Noise: A Reproducible Comparison of Clough-Tocher and Multiquadric RBF Surfaces

Questo studio presenta un confronto riproducibile tra gli interpolanti di Clough-Tocher e le funzioni di base radiale multiquadriche, dimostrando che, sebbene l'interpolazione esatta su dati rumorosi porti a un sovradattamento, l'approccio cubico risulta più stabile e permette di recuperare comportamenti di processo fisicamente significativi da misurazioni termodinamiche apparentemente inconsistenti.

Mirkan Emir Sancak2026-03-12💻 cs

Layer Consistency Matters: Elegant Latent Transition Discrepancy for Generalizable Synthetic Image Detection

Il paper propone un nuovo metodo chiamato Latent Transition Discrepancy (LTD) che rileva le immagini sintetiche analizzando le differenze di coerenza strutturale tra i livelli delle reti neurali, ottenendo prestazioni di rilevamento superiori e una maggiore generalizzabilità rispetto agli approcci esistenti.

Yawen Yang, Feng Li, Shuqi Kong, Yunfeng Diao, Xinjian Gao, Zenglin Shi, Meng Wang2026-03-12💻 cs

An Approach for Safe and Secure Software Protection Supported by Symbolic Execution

Il paper presenta un nuovo metodo di protezione del software per il controllo industriale che lega il programma all'hardware tramite Funzioni Fisicamente Inimitabili (PUF) e utilizza l'esecuzione simbolica per garantire la sicurezza e la preservazione delle proprietà di sicurezza in caso di esecuzione su macchine non autorizzate o di malfunzionamenti.

Daniel Dorfmeister, Flavio Ferrarotti, Bernhard Fischer, Evelyn Haslinger, Rudolf Ramler, Markus Zimmermann2026-03-12💻 cs

AdaClearGrasp: Learning Adaptive Clearing for Zero-Shot Robust Dexterous Grasping in Densely Cluttered Environments

Il paper presenta AdaClearGrasp, un framework di decisione ed esecuzione in ciclo chiuso che combina modelli visione-linguaggio e apprendimento per rinforzo per abilitare la presa dattilica zero-shot in ambienti densamente affollati, decidendo adattivamente se sgomberare gli ostacoli o afferrare direttamente l'oggetto.

Zixuan Chen, Wenquan Zhang, Jing Fang, Ruiming Zeng, Zhixuan Xu, Yiwen Hou, Xinke Wang, Jieqi Shi, Jing Huo, Yang Gao2026-03-12💻 cs