KnowDiffuser: A Knowledge-Guided Diffusion Planner with LM Reasoning and Prior-Informed Trajectory Initialization

Il paper presenta KnowDiffuser, un framework di pianificazione del movimento guidato dalla conoscenza che integra la capacità semantica dei modelli linguistici con la potenza generativa dei modelli di diffusione per colmare il divario tra comprensione semantica e fattibilità fisica nella guida autonoma, ottenendo risultati superiori sul benchmark nuPlan.

Fan Ding, Xuewen Luo, Fengze Yang, Bo Yu, HwaHui Tew, Ganesh Krishnasamy, Junn Yong Loo2026-03-12💻 cs

SignSparK: Efficient Multilingual Sign Language Production via Sparse Keyframe Learning

Il paper presenta SignSparK, un nuovo framework multilingue per la produzione di lingua dei segni che supera i limiti degli approcci attuali combinando segmentazione temporale automatizzata, apprendimento basato su fotogrammi chiave sparsi e un modello di flusso condizionato per generare avatar di firma 3D fluidi, linguisticamente accurati e fotorealistici.

Jianhe Low, Alexandre Symeonidis-Herzig, Maksym Ivashechkin, Ozge Mercanoglu Sincan, Richard Bowden2026-03-12💻 cs

Machinagogy: Experiments in Staging Teaching Dramas with LLMs

Il saggio presenta "Machinagogy", un sistema di tutoraggio AI fondato su riconoscimento hegeliano e psicanalisi freudiana che, attraverso una metodologia riflessiva di "vibe scholarship" con Claude Code, dimostra come prompt potenziati dal riconoscimento migliorino significativamente le prestazioni dei tutor indipendentemente dal modello, sollevando al contempo riflessioni critiche sulle dinamiche relazionali tra studenti, insegnanti e assistenti di ricerca.

Liam Magee2026-03-12💻 cs

LCAMV: High-Accuracy 3D Reconstruction of Color-Varying Objects Using LCA Correction and Minimum-Variance Fusion in Structured Light

Questo articolo presenta LCAMV, un metodo innovativo per la ricostruzione 3D ad alta precisione di oggetti colorati che, correggendo l'aberrazione cromatica laterale e fondendo i dati dei canali RGB tramite un modello di rumore Poisson-Gaussian, supera i limiti delle tecniche tradizionali senza richiedere hardware aggiuntivo o acquisizioni multiple.

Wonbeen Oh, Jae-Sang Hyun2026-03-12💻 cs

SUBTA: A Framework for Supported User-Guided Bimanual Teleoperation in Structured Assembly

Il paper presenta SUBTA, un sistema di teleoperazione bimanuale assistita che combina stima delle intenzioni umane, pianificazione basata su grafi di scena e assistenza contestuale, dimostrando attraverso uno studio utente significativi miglioramenti nella precisione e nella riduzione del carico mentale rispetto alla teleoperazione standard.

Xiao Liu, Prakash Baskaran, Songpo Li, Simon Manschitz, Wei Ma, Dirk Ruiken, Soshi Iba2026-03-12💻 cs

StructDamage:A Large Scale Unified Crack and Surface Defect Dataset for Robust Structural Damage Detection

Il paper presenta StructDamage, un nuovo dataset su larga scala composto da oltre 78.000 immagini di nove diversi tipi di superfici, creato aggregando e armonizzando 32 dataset pubblici per migliorare la rilevazione robusta e generalizzabile di crepe e difetti strutturali tramite tecniche di deep learning.

Misbah Ijaz, Saif Ur Rehman Khan, Abd Ur Rehman, Sebastian Vollmer, Andreas Dengel, Muhammad Nabeel Asim2026-03-12💻 cs

Spatial self-supervised Peak Learning and correlation-based Evaluation of peak picking in Mass Spectrometry Imaging

Questo articolo propone una rete neurale auto-supervisionata basata su autoencoder per l'apprendimento spaziale dei picchi nell'imaging di spettrometria di massa, combinata con una procedura di valutazione fondata su maschere di segmentazione annotate da esperti, che supera i metodi esistenti selezionando picchi strutturalmente spaziali su diversi dataset pubblici.

Philipp Weigand, Nikolas Ebert, Shad A. Mohammed, Denis Abu Sammour, Carsten Hopf, Oliver Wasenmüller2026-03-12💻 cs

Efficiency vs Demand in AI Electricity: Implications for Post-AGI Scaling

Questo studio integra il settore del calcolo AI nel modello GCAM per dimostrare che la futura domanda elettrica dell'AI negli Stati Uniti non seguirà una crescita lineare, ma dipenderà criticamente dal bilanciamento tra i progressi nell'efficienza energetica e la crescita del reddito, suggerendo che i meccanismi basati sui prezzi hanno un impatto limitato rispetto alle dinamiche economiche.

Doyi Kim, Jiseok Ahn, Haewon McJeon, Changick Kim2026-03-12💻 cs

UHD Image Deblurring via Autoregressive Flow with Ill-conditioned Constraints

Il paper propone un nuovo metodo di flusso autoregressivo con vincoli mal condizionati che scompone il ripristino di immagini UHD in un processo progressivo da grossolano a fine, utilizzando il Flow Matching e una regolarizzazione numerica per bilanciare il recupero di dettagli fini e l'efficienza computazionale.

Yucheng Xin, Dawei Zhao, Xiang Chen, Chen Wu, Pu Wang, Dianjie Lu, Guijuan Zhang, Xiuyi Jia, Zhuoran Zheng2026-03-12💻 cs

Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement

Il paper propone un framework di disaccoppiamento semantico guidato visivamente che, allineando i prior visivi con i testi clinici e utilizzando un modulo di fusione ibrida in un Diffusion Transformer, supera le limitazioni dei modelli generativi attuali per produrre immagini mediche di alta qualità con un controllo fine-granulare della struttura anatomica.

Xin Huang, Junjie Liang, Qingshan Hou, Peng Cao, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-12💻 cs

Sparse Task Vector Mixup with Hypernetworks for Efficient Knowledge Transfer in Whole-Slide Image Prognosis

Il paper propone STEPH, un nuovo metodo che utilizza mixup di vettori di task sparsi e iperreti per trasferire efficientemente conoscenze prognostiche tra diversi tipi di cancro nelle immagini whole-slide, migliorando le prestazioni senza richiedere addestramenti congiunti su larga scala o inferenze multiple.

Pei Liu, Xiangxiang Zeng, Tengfei Ma, Yucheng Xing, Xuanbai Ren, Yiping Liu2026-03-12💻 cs

BinWalker: Development and Field Evaluation of a Quadruped Manipulator Platform for Sustainable Litter Collection

Il paper presenta BinWalker, un sistema robotico quadrupede con braccio manipolatore progettato per la raccolta autonoma di rifiuti in ambienti esterni difficili, dimostrando attraverso valutazioni sul campo la fattibilità di integrare locomozione, percezione e manipolazione per supportare operazioni di pulizia su larga scala.

Giulio Turrisi, Angelo Bratta, Giovanni Minelli, Gabriel Fischer Abati, Amir H. Rad, João Carlos Virgolino Soares, Claudio Semini2026-03-12💻 cs