A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Il paper propone MCULoRA, un nuovo framework basato su un adattamento a basso rango decoupled e dinamico che risolve i conflitti di gradiente nell'addestramento di modelli per il riconoscimento delle emozioni con modalità incomplete, ottenendo prestazioni superiori rispetto agli approcci esistenti.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Unified Medical Image Segmentation with State Space Modeling Snake

Il paper presenta Mamba Snake, un nuovo framework di deep snake basato sulla modellazione degli spazi di stato che risolve le sfide dell'segmentazione medica unificata modellando le relazioni topologiche inter-organo e affinando i contorni microscopici, ottenendo prestazioni superiori rispetto agli stati dell'arte su cinque dataset clinici.

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

Questo studio propone un framework di deep learning basato su Vision Transformer (ViT) che, utilizzando immagini Sentinel-2 e Formosat-5 e un approccio di apprendimento semi-supervisionato per espandere le annotazioni manuali, migliora la segmentazione delle aree colpite da disastri naturali, ottimizzando così il prodotto EVAP dell'Agenzia Spaziale Taiwanese (TASA).

Yi-Shan Chu, Hsuan-Cheng Wei2026-03-10💻 cs

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

Il paper presenta CauKer, un algoritmo innovativo che genera serie temporali sintetiche causalmente coerenti per pre-addestrare in modo efficiente modelli foundation per la classificazione, dimostrando leggi di scalabilità superiori rispetto ai dataset reali.

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

Il paper presenta GraphProp, un metodo per addestrare modelli fondazionali su grafi che migliora la generalizzazione cross-dominio attraverso due fasi: prima l'apprendimento di rappresentazioni strutturali basate su invarianti grafici, poi l'integrazione di attributi specifici del dominio per ottenere prestazioni superiori nelle attività di classificazione, specialmente in contesti privi di attributi nodali.

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Video-EM: Event-Centric Episodic Memory for Long-Form Video Understanding

Il paper presenta Video-EM, un framework di memoria episodica senza addestramento che migliora la comprensione di video lunghi trasformando la selezione di fotogrammi in una costruzione di eventi temporali coerenti e verificati, permettendo ai modelli linguistici video esistenti di ragionare su contesti estesi senza modifiche architetturali.

Yun Wang, Long Zhang, Jingren Liu, Jiaqi Yan, Zhanjie Zhang, Jiahao Zheng, Ao Ma, Run Ling, Xun Yang, Dapeng Wu, Xiangyu Chen, Xuelong Li2026-03-10💻 cs

Improving the Resilience of Quadrotors in Underground Environments by Combining Learning-based and Safety Controllers

Questo lavoro propone un sistema ibrido che combina un controller basato sull'apprendimento con un monitor di sicurezza per garantire la navigazione autonoma e sicura dei quadricotteri in ambienti sotterranei sconosciuti, sfruttando un flusso normalizzante per rilevare le situazioni fuori distribuzione e attivare un controller di sicurezza quando necessario.

Isaac Ronald Ward, Mark Paral, Kristopher Riordan + 1 more2026-03-10⚡ eess

OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

Il paper propone OTESGN, una rete che integra trasporto ottimo e grafi sintattico-semantici per migliorare l'analisi del sentiment basata su aspetti, ottenendo risultati all'avanguardia su diversi dataset grazie alla sua capacità di catturare associazioni non lineari e ridurre il rumore contestuale.

Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong2026-03-10💬 cs.CL

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Questo lavoro presenta un framework modulare multimodale basato sull'intelligenza artificiale generativa per produrre dati sintetici realistici sugli edifici residenziali a partire da immagini e informazioni pubbliche, riducendo la dipendenza da fonti dati costose o riservate e facilitando la ricerca sulla simulazione energetica.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG