Multimodal Skeleton-Based Action Representation Learning via Decomposition and Composition

Il paper propone un framework di apprendimento auto-supervisionato chiamato "Decomposition and Composition" che risolve il compromesso tra efficienza e prestazioni nell'analisi delle azioni umane multimodali basate sullo scheletro, decomponendo e ricomponendo le caratteristiche per allineare i dati unimodali e migliorare la rappresentazione multimodale senza eccessivo costo computazionale.

Hongsong Wang, Heng Fei, Bingxuan Dai + 1 more2026-03-11💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Questo lavoro introduce il benchmark DivGenBench per quantificare il collasso delle modalità di preferenza nei modelli di diffusione e propone D²-Align, un nuovo framework di allineamento che mitiga tale fenomeno correggendo direzionalmente il segnale di ricompensa per preservare la diversità generativa.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Il paper presenta Preguss, un framework modulare che combina analisi statica e modelli linguistici per generare e raffinare specifiche formali, permettendo la verifica automatizzata di programmi su larga scala (oltre 1000 righe di codice) con una riduzione dell'80,6%-88,9% dello sforzo umano necessario.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei Yin2026-03-11💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

Il paper introduce CovertComBench, il primo banco di prova specifico per valutare le capacità dei Large Language Models nella comunicazione wireless covert, rivelando che, sebbene eccellano nella comprensione concettuale e nella generazione di codice, mostrano gravi carenze nelle derivazioni matematiche necessarie per garantire la sicurezza, suggerendo la necessità di un'architettura basata su strumenti esterni per sistemi affidabili.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan Zhou2026-03-11💻 cs

Weakly supervised framework for wildlife detection and counting in challenging Arctic environments: a case study on caribou (Rangifer tarandus)

Questo studio presenta un framework di apprendimento supervisionato debole che, attraverso un pre-addestramento a livello di patch su immagini aeree dell'Alaska, migliora significativamente l'accuratezza del rilevamento e del conteggio automatico dei caribù in ambienti artici complessi rispetto ai metodi tradizionali.

Ghazaleh Serati, Samuel Foucher, Jerome Theau2026-03-11💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Il paper introduce la Correzione in Tempo di Test (TTC), un metodo privo di addestramento che utilizza il primo frame come riferimento stabile per correggere l'accumulo di errori nella generazione di video lunghi tramite modelli autoregressivi distillati, ottenendo risultati di alta qualità con un costo computazionale trascurabile.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo2026-03-11💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Il paper presenta AirPulse, un robot volante autonomo di 26 grammi ispirato alle farfalle che, grazie a un'architettura di controllo gerarchica e ali compliant, realizza per la prima volta un volo stabile e guidato in regime tailless a bassa frequenza, aprendo nuove prospettive per il monitoraggio ecologico e l'ispezione in spazi confinati.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue Zhou2026-03-11💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Questo studio offre una rassegna critica della letteratura sull'NLP queer, evidenziando come la maggior parte delle ricerche si limiti a identificare reattivamente i pregiudizi invece di proporre soluzioni proattive, e delinea una roadmap per un futuro più inclusivo che privilegi il coinvolgimento degli stakeholder, l'intersezionalità e la diversità linguistica.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan Long2026-03-11💻 cs

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

Il paper presenta ChimeraLoRA, un metodo che combina un LoRA condiviso a livello di classe con LoRA specifici per immagine, potenziati da un meccanismo di rafforzamento semantico e combinati tramite una distribuzione di Dirichlet, per generare dataset sintetici diversificati e ricchi di dettagli che migliorano l'accuratezza nella classificazione in scenari con pochi dati.

Hoyoung Kim, Minwoo Jang, Jabin Koo, Sangdoo Yun, Jungseul Ok2026-03-11💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Il paper introduce DOCFORGE-BENCH, il primo benchmark zero-shot per la rilevazione di falsificazioni documentali, rivelando che i metodi attuali falliscono nella pratica non per carenze rappresentative ma a causa di una scarsa calibrazione delle soglie dovuta alla rarità delle regioni alterate, sottolineando al contempo la necessità urgente di valutare nuove minacce basate sull'IA generativa.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao Ren2026-03-11💻 cs