cs articoli | Gist.Science

Multimodal Skeleton-Based Action Representation Learning via Decomposition and Composition

Il paper propone un framework di apprendimento auto-supervisionato chiamato "Decomposition and Composition" che risolve il compromesso tra efficienza e prestazioni nell'analisi delle azioni umane multimodali basate sullo scheletro, decomponendo e ricomponendo le caratteristiche per allineare i dati unimodali e migliorare la rappresentazione multimodale senza eccessivo costo computazionale.

Hongsong Wang, Heng Fei, Bingxuan Dai + 1 more2026-03-11💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Questo lavoro introduce il benchmark DivGenBench per quantificare il collasso delle modalità di preferenza nei modelli di diffusione e propone D²-Align, un nuovo framework di allineamento che mitiga tale fenomeno correggendo direzionalmente il segnale di ricompensa per preservare la diversità generativa.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Il paper presenta Preguss, un framework modulare che combina analisi statica e modelli linguistici per generare e raffinare specifiche formali, permettendo la verifica automatizzata di programmi su larga scala (oltre 1000 righe di codice) con una riduzione dell'80,6%-88,9% dello sforzo umano necessario.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei Yin2026-03-11💻 cs

Secure Digital Semantic Communications: Fundamentals, Challenges, and Opportunities

Questo articolo offre una revisione strutturata delle fondamenta, delle sfide di sicurezza e delle opportunità della comunicazione semantica digitale, evidenziando le sue vulnerabilità specifiche rispetto alla variante analogica e delineando possibili difese e direzioni di ricerca future.

Weixuan Chen, Qianqian Yang, Yuanyuan Jia + 5 more2026-03-11💻 cs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

Il paper propone SeLop, un metodo di intervento ortogonale a basso rango che, rimuovendo le correlazioni spurie irrilevanti dallo spazio delle rappresentazioni, risolve il problema della generalizzazione nella rilevazione di falsificazioni facciali ottenendo prestazioni all'avanguardia con un numero ridotto di parametri.

Chi Wang, Xinjue Hu, Boyu Wang, Ziwen He, Zhangjie Fu2026-03-11💻 cs

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

Questo studio propone un approccio centrato sugli obiettivi per valutare i metodi di ingegneria dei requisiti per la Privacy by Design, suggerendo che la loro selezione dovrebbe basarsi sul raggiungimento degli scopi organizzativi piuttosto che sulle sole caratteristiche di processo.

Oleksandr Kosenkov, Ehsan Zabardast, Jannik Fischbach, Tony Gorschek, Daniel Mendez2026-03-11💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

Il paper introduce CovertComBench, il primo banco di prova specifico per valutare le capacità dei Large Language Models nella comunicazione wireless covert, rivelando che, sebbene eccellano nella comprensione concettuale e nella generazione di codice, mostrano gravi carenze nelle derivazioni matematiche necessarie per garantire la sicurezza, suggerendo la necessità di un'architettura basata su strumenti esterni per sistemi affidabili.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan Zhou2026-03-11💻 cs

Weakly supervised framework for wildlife detection and counting in challenging Arctic environments: a case study on caribou (Rangifer tarandus)

Questo studio presenta un framework di apprendimento supervisionato debole che, attraverso un pre-addestramento a livello di patch su immagini aeree dell'Alaska, migliora significativamente l'accuratezza del rilevamento e del conteggio automatico dei caribù in ambienti artici complessi rispetto ai metodi tradizionali.

Ghazaleh Serati, Samuel Foucher, Jerome Theau2026-03-11💻 cs

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

Il paper propone un nuovo metodo per rilevare immagini generate dall'IA sfruttando i componenti finali condivisi dalle architetture dei generatori, che, contaminando le immagini reali con tali componenti e addestrando un rilevatore su DINOv3, ottiene un'accuratezza media del 98,83% su generatori mai visti prima.

Yanzhu Liu, Xiao Liu, Yuexuan Wang, Mondal Soumik2026-03-11💻 cs

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

Il paper introduce RegionReasoner, un framework di apprendimento per rinforzo che migliora il ragionamento visivo multi-round attraverso un nuovo benchmark (RegionDial-Bench) e un meccanismo di ricompensa che garantisce la coerenza semantica globale e locale insieme a un grounding esplicito basato su regioni.

Wenfang Sun, Hao Chen, Yingjun Du, Yefeng Zheng, Cees G. M. Snoek2026-03-11💻 cs

Optimal conversion from Rényi Differential Privacy to $f$ -Differential Privacy

Il paper dimostra che la regola di conversione basata sull'intersezione delle regioni di privacy RDP è ottimale e non superabile per trasformare i profili di RDP in funzioni di trade-off $f$ -differenziali, confermando una congettura precedente e stabilendo il limite fondamentale di tale inferenza.

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios Kaissis2026-03-11💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Il paper introduce la Correzione in Tempo di Test (TTC), un metodo privo di addestramento che utilizza il primo frame come riferimento stabile per correggere l'accumulo di errori nella generazione di video lunghi tramite modelli autoregressivi distillati, ottenendo risultati di alta qualità con un costo computazionale trascurabile.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo2026-03-11💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Il paper presenta AirPulse, un robot volante autonomo di 26 grammi ispirato alle farfalle che, grazie a un'architettura di controllo gerarchica e ali compliant, realizza per la prima volta un volo stabile e guidato in regime tailless a bassa frequenza, aprendo nuove prospettive per il monitoraggio ecologico e l'ispezione in spazi confinati.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue Zhou2026-03-11💻 cs

Multimodal Classification via Total Correlation Maximization

Questo articolo propone TCMax, un metodo di classificazione multimodale privo di iperparametri che massimizza la correlazione totale tra le caratteristiche multimodali e le etichette per mitigare la competizione tra le modalità e migliorare le prestazioni rispetto agli approcci esistenti.

Feng Yu, Xiangyu Wu, Yang Yang, Jianfeng Lu2026-03-11💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Questo studio offre una rassegna critica della letteratura sull'NLP queer, evidenziando come la maggior parte delle ricerche si limiti a identificare reattivamente i pregiudizi invece di proporre soluzioni proattive, e delinea una roadmap per un futuro più inclusivo che privilegi il coinvolgimento degli stakeholder, l'intersezionalità e la diversità linguistica.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan Long2026-03-11💻 cs

A Calculus of Inheritance

Il documento presenta il calcolo dell'ereditarietà, un fondamento per la programmazione dichiarativa basato su record, definizioni ed ereditarietà che unifica classi e oggetti, risolve il problema della linearizzazione dell'ereditarietà multipla trattando la composizione come unione insiemistica e dimostra una maggiore espressività rispetto al calcolo $\lambda$ .

Bo Yang2026-03-11✓ Author reviewed ⓘ💻 cs

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Questo articolo introduce un design di meta-gioco per analizzare il rischio di collusione algoritmica in scenari di test-time, valutando come agenti con politiche pre-addestrate e diverse regole di adattamento possano evolvere verso la cooperazione o la competizione in giochi di pricing ripetuti.

Yuhong Luo, Daniel Schoepflin, Xintong Wang2026-03-11💻 cs

Temporal Consistency-Aware Text-to-Motion Generation

Il paper propone TCA-T2M, un framework innovativo che migliora la generazione di movimento da testo garantendo coerenza temporale tra sequenze diverse e plausibilità fisica attraverso un VQ-VAE spaziale temporale, un transformer mascherato e vincoli cinematici, ottenendo risultati all'avanguardia su HumanML3D e KIT-ML.

Hongsong Wang, Wenjing Yan, Qiuxia Lai + 1 more2026-03-11💻 cs

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

Il paper presenta ChimeraLoRA, un metodo che combina un LoRA condiviso a livello di classe con LoRA specifici per immagine, potenziati da un meccanismo di rafforzamento semantico e combinati tramite una distribuzione di Dirichlet, per generare dataset sintetici diversificati e ricchi di dettagli che migliorano l'accuratezza nella classificazione in scenari con pochi dati.

Hoyoung Kim, Minwoo Jang, Jabin Koo, Sangdoo Yun, Jungseul Ok2026-03-11💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Il paper introduce DOCFORGE-BENCH, il primo benchmark zero-shot per la rilevazione di falsificazioni documentali, rivelando che i metodi attuali falliscono nella pratica non per carenze rappresentative ma a causa di una scarsa calibrazione delle soglie dovuta alla rarità delle regioni alterate, sottolineando al contempo la necessità urgente di valutare nuove minacce basate sull'IA generativa.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao Ren2026-03-11💻 cs

← Precedente Successivo →

cs