cs.LG articoli | Gist.Science

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

Il paper propone R4T, un metodo che utilizza l'apprendimento per rinforzo una sola volta per generare dati di addestramento allineati agli obiettivi, permettendo di addestrare un recuperatore basato su diffusione leggero che risolve efficientemente problemi di recupero a ventaglio ottimizzando proprietà di insieme come diversità e coerenza con una latenza significativamente ridotta.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig Boutilier2026-03-09🤖 cs.LG

U6G XL-MIMO Radiomap Prediction: Multi-Config Dataset and Beam Map Approach

Questo articolo presenta il primo dataset XL-MIMO multi-configurazione e un approccio basato sulle "beam map" per migliorare l'accuratezza e la generalizzazione della previsione delle mappe radio nelle bande superiori a 6 GHz per i sistemi 6G, superando le limitazioni dei dati esistenti e dei metodi di apprendimento automatico tradizionali.

Xiaojie Li, Yu Han, Zhizheng Lu, Shi Jin, Chao-Kai Wen2026-03-09🤖 cs.LG

Adapter-Augmented Bandits for Online Multi-Constrained Multi-Modal Inference Scheduling

Il paper propone M-CMAB, un framework di scheduling per l'inferenza di modelli linguistici multimodali basato su banditi contestuali multi-armati adattati, che ottimizza le decisioni online sotto vincoli multi-dimensionali eterogenei migliorando significativamente le prestazioni rispetto agli stati dell'arte.

Xianzhi Zhang, Yue Xu, Yinlin Zhu, Di Wu, Yipeng Zhou, Miao Hu, Guocong Quan2026-03-09🤖 cs.LG

A Reference Architecture of Reinforcement Learning Frameworks

Questo articolo propone un'architettura di riferimento per i framework di apprendimento per rinforzo, derivata dall'analisi di 18 sistemi all'avanguardia tramite l'approccio della teoria fondata, al fine di stabilire una base comune per il confronto, la valutazione e l'integrazione di tali tecnologie.

Xiaoran Liu, Istvan David2026-03-09🤖 cs.AI

CLoPA: Continual Low Parameter Adaptation of Interactive Segmentation for Medical Image Annotation

Il paper presenta CLoPA, una strategia di adattamento continuo che ottimizza una piccola frazione dei parametri del modello nnInteractive su dati annotati in tempo reale, elevando rapidamente le prestazioni della segmentazione interattiva a livelli esperti su diverse attività mediche senza richiedere modifiche al flusso di lavoro o nuovi parametri.

Parhom Esmaeili, Chayanin Tangwiriyasakul, Eli Gibson, Sebastien Ourselin, M. Jorge Cardoso2026-03-09🤖 cs.AI

Certified and accurate computation of function space norms of deep neural networks

Questo lavoro presenta un framework per il calcolo certificato e accurato delle norme negli spazi funzionali (come Lebesgue e Sobolev) delle reti neurali profonde, combinando l'aritmetica intervallare, la raffinamento adattivo e l'aggregazione basata su quadratura per ottenere limiti deterministici garantiti sugli integrali delle funzioni e delle loro derivate, superando i limiti delle valutazioni puntuali.

Johannes Gründler, Moritz Maibaum, Philipp Petersen2026-03-09🤖 cs.LG

Toward Generative Quantum Utility via Correlation-Complexity Map

Il paper propone una Mappa di Correlazione-Complessità, caratterizzata dagli indicatori QCLI e CCI, come strumento diagnostico per identificare distribuzioni di dati reali compatibili con modelli generativi quantistici di tipo IQP, dimostrando sperimentalmente che tale approccio supera i modelli classici su dati turbolenti con una maggiore efficienza nelle risorse di addestramento.

Chen-Yu Liu, Leonardo Placidi, Eric Brunner, Enrico Rinaldi2026-03-09⚛️ quant-ph

Quantum Diffusion Models: Score Reversal Is Not Free in Gaussian Dynamics

Il documento dimostra che, nei processi di diffusione quantistica gaussiani, il recupero della completezza positiva durante il processo inverso richiede l'iniezione di diffusione aggiuntiva, rendendo il "score reversal" un'operazione non gratuita che comporta un costo geometrico legato alla perdita di informazione.

Ammar Fayad2026-03-09⚛️ quant-ph

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

Il paper introduce NOBLE, un'architettura che accelera l'addestramento dei transformer da zero mediante rami a basso rango non lineari permanenti, ottenendo significativi miglioramenti nell'efficienza e nella velocità di convergenza con un minimo sovraccarico di parametri.

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics

Il paper presenta COLD-Steer, un framework senza addestramento che controlla il comportamento dei grandi modelli linguistici durante l'inferenza approssimando le dinamiche di apprendimento in un solo passo tramite esempi in contesto, ottenendo un'efficacia di steering fino al 95% con 50 volte meno campioni rispetto alle migliori tecniche esistenti.

Kartik Sharma, Rakshit S. Trivedi2026-03-09🤖 cs.AI

Semantics-Aware Caching for Concept Learning

Il paper presenta un approccio di caching consapevole della semantica che riduce il tempo di esecuzione dell'apprendimento dei concetti di un ordine di grandezza, migliorando l'efficienza sia per i ragionatori simbolici che per quelli neuro-simbolici.

Louis Mozart Kamdem Teyou, Caglar Demir, Axel-Cyrille Ngonga Ngomo2026-03-09🤖 cs.LG

When One Modality Rules Them All: Backdoor Modality Collapse in Multimodal Diffusion Models

Questo studio sfida l'ipotesi che gli attacchi backdoor multimodali siano sinergici, rivelando invece un fenomeno di "collasso modale" in cui il meccanismo di attacco si riduce a dominare una sola modalità, rendendo le altre ridondanti e negando l'interazione tra di esse.

Qitong Wang, Haoran Dai, Haotian Zhang, Christopher Rasmussen, Binghui Wang2026-03-09🤖 cs.LG

Artificial Intelligence for Detecting Fetal Orofacial Clefts and Advancing Medical Education

Questo studio presenta un sistema di intelligenza artificiale addestrato su oltre 45.000 immagini ecografiche che non solo diagnostica le fessure orofacciali fetali con un'accuratezza pari a quella dei radiologi esperti, ma funge anche da strumento didattico efficace per migliorare le capacità diagnostiche dei radiologi meno esperti.

Yuanji Zhang, Yuhao Huang, Haoran Dou, Xiliang Zhu, Chen Ling, Zhong Yang, Lianying Liang, Jiuping Li, Siying Liang, Rui Li, Yan Cao, Yuhan Zhang, Jiewei Lai, Yongsong Zhou, Hongyu Zheng, Xinru Gao, Cheng Yu, Liling Shi, Mengqin Yuan, Honglong Li, Xiaoqiong Huang, Chaoyu Chen, Jialin Zhang, Wenxiong Pan, Alejandro F. Frangi, Guangzhi He, Xin Yang, Yi Xiong, Linliang Yin, Xuedong Deng, Dong Ni2026-03-09🤖 cs.AI

Predicting Atomistic Transitions with Transformers

Questo articolo dimostra come i modelli transformer possano essere addestrati per prevedere in modo efficiente le transizioni atomiche nei nano-cluster, offrendo un'alternativa a basso costo computazionale rispetto alle tecniche di simulazione tradizionali e consentendo la generazione di molteplici microstati fisicamente validi.

Henry Tischler, Wenting Li, Qi Tang, Danny Perez, Thomas Vogel2026-03-09🔬 cond-mat.mtrl-sci

Hierarchical Industrial Demand Forecasting with Temporal and Uncertainty Explanations

Questo articolo presenta un nuovo metodo interpretabile per la previsione gerarchica della domanda industriale che, superando le limitazioni dei modelli esistenti, offre spiegazioni chiare su variabili temporali, incertezza e cambiamenti nei dati, migliorando così la fiducia e l'adozione di tali modelli nelle catene di approvvigionamento reali.

Harshavardhan Kamarthi, Shangqing Xu, Xinjie Tong, Xingyu Zhou, James Peters, Joseph Czyzyk, B. Aditya Prakash2026-03-09🤖 cs.LG

Causal Interpretation of Neural Network Computations with Contribution Decomposition

Il paper introduce CODEC, un metodo che utilizza autoencoder sparsi per scomporre il comportamento delle reti neurali in contributi di neuroni nascosti, rivelando processi causali e permettendo una manipolazione e interpretazione più efficaci dei modelli sia artificiali che biologici.

Joshua Brendan Melander, Zaki Alaoui, Shenghua Liu, Surya Ganguli, Stephen A. Baccus2026-03-09🤖 cs.LG

Boosting deep Reinforcement Learning using pretraining with Logical Options

Il paper propone H²RL, un approccio ibrido che utilizza un preaddestramento basato su opzioni logiche per allineare gli agenti di apprendimento per rinforzo profondo, migliorando le decisioni a lungo termine e superando le prestazioni di baselines neurali, simboliche e neuro-simboliche.

Zihan Ye, Phil Chau, Raban Emunds, Jannis Blüml, Cedric Derstroff, Quentin Delfosse, Oleg Arenz, Kristian Kersting2026-03-09🤖 cs.AI

A recipe for scalable attention-based MLIPs: unlocking long-range accuracy with all-to-all node attention

Il paper presenta AllScAIP, un potenziale interatomico basato su machine learning che utilizza un meccanismo di attenzione "all-to-all" per catturare in modo efficiente e preciso le interazioni a lungo raggio in sistemi su larga scala, superando i limiti dei modelli basati su bias fisici quando si dispone di grandi quantità di dati.

Eric Qu, Brandon M. Wood, Aditi S. Krishnapriyan, Zachary W. Ulissi2026-03-09🔬 cond-mat.mtrl-sci

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

SCOPE è un framework plug-and-play per la segmentazione 3D few-shot incrementale che migliora le prestazioni delle nuove categorie recuperando e fondendo prototipi da regioni di sfondo non etichettate, ottenendo risultati all'avanguardia su ScanNet e S3DIS senza dimenticare le conoscenze precedenti.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

Il paper presenta BEVLM, un framework che colma il divario tra la ricchezza semantica dei Large Language Models e la coerenza spaziale delle rappresentazioni Bird's-Eye View, migliorando significativamente sia il ragionamento nelle scene di guida che le prestazioni di guida autonoma end-to-end in scenari critici per la sicurezza.

Thomas Monninger, Shaoyuan Xie, Qi Alfred Chen, Sihao Ding2026-03-09🤖 cs.AI

← Precedente Successivo →