cs.LG articoli | Gist.Science

Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation

Questo studio applica l'interpretabilità meccanicistica per dimostrare che la distillazione della conoscenza, pur preservando il comportamento funzionale, induce una significativa riorganizzazione interna nei modelli studenti, che comprimono e scartano componenti del modello insegnante affidandosi a un numero ridotto di unità attivate.

Reilly Haskins, Benjamin Adams2026-03-10🤖 cs.LG

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

Il paper introduce Ready2Unlearn, un approccio proattivo che ottimizza la fase di addestramento dei modelli per prepararli a future richieste di cancellazione dei dati, rendendo il processo di machine unlearning più efficiente e fondato su principi solidi.

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

Il paper presenta EgoDex, il più ampio e diversificato dataset esistente di manipolazione abile umana registrato con Apple Vision Pro, che offre 829 ore di video egocentrici con annotazioni 3D delle mani per affrontare la scarsità di dati nell'apprendimento per imitazione e promuovere i progressi nella robotica e nella visione artificiale.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

Il paper presenta FreeKV, un framework di co-ottimizzazione algoritmo-sistema privo di addestramento che migliora l'efficienza del recupero della cache KV mantenendo un'accuratezza quasi perfetta e ottenendo fino a 13 volte di velocità rispetto ai metodi esistenti.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

Online Decision-Focused Learning

Il paper propone due nuovi algoritmi online per l'apprendimento decisionale focalizzato (DFL) in ambienti dinamici, che superano le sfide della non differenziabilità e non convessità attraverso regolarizzazione e tecniche di perturbazione, garantendo per la prima volta limiti di rimedio statici e dinamici e dimostrando prestazioni superiori in esperimenti pratici.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain Durmus2026-03-10🤖 cs.LG

Vid2World: Crafting Video Diffusion Models to Interactive World Models

Il paper presenta Vid2World, un approccio generale che trasforma modelli di diffusione video pre-addestrati in modelli del mondo interattivi ad alta fedeltà, permettendo una generazione autoregressiva e un controllo efficace delle azioni attraverso la causalizzazione dell'architettura e una guida causale.

Siqiao Huang, Jialong Wu, Qixing Zhou, Shangchen Miao, Mingsheng Long2026-03-10🤖 cs.LG

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

Il paper introduce MAS-ZERO, il primo framework di auto-evoluzione che progetta sistemi multi-agente senza supervisione esterna, adattando dinamicamente ruoli e protocolli durante l'inferenza per ottenere prestazioni superiori rispetto ai metodi manuali e automatici esistenti.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

Il paper presenta HDLxGraph, un nuovo framework che integra le caratteristiche grafiche intrinseche dei linguaggi HDL (tramite AST e DFG) nei sistemi RAG per migliorare significativamente le prestazioni di ricerca, debug e completamento del codice rispetto agli approcci basati sulla similarità semantica, supportato dal nuovo benchmark HDLSearch.

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

Il paper presenta WikiDBGraph, un nuovo benchmark su larga scala derivato da 100.000 database relazionali reali che evidenzia le limitazioni delle attuali tecniche di apprendimento collaborativo nel gestire silos di dati frammentati e non allineati, proponendo una valutazione più realistica dell'intero ciclo di gestione dei dati.

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Il paper introduce AgarCL, una piattaforma di ricerca basata sul gioco Agar.io per l'apprendimento per rinforzo continuo, che offre un ambiente non episodico e dinamico per valutare algoritmi standard e metodi di apprendimento continuo, rivelando che le sfide poste dall'ambiente vanno oltre il classico dilemma stabilità-plasticità.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Questo lavoro presenta X-MethaneWet, il primo dataset di benchmark globale cross-scala per le emissioni di metano dalle zone umide, che integra dati di simulazione e osservazioni reali per valutare modelli di deep learning e tecniche di transfer learning al fine di migliorare la previsione dei flussi di metano e lo sviluppo di modelli climatici basati sull'intelligenza artificiale.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Questo articolo sviluppa un quadro teorico generale per il controllo ottimale della densità di probabilità su spazi di misura, stabilendo un principio di massimo e un'equazione di Hamilton-Jacobi-Bellman per problemi multi-agente su larga scala, e propone un algoritmo numerico scalabile basato su reti neurali profonde per affrontarli.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

Il paper introduce VISTA, un nuovo framework senza addestramento che sfrutta i modelli visione-linguaggio per prevedere i prezzi delle azioni combinando rappresentazioni testuali e grafiche, ottenendo prestazioni superiori rispetto ai metodi tradizionali e basati solo su testo.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Questo paper propone un nuovo metodo di difesa contro gli attacchi di iniezione di prompt nei modelli linguistici su larga scala, che inietta segnali gerarchici di istruzione direttamente nelle rappresentazioni intermedie della rete tramite embedding addestrabili, ottenendo una riduzione significativa del tasso di successo degli attacchi rispetto alle tecniche esistenti senza compromettere l'utilità del modello.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

Il paper propone OCN, un nuovo metodo per la previsione dei collegamenti che combina ortogonalizzazione e normalizzazione per eliminare la ridondanza e mitigare il sovra-lisciamento nei vicini comuni di ordine superiore, ottenendo prestazioni superiori rispetto agli stati dell'arte sui benchmark più popolari.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Il paper introduce ViTaPEs, un'architettura transformer che utilizza codifiche posizionali visuo-tattili a due stadi per allineare le modalità in modo efficace, superando gli stati dell'arte in compiti di riconoscimento e generalizzazione zero-shot senza dipendere da modelli pre-addestrati.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

Il paper introduce LoFT, un metodo di adattamento a basso rango che allinea le dinamiche interne dell'ottimizzatore con quelle del full fine-tuning proiettando i momenti di Adam nello stesso sottospazio, riducendo così il divario prestazionale rispetto ai metodi standard come LoRA senza aumentare i costi di inferenza.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Il paper propone Progressive Neural Collapse (ProNC), un nuovo framework per l'apprendimento continuo che supera i limiti degli ETF globali fissi espandendo progressivamente il target geometrico per includere nuove classi, riducendo così l'oblio catastrofico e migliorando le prestazioni rispetto agli approcci esistenti.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Questo lavoro propone un nuovo approccio di correzione adattiva e plug-and-play che garantisce il rispetto rigoroso delle leggi di conservazione nei risultati degli operatori neurali, migliorando al contempo accuratezza, stabilità e flessibilità rispetto alle tecniche esistenti.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

Il paper presenta ActivePusher, un framework innovativo che combina modelli di fisica residua e apprendimento attivo basato sull'incertezza per migliorare l'efficienza dei dati e l'affidabilità della pianificazione a lungo termine nella manipolazione non prensile.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

← Precedente Successivo →