cs.LG articoli | Gist.Science

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

Il paper presenta SWE-MiniSandbox, un metodo leggero e privo di container che utilizza meccanismi a livello di kernel e tecniche di pre-caching per abilitare l'addestramento scalabile di agenti di ingegneria software tramite reinforcement learning, riducendo drasticamente l'uso del disco e i tempi di preparazione dell'ambiente rispetto alle pipeline basate su container.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

Il paper introduce MiDAS, un sistema open-source e agnostico per l'acquisizione non invasiva di dati multimodali sincronizzati nella chirurgia robotica minimamente invasiva, che supera le barriere delle interfacce proprietarie e fornisce nuovi dataset annotati per la ricerca.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Questo studio presenta AHSIV, un framework di selezione dei modelli adattivo e consapevole dell'orizzonte temporale che risolve l'instabilità nella classificazione delle previsioni di domanda in ambienti caratterizzati da intermittenza e variabilità, offrendo una soluzione coerente per supportare strategie aziendali e operazioni multi-SKU.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

Il paper presenta GaiaFlow, un framework innovativo che ottimizza il compromesso tra precisione nella ricerca e sostenibilità ambientale attraverso un'architettura di tuning guidato dalla semantica basata su diffusione, riducendo significativamente l'impronta di carbonio mantenendo elevate prestazioni di recupero.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

Il paper presenta MolCrystalFlow, un modello generativo basato sul flow matching che risolve la sfida della previsione delle strutture cristalline molecolari disaccoppiando la complessità intramolecolare dall'impaccamento intermolecolare attraverso la rappresentazione delle molecole come corpi rigidi su varietà Riemanniane.

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

Questo studio dimostra che, nonostante i recenti progressi nei modelli linguistici su larga scala, la loro capacità di ragionamento diretto su contesti estesi (fino a 64k token) per la correzione di bug è fortemente limitata, rivelando che i successi osservati nei benchmark agenziali derivano principalmente dalla decomposizione dei compiti in passaggi a breve contesto piuttosto che da una reale capacità di elaborazione di lunghi contesti.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

Il paper propone FLoRG, un framework di federated learning che utilizza l'aggregazione della matrice Gram di una singola matrice a basso rango e un allineamento Procruste per eliminare errori di aggregazione, ridurre il drift di decomposizione e migliorare l'accuratezza dei task riducendo drasticamente il sovraccarico di comunicazione rispetto alle tecniche esistenti.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

Conditionally Site-Independent Neural Evolution of Antibody Sequences

Il paper presenta CoSiNE, un modello di evoluzione neurale basato su catene di Markov a tempo continuo che supera i limiti degli approcci esistenti integrando la dinamica evolutiva per catturare le interazioni epistatiche e migliorare la previsione degli effetti delle varianti e l'ottimizzazione dell'affinità degli anticorpi.

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

What Topological and Geometric Structure Do Biological Foundation Models Learn? Evidence from 141 Hypotheses

Attraverso un ciclo autonomo di generazione e verifica di 141 ipotesi, lo studio dimostra che i modelli fondazionali biologici apprendono una struttura geometrica e topologica genuina e condivisa tra diverse architetture, sebbene tale segnale sia significativamente più localizzato nei tessuti immunitari rispetto ad altri contesti.

Ihor Kendiukhov2026-03-09🤖 cs.LG

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

Il paper propone EMPO $^2$ , un framework ibrido di ottimizzazione on- e off-policy che integra la memoria per potenziare l'esplorazione degli agenti LLM, ottenendo significativi miglioramenti nelle prestazioni e una superiore adattabilità a nuovi compiti rispetto ai metodi esistenti.

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

Questo studio inquadra il collasso modale nei modelli linguistici multimodali come un problema di decodifica disallineata, dimostrando che la perdita di informazioni è determinata dal criterio di valutazione del decoder e non dall'architettura, e che l'adeguamento dell'obiettivo di training può ripristinare selettivamente l'accesso a specifiche modalità.

Jayadev Billa2026-03-09🤖 cs.AI

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

Il paper propone un pipeline Web-Knowledge-Web che combina l'estrazione iterativa di dati da fonti web, la costruzione di un grafo della conoscenza tramite LLM e una stima della copertura basata su modelli ecologici per scoprire in modo efficiente e preciso fornitori di PMI nel settore della produzione di apparecchiature semiconduttori, superando le lacune di copertura dei database aziendali esistenti.

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

Il paper presenta un quadro teorico che stabilisce l'equivalenza tra aggiornamenti dei pesi e spostamenti delle attivazioni, introducendo un metodo di "joint adaptation" che combina entrambi gli spazi per ottenere prestazioni superiori alla fine-tuning completa con una frazione minima di parametri.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Questo lavoro propone una decomposizione funzionale ad anello tensoriale reparametrizzata basata su rappresentazioni neurali implicite, che supera i limiti delle decomposizioni tradizionali su griglie fisse e migliora il recupero di dati multidimensionali attraverso un'analisi spettrale e una nuova inizializzazione dei fattori.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Questo articolo propone un framework acustico compatto che combina un codificatore CNN multi-ramo con un'unità di memoria Legendre (LMU) e una fusione di ensemble calibrata per migliorare la classificazione cross-dominio dei pianti infantili, affrontando le sfide legate alla non stazionarietà dei segnali, alla scarsità di annotazioni e ai forti spostamenti di dominio.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

Il paper introduce Whisper-RIR-Mega, un nuovo benchmark di dati accoppiati (puliti e riverberati) basato su LibriSpeech e RIR-Mega per valutare la robustezza dei modelli ASR Whisper alle acustiche degli ambienti, dimostrando come il riverbero degradi sistematicamente le prestazioni.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

Il paper introduce RigidSSL, un framework di pre-addestramento auto-supervisionato che, integrando l'apprendimento delle proprietà geometriche rigide e delle dinamiche conformazionali, supera i limiti degli attuali modelli generativi migliorando significativamente la progettabilità, la diversità e la realismo fisico nella progettazione e nell'analisi degli ensemble conformazionali delle proteine.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

Il paper presenta mlx-vis, una libreria Python open source per Apple Silicon che implementa sei metodi di riduzione dimensionale e un algoritmo di grafo k-NN interamente su GPU Metal, offrendo un'elaborazione ad alte prestazioni e un rendering video accelerato direttamente nel framework MLX.

Han Xiao2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Il paper propone "Traversal-as-Policy", un metodo che distilla i log di esecuzione in un Gated Behavior Tree eseguibile per trasformare la navigazione dell'albero in una politica di controllo verificabile, migliorando significativamente il successo, la sicurezza e l'efficienza degli agenti LLM autonomi su benchmark complessi.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Questo lavoro propone un framework di addestramento regolarizzato per la privacy che affronta la perdita di informazioni compositiva nei sistemi sequenziali multi-agente LLM, dimostrando che la protezione dei dati richiede un controllo a livello di sistema piuttosto che vincoli locali isolati.

Sadia Asif, Mohammad Mohammadi Amiri2026-03-09🤖 cs.LG

← Precedente Successivo →