MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Il paper introduce MEM (Multi-Scale Embodied Memory), un'architettura di memoria multimodale che combina ricordi a breve termine basati su video e ricordi a lungo termine basati su testo per abilitare i robot a eseguire compiti complessi e di lunga durata, come pulire una cucina o preparare un panino, adattando intelligentemente le proprie strategie di manipolazione.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm

Questo studio presenta un agente proattivo basato su un algoritmo DDQN con esperienza prioritaria che, addestrato su 9000 episodi, riesce a prevedere con successo gli episodi di congelamento della marcia nei pazienti con Parkinson fino a 8,72 secondi prima dell'insorgenza, consentendo interventi tempestivi tramite dispositivi indossabili.

Septian Enggar Sukmana, Sang Won Bae, Tomohiro Shibata2026-03-05🤖 cs.LG

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Il paper introduce MOOSE-Star, un framework unificato che supera l'intrattabilità matematica del training diretto per la scoperta scientifica riducendo la complessità da esponenziale a logaritmica attraverso l'addestramento su sottocompiti decomposti, una ricerca gerarchica guidata dalla motivazione e una composizione limitata, supportato dal dataset TOMATO-Star.

Zonglin Yang, Lidong Bing2026-03-05🤖 cs.LG