Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation

Il paper presenta MICoBot, un sistema di dialoghi a iniziativa mista che coordina la collaborazione uomo-robot attraverso una pianificazione a tre livelli per adattare dinamicamente l'allocazione dei compiti alle capacità del robot e alla disponibilità dell'umano, migliorando significativamente il successo del compito e l'esperienza utente rispetto ai metodi tradizionali.

Albert Yu, Chengshu Li, Luca Macesanu + 4 more2026-03-02💬 cs.CL

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Questo lavoro introduce Dynamic Fine-Tuning (DFT), un metodo che corregge la struttura di ricompasta implicita nella SFT standard attraverso una ridimensionamento dinamico dei gradienti, migliorando significativamente la generalizzazione dei modelli linguistici su compiti complessi come il ragionamento matematico e la generazione di codice.

Yongliang Wu, Yizhou Zhou, Zhou Ziheng + 7 more2026-03-02🤖 cs.LG

Unraveling Syntax: How Language Models Learn Context-Free Grammars

Questo lavoro estende la comprensione dell'apprendimento dei modelli linguistici sulle grammatiche libere dal contesto definendo i "sottogrammatici", dimostrando teoricamente che la perdita si decompone linearmente e che i modelli apprendono queste strutture in parallelo, mentre le evidenze empiriche rivelano che il preaddestramento migliora le rappresentazioni interne ma non risolve le difficoltà con la ricorsione profonda.

Laura Ying Schulz, Daniel Mitropolsky, Tomaso Poggio2026-03-02💬 cs.CL

Carré du champ flow matching: better quality-generalisation tradeoff in generative models

Il paper introduce il Carré du champ flow matching (CDC-FM), un metodo che migliora il compromesso tra qualità del campione e generalizzazione nei modelli generativi sostituendo il rumore isotropo standard con un rumore gaussiano anisotropo sensibile alla geometria locale dei dati, dimostrando risultati superiori in scenari con dati scarsi o distribuzioni non uniformi.

Jacob Bamberger, Iolo Jones, Dennis Duncan + 3 more2026-03-02🤖 cs.AI