A Constrained RL Approach for Cost-Efficient Delivery of Latency-Sensitive Applications

Il documento propone un approccio di apprendimento per rinforzo vincolato (CDRL) formulato come processo decisionale di Markov vincolato, che garantisce la consegna tempestiva dei pacchetti per applicazioni sensibili alla latenza minimizzando al contempo i costi di allocazione delle risorse, superando così le limitazioni delle tecniche di ottimizzazione stocastica tradizionali.

Ozan Aygün, Vincenzo Norman Vitale, Antonia M. Tulino + 3 more2026-03-05🤖 cs.LG

Out-of-distribution transfer of PDE foundation models to material dynamics under extreme loading

Questo studio valuta l'efficacia del trasferimento fuori distribuzione di modelli fondazionali per le equazioni differenziali parziali (POSEIDON e MORPH) nella previsione dello stato terminale di dinamiche materiali sotto carichi estremi, confrontando l'adattamento fine e l'addestramento da zero su regimi dominati da discontinuità come le interfacce multistrato e la frattura dinamica.

Mahindra Rautela, Alexander Most, Siddharth Mansingh + 9 more2026-03-05🤖 cs.LG

Efficient Refusal Ablation in LLM through Optimal Transport

Questo lavoro introduce un framework basato sul trasporto ottimale che, trasformando l'intera distribuzione delle attivazioni dannose per allinearle a quelle innocue e intervenendo selettivamente su strati specifici, supera i metodi di jailbreaking esistenti in termini di successo e preservazione delle capacità del modello, rivelando al contempo che i meccanismi di rifiuto sono localizzati piuttosto che distribuiti.

Geraldin Nanfack, Eugene Belilovsky, Elvis Dohmatob2026-03-05🤖 cs.AI

RoboCasa365: A Large-Scale Simulation Framework for Training and Benchmarking Generalist Robots

Il paper presenta RoboCasa365, un ampio framework di simulazione basato su 365 compiti quotidiani in 2.500 ambienti cucina diversi e oltre 2.200 ore di dati dimostrativi, progettato per valutare e migliorare le politiche dei robot generalisti attraverso esperimenti sistematici su apprendimento multi-task, modelli fondazionali e apprendimento continuo.

Soroush Nasiriany, Sepehr Nasiriany, Abhiram Maddukuri + 1 more2026-03-05🤖 cs.AI

Turning Trust to Transactions: Tracking Affiliate Marketing and FTC Compliance in YouTube's Influencer Economy

Questo studio analizza un vasto dataset di video YouTube per rivelare la diffusione del marketing di affiliazione e la scarsa conformità alle normative FTC, dimostrando come le funzionalità standardizzate della piattaforma possano migliorare la trasparenza e raccomandando una collaborazione tra regolatori, partner e piattaforma per rafforzare la fiducia nell'economia degli influencer.

Chen Sun, Yash Vekaria, Zubair Shafiq + 1 more2026-03-05🤖 cs.LG