SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms

Il paper presenta SEA-TS, un agente autonomo in grado di generare, validare e ottimizzare algoritmi di previsione delle serie temporali attraverso un ciclo di auto-evoluzione che combina ricerca MCTS, revisione del codice e ragionamento globale, ottenendo risultati superiori rispetto ai metodi esistenti e scoprendo nuovi pattern architetturali innovativi.

Longkun Xu, Xiaochun Zhang, Qiantu Tuo + 1 more2026-03-06🤖 cs.AI

Differentially Private Multimodal In-Context Learning

Il paper presenta DP-MTV, il primo framework che abilita l'apprendimento in contesto multimodale con molte dimostrazioni garantendo la privacy differenziale formale attraverso l'aggregazione di dati in vettori di compito compatti nello spazio delle attivazioni, permettendo così l'inferenza illimitata con un singolo aggiunta di rumore e mantenendo alte prestazioni su benchmark visivi e linguistici.

Ivoline C. Ngong, Zarreen Reza, Joseph P. Near2026-03-06🤖 cs.AI

Authorize-on-Demand: Dynamic Authorization with Legality-Aware Intellectual Property Protection for VLMs

Il paper propone AoD-IP, un nuovo framework per la protezione della proprietà intellettuale dei modelli visione-linguaggio che abilita un'autorizzazione dinamica su richiesta e una valutazione della legalità, superando i limiti delle definizioni statiche tradizionali consentendo agli utenti di adattare flessibilmente i domini autorizzati durante il deployment.

Lianyu Wang, Meng Wang, Huazhu Fu + 1 more2026-03-06🤖 cs.AI

EvoTool: Self-Evolving Tool-Use Policy Optimization in LLM Agents via Blame-Aware Mutation and Diversity-Aware Selection

EvoTool è un framework auto-evolutivo che ottimizza le politiche di utilizzo degli strumenti negli agenti LLM attraverso un paradigma evolutivo privo di gradienti, basato su tre meccanismi innovativi di attribuzione della colpa, mutazione mirata e selezione della popolazione, ottenendo prestazioni superiori rispetto ai metodi esistenti su diversi benchmark.

Shuo Yang, Soyeon Caren Han, Xueqi Ma + 3 more2026-03-06🤖 cs.AI

AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows

Il paper introduce AgentSCOPE, un benchmark e un framework basato sul "Privacy Flow Graph" che dimostra come la valutazione della privacy negli sistemi agentici debba analizzare ogni fase intermedia del flusso informativo, rivelando che oltre l'80% degli scenari presenta violazioni non rilevabili dalle sole valutazioni degli output finali.

Ivoline C. Ngong, Keerthiram Murugesan, Swanand Kadhe, Justin D. Weisz, Amit Dhurandhar, Karthikeyan Natesan Ramamurthy2026-03-06🔒 cs.CR

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Il paper introduce BandPO, un nuovo metodo di ottimizzazione per l'apprendimento per rinforzo dei modelli linguistici che sostituisce il clipping canonico con un operatore teorico unificato e consapevole delle probabilità, risolvendo il collo di bottiglia esplorativo e prevenendo il collasso dell'entropia senza compromettere la stabilità.

Yuan Li, Bo Wang, Yufei Gao + 4 more2026-03-06🤖 cs.AI

Retrieval-Augmented Generation with Covariate Time Series

Il paper presenta RAG4CTS, un framework di Retrieval-Augmented Generation privo di addestramento e consapevole dei regimi, progettato per gestire serie temporali con covariate in scenari industriali a scarsità di dati, come la manutenzione predittiva delle valvole PRSOV, dove ha dimostrato prestazioni superiori rispetto agli stati dell'arte e un funzionamento reale senza falsi allarmi.

Kenny Ye Liang, Zhongyi Pei, Huan Zhang + 3 more2026-03-06🤖 cs.AI