cs.AI articoli | Gist.Science

Telogenesis: Goal Is All U Need

Il paper "Telogenesis" dimostra che le priorità attentive possono emergere endogenamente da un agente basandosi esclusivamente su tre lacune epistemiche (ignoranza, sorpresa e obsolescenza), permettendo di generare strategie adattive che superano quelle fisse e ricostruiscono la struttura ambientale latente senza ricompense esterne.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Il paper presenta GenePlan, un nuovo framework che utilizza algoritmi evolutivi assistiti da modelli linguistici di grandi dimensioni per generare pianificatori generalizzati interpretabili in Python, i quali dimostrano prestazioni superiori rispetto ai metodi basati su prompt e paragonabili agli stati dell'arte nel risolvere compiti di pianificazione classica.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Questo articolo teorizza che l'interazione tra ragionamento umano e intelligenza artificiale generativa genera una "Terza Entità" emergente, caratterizzata da un'asimmetria di agency e da un processo di "vibe-creation" che automatizza la conoscenza tacita, sfidando così i paradigmi epistemologici tradizionali e ridefinendo la competenza intellettuale nell'era dell'IA.

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Il paper introduce i flussi di normalizzazione condizionati temporalmente (tcNF), un nuovo framework autoregressivo che migliora il rilevamento di anomalie nelle serie temporali multivariate modellando con precisione le dipendenze temporali e le incertezze per generare distribuzioni probabilistiche affidabili.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

Il paper propone EvoPrompt, un nuovo framework che utilizza un proiettore di prompt condiviso tra modalità e una strategia di addestramento evolutiva con regolarizzazione geometrica per guidare l'adattamento dei modelli visione-linguaggio su compiti con pochi dati, garantendo alte prestazioni few-shot senza dimenticare le capacità zero-shot pre-addestrate.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Il paper presenta EDA, un framework efficiente in termini di parametri e dati che utilizza un'architettura decoppiata, una strategia di rigenerazione dei dati e un meccanismo di selezione dei campioni per adattare rapidamente i modelli bozzetto a modelli target finemente sintonizzati, ripristinando così le prestazioni del decoding speculativo con costi di addestramento ridotti.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Questo studio propone un metodo innovativo che utilizza i Large Language Models per generare messaggi di debunking delle fake news personalizzati in base ai tratti della personalità, dimostrando che tali messaggi sono generalmente più persuasivi di quelli generici e sollevando al contempo importanti questioni etiche.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Questo lavoro dimostra che l'implementazione di Mamba-2 utilizzando esclusivamente primitive standard XLA, senza kernel personalizzati, abilita un caching autoregressivo portatile e a complessità $O(1)$ che raggiunge prestazioni elevate su CPU, GPU NVIDIA e TPU mantenendo la compatibilità numerica con le implementazioni CUDA di riferimento.

Cosmo Santoni2026-03-11🤖 cs.AI

Routing without Forgetting

Il paper introduce "Routing without Forgetting" (RwF), un'architettura transformer che risolve il problema dell'apprendimento continuo online senza dimenticare, sostituendo l'adattamento graduale dei parametri con un routing dinamico basato su reti di Hopfield moderne per generare prompt contestuali in un singolo passaggio.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

A Variational Latent Equilibrium for Learning in Cortex

Questo lavoro propone un formalismo generale basato su principi di conservazione dell'energia e azione estrema per approssimare la retropropagazione nel tempo (BPTT) in modo biologicamente plausibile, estendendo il modello di Equilibrio Latente Generalizzato (GLE) per fornire un quadro rigoroso per l'apprendimento spaziotemporale nel cervello e per circuiti fisici.

Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici2026-03-11🤖 cs.AI

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Questo paper introduce l'ingegneria del contesto come disciplina fondamentale per gestire l'ambiente informativo degli agenti AI autonomi, proponendo un modello di maturità a quattro livelli che integra ingegneria del contesto, dell'intento e delle specifiche per superare le sfide di scalabilità e allineamento strategico nelle implementazioni aziendali.

Vera V. Vishnyakova2026-03-11🤖 cs.AI

Grounding Synthetic Data Generation With Vision and Language Models

Questo lavoro presenta un framework interpretabile basato su modelli visione-linguaggio per la generazione e valutazione di dati sintetici nel telerilevamento, introducendo il dataset ARAS400k che dimostra come l'addestramento su dati reali aumentati con dati sintetici superi le prestazioni dei modelli basati solo su dati reali per segmentazione semantica e descrizione di immagini.

Ümit Mert Ça\u{g}lar, Alptekin Temizel2026-03-11🤖 cs.AI

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Il paper introduce PRECEPT, un quadro unificato per l'adattamento al momento del test che combina recupero deterministico di regole, memoria consapevole dei conflitti e un ciclo esterno guidato da Pareto (COMPASS) per migliorare significativamente la resilienza, la generalizzazione composizionale e la robustezza degli agenti LLM rispetto alla conoscenza obsoleta o avversaria.

Arash Shahmansoori2026-03-11🤖 cs.AI

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

Il paper propone MM-tau-p², un nuovo benchmark con 12 metriche innovative per valutare in modo olistico e automatizzato la robustezza degli agenti multi-modali basati su LLM in ambienti a doppio controllo, considerando l'adattamento alla personalità dell'utente e le sfide specifiche dei settori telecomunicazioni e retail.

Anupam Purwar, Aditya Choudhary2026-03-11🤖 cs.AI

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

Il paper introduce MiniAppBench, il primo benchmark completo per valutare la generazione di applicazioni interattive basate su HTML da parte dei modelli linguistici, accompagnato da MiniAppEval, un framework di valutazione automatizzato che supera i limiti delle metriche tradizionali misurando l'allineamento con il giudizio umano su intenzione, staticità e dinamicità.

Zuhao Zhang, Chengyue Yu, Yuante Li, Chenyi Zhuang, Linjian Mo, Shuai Li2026-03-11🤖 cs.AI

When to Lock Attention: Training-Free KV Control in Video Diffusion

Il paper presenta KV-Lock, un metodo senza addestramento per i modelli di diffusione video basati su DiT che migliora la qualità del primo piano mantenendo la coerenza dello sfondo, regolando dinamicamente il blocco delle chiavi-valori e la scala della guida condizionale in base al rischio di allucinazione.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian Wang2026-03-11🤖 cs.AI

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Il paper presenta un framework open-source per la rilevazione di anomalie nelle serie temporali basato su GNN, dimostrando attraverso una valutazione critica che tali modelli migliorano sia le prestazioni di rilevazione che l'interpretabilità, pur evidenziando le carenze nelle attuali pratiche di valutazione.

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

Logics-Parsing-Omni Technical Report

Il paper propone il framework Omni Parsing, che unifica la gestione di dati multimodali eterogenei attraverso una tassonomia comune e un paradigma di parsing progressivo basato su rilevamento olistico, riconoscimento dettagliato e interpretazione multilivello, per trasformare segnali non strutturati in conoscenza logica standardizzata e tracciabile, supportata dal modello Logics-Parsing-Omni e dal benchmark OmniParsingBench.

Xin An, Jingyi Cai, Xiangyang Chen, Huayao Liu, Peiting Liu, Peng Wang, Bei Yang, Xiuwen Zhu, Yongfan Chen, Baoyu Hou, Shuzhao Li, Weidong Ren, Fan Yang, Jiangtao Zhang, Xiaoxiao Xu, Lin Qu2026-03-11🤖 cs.AI

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Il paper introduce EsoLang-Bench, un nuovo benchmark basato su linguaggi di programmazione esotici privi di incentivi economici per l'addestramento, che rivela come i modelli linguistici di frontiera, nonostante le alte prestazioni sui test standard, falliscano nel dimostrare un ragionamento genuino quando devono apprendere nuovi linguaggi tramite documentazione e feedback.

Aman Sharma, Paras Chopra2026-03-11🤖 cs.AI

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Questo studio presenta un framework di classificazione automatizzata per la gestione del rischio cardiaco negli anziani, dimostrando che un'architettura Transformer personalizzata supera sia i metodi tradizionali che i modelli linguistici generici nell'analisi di lunghe storie cliniche non strutturate.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van Es2026-03-11🤖 cs.AI

← Precedente Successivo →

cs.AI