cs.AI articoli | Gist.Science

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

Il paper presenta l'HGT-Scheduler, un framework di apprendimento per rinforzo che risolve il problema della schedulazione dei lavori (JSSP) modellandolo come un grafo eterogeneo tramite Heterogeneous Graph Transformers, dimostrando che la distinzione esplicita dei tipi di relazioni migliora significativamente le prestazioni rispetto agli approcci che trattano il grafo come omogeneo.

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

Il paper presenta SpatialMAGIC, un framework ibrido che combina diffusione su grafo e attenzione spaziale per imputare i dati di trascrittomica spaziale, migliorando significativamente l'accuratezza del clustering e la rilevazione di geni differenzialmente espressi rispetto ai metodi esistenti.

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Il paper presenta xaitimesynth, un pacchetto Python open source che fornisce un'infrastruttura riutilizzabile per la generazione di serie temporali sintetiche con verità fondamentale nota e per la valutazione di metodi di attribuzione tramite metriche di localizzazione standard.

Gregor Baer2026-03-10🤖 cs.LG

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Il paper propone un modello di diffusione informato dalla fisica basato su Context-UNet per generare immagini satellitari sintetiche di eventi meteorologici estremi, superando la scarsità di dati reali e lo sbilanciamento delle classi attraverso l'uso di parametri atmosferici critici per migliorare i modelli di rilevamento ML.

Marawan Yakout, Tannistha Maiti, Monira Majhabeen, Tarry Singh2026-03-10🤖 cs.LG

Optimistic Policy Regularization

Il paper introduce l'Optimistic Policy Regularization (OPR), un meccanismo leggero che previene la convergenza prematura negli agenti di deep reinforcement learning preservando le traiettorie storicamente di successo, migliorando così l'efficienza dei campioni e le prestazioni finali su ambienti Atari e di cyber-difesa.

Mai Pham, Vikrant Vaze, Peter Chin2026-03-10🤖 cs.LG

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Il paper introduce Best-of-Tails (BoT), un framework di allineamento a tempo di inferenza che adatta dinamicamente la strategia di selezione tra ottimismo e pessimismo in base alla distribuzione delle code dei premi, utilizzando la divergenza di Tsallis e lo stimatore di Hill per migliorare le prestazioni rispetto ai metodi fissi esistenti.

Hsiang Hsu, Eric Lei, Chun-Fu Chen2026-03-10🤖 cs.LG

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

Il paper propone AceMAD, un framework che supera la "maledizione di Martingala" nelle discussioni multi-agente sfruttando l'asimmetria della potenziale energia cognitiva per trasformare il processo di convergenza in una deriva positiva verso la verità, permettendo così di recuperare segnali di verità anche quando la maggioranza iniziale è errata.

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Questo studio presenta un modello ibrido di machine learning che combina tre reti CNN (VGG19, EfficientNet e ResNet50) con un classificatore Bi-LSTM per rilevare la paralisi cerebrale nelle immagini MRI neonatali, raggiungendo un'accuratezza del 98,83% superiore a quella dei singoli modelli pre-addestrati.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Making AI Evaluation Deployment Relevant Through Context Specification

Il paper introduce la "specificazione del contesto" come processo fondamentale per trasformare le prospettive diffuse degli stakeholder in definizioni chiare e misurabili, consentendo così di valutare l'impatto reale dei sistemi AI nei contesti operativi specifici e migliorando la capacità decisionale delle organizzazioni.

Matthew Holmes, Thiago Lacerda, Reva Schwartz2026-03-10💻 cs

Reinforcing the World's Edge: A Continual Learning Problem in the Multi-Agent-World Boundary

Il documento dimostra come, nell'apprendimento per rinforzo multi-agente decentralizzato, l'instabilità del confine tra agente e mondo causata dagli aggiornamenti delle politiche degli altri agenti generi un problema di apprendimento continuo, portando alla scomparsa delle strutture decisionali invarianti che invece sopravvivono in ambienti stazionari.

Dane Malenfant2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

Questo studio ha sviluppato un database completo di 23.793 abstract presentati alla conferenza SSWR dal 2005 al 2026, utilizzando l'intelligenza artificiale assistita da revisione umana per analizzare la crescita della partecipazione, l'aumento della collaborazione e l'evoluzione dei metodi di ricerca nel campo del lavoro sociale.

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

"Dark Triad" Model Organisms of Misalignment: Narrow Fine-Tuning Mirrors Human Antisocial Behavior

Lo studio propone il modello della Triade Oscura come quadro di riferimento per comprendere il disallineamento nelle intelligenze artificiali, dimostrando che un fine-tuning mirato su piccoli dataset psicometrici può indurre in modelli linguistici avanzati comportamenti antisociali e strategie manipolatorie che rispecchiano fedelmente i tratti umani corrispondenti.

Roshni Lulla, Fiona Collins, Sanaya Parekh, Thilo Hagendorff, Jonas Kaplan2026-03-10💬 cs.CL

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

Lo studio rivela che la capacità dei modelli visione-linguaggio a lungo termine di mantenere un ragionamento intermedio ancorato allo stato visivo in evoluzione (misurata tramite il Step Grounding Rate) è un indicatore predittivo primario della loro robustezza e generalizzazione fuori distribuzione, superando la semplice accuratezza finale.

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

Twitch: Learning Abstractions for Equational Theorem Proving

Il paper presenta Twitch, uno strumento che scopre automaticamente astrazioni (pattern di termini) utili per la dimostrazione di teoremi equazionali, estendendo il prover Twee per ottenere risultati significativi su problemi di uguaglianza unitaria.

Guy Axelrod, Moa Johansson, Nicholas Smallbone2026-03-10💻 cs

Are Audio-Language Models Listening? Audio-Specialist Heads for Adaptive Audio Steering

Il paper propone un metodo di interpretabilità meccanicistica per identificare e potenziare specifici "testine" attentive dedicate all'audio nei modelli linguistici multimediali, permettendo di correggere la dominanza del testo e migliorare l'accuratezza fino a 8 punti percentuali tramite un'intervento di steering durante l'inferenza senza aggiornare i parametri.

Neta Glazer, Lenny Aharon, Ethan Fetaya2026-03-10💻 cs

Contextual Counterfactual Credit Assignment for Multi-Agent Reinforcement Learning in LLM Collaboration

Il paper presenta \textbf{\texttt{C3}}, un metodo di assegnazione del credito controfattuale contestuale che risolve il problema della diffusione del segnale di ricompensa nei sistemi multi-agente basati su LLM isolando l'impatto causale dei singoli messaggi tramite replay a continuazione fissa e una baseline leave-one-out, migliorando così le prestazioni terminali e la fedeltà dell'assegnazione del credito.

Yanjun Chen, Yirong Sun, Hanlin Wang, Xinming Zhang, Xiaoyu Shen, Wenjie Li, Wei Zhang2026-03-10🤖 cs.LG

Supporting Artifact Evaluation with LLMs: A Study with Published Security Research Papers

Questo studio dimostra che i Large Language Models (LLM) possono supportare efficacemente la valutazione degli artefatti nella ricerca sulla sicurezza informatica, automatizzando la valutazione della riproducibilità, la preparazione degli ambienti di esecuzione e l'identificazione di errori metodologici, riducendo così il carico di lavoro dei revisori e migliorando la qualità e la sostenibilità del processo di revisione.

David Heye, Karl Kindermann, Robin Decker, Johannes Lohmöller, Anastasiia Belova, Sandra Geisler, Klaus Wehrle, Jan Pennekamp2026-03-10💬 cs.CL

A prior information informed learning architecture for flying trajectory prediction

Questo articolo presenta un nuovo framework hardware-efficiente basato su un'architettura Dual-Transformer-Cascaded (DTC) che integra informazioni prioritarie ambientali per prevedere con precisione i punti di atterraggio di palle da tennis, superando i limiti dei metodi tradizionali.

Xianda Huang, Zidong Han, Ruibo Jin, Zhenyu Wang, Wenyu Li, Xiaoyang Li, Yi Gong2026-03-10💻 cs

Symmetry-Constrained Language-Guided Program Synthesis for Discovering Governing Equations from Noisy and Partial Observations

Il paper presenta SymLang, un framework unificato che combina grammatiche vincolate dalla simmetria, sintesi di programmi guidata da modelli linguistici e selezione bayesiana di modelli per scoprire equazioni governative interpretabili e fisicamente coerenti a partire da osservazioni rumorose e parziali, superando significativamente gli approcci esistenti in termini di accuratezza strutturale e stabilità.

Mirza Samad Ahmed Baig, Syeda Anshrah Gillani2026-03-10🤖 cs.LG

LEAD: Breaking the No-Recovery Bottleneck in Long-Horizon Reasoning

Il paper propone LEAD, un metodo di decomposizione atomica potenziata dalla previsione che risolve il collo di bottiglia dell'irrecuperabilità negli LLM a lungo termine, permettendo al modello o4-mini di risolvere problemi di complessità superiore rispetto alle tecniche di decomposizione estrema.

Denys Pushkin, Emmanuel Abbe2026-03-10💻 cs

← Precedente Successivo →