cs.AI articoli | Gist.Science

RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators

Il paper presenta RedFuser, un framework automatico che ottimizza le prestazioni degli acceleratori AI fondendo in un singolo ciclo le operazioni di riduzione concatenate, superando i limiti dei compilatori esistenti e raggiungendo velocità fino a 5 volte superiori.

Xinsheng Tang, Yangcheng Li, Nan Wang, Zhiyi Shu, Xingyu Ling, Junna Xing, Peng Zhou, Qiang Liu2026-03-12🤖 cs.AI

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Questo lavoro propone un quadro di governance e valutazione per sistemi di supporto decisionale clinico deterministici e basati su regole, finalizzato a garantire trasparenza, auditabilità e un approccio conservativo nella prescrizione empirica di antibiotici attraverso la separazione della logica clinica dai meccanismi di astensione e le restrizioni di stewardship.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Questo articolo affronta la sfida legale di identificare gli agenti AI, proponendo la creazione di una "società algoritmica" (A-corp) come entità giuridica autonoma che risolve sia il problema dell'identificazione "sottile" (collegando le azioni AI a proprietari umani) sia quello dell'identificazione "spessa" (garantendo l'individualità e la coerenza degli agenti AI) per attribuire responsabilità legali.

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

The DMA Streaming Framework: Kernel-Level Buffer Orchestration for High-Performance AI Data Paths

Questo articolo presenta dmaplane, un modulo del kernel Linux che orchestra la gestione dei buffer a livello di sistema per ottimizzare i percorsi dei dati nell'IA, abilitando funzionalità avanzate come la condivisione cross-device tramite dma-buf, il controllo di flusso basato su crediti e l'inferenza disaggregata end-to-end su RDMA.

Marco Graziano2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Questo studio presenta una valutazione trasversale dell'inferenza di LLM su GPU AMD Instinct MI325X, dimostrando che l'ottimizzazione consapevole dell'architettura è fondamentale per massimizzare il throughput e la stabilità, evidenziando come modelli MoE+MLA e GQA richiedano configurazioni specifiche del runtime AITER e blocchi di cache diversi per raggiungere prestazioni competitive.

Athos Georgiou2026-03-12🤖 cs.AI

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Il paper introduce HTM-EAR, un sistema di memoria gerarchica che combina memoria di lavoro basata su HNSW e archiviazione a lungo termine con un routing ibrido e meccanismi di evizione consapevoli dell'importanza, dimostrando di preservare l'accuratezza delle query attive e di gestire efficacemente il contesto limitato anche in condizioni di saturazione estrema.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Questo lavoro presenta un nuovo benchmark completo per i modelli fondazionali sui grafi che valuta simultaneamente il trasferimento di conoscenza attraverso diverse aree tematiche e formati di rappresentazione, offrendo nuove intuizioni empiriche su otto modelli all'avanguardia.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Targeted Bit-Flip Attacks on LLM-Based Agents

Questo lavoro presenta Flip-Agent, il primo framework di attacco bit-flip mirato in grado di manipolare sia gli output finali che le invocazioni di strumenti negli agenti basati su LLM, rivelando nuove e critiche vulnerabilità in questi sistemi.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien Chang2026-03-12🤖 cs.AI

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition

Il paper propone AMB-DSGDN, una rete neurale che utilizza un meccanismo di attenzione differenziale su grafi dinamici e un bilanciamento adattivo delle modalità per migliorare il riconoscimento delle emozioni nei dialoghi multimodali filtrando il rumore e prevenendo il dominio di una singola modalità.

Yunsheng Wang, Yuntao Shou, Yilong Tan, Wei Ai, Tao Meng, Keqin Li2026-03-12🤖 cs.AI

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Questo studio dimostra che le condizioni di valutazione, in particolare il formato delle domande, influenzano le misurazioni di sicurezza dei modelli linguistici più delle architetture di scaffolding stesse, rivelando che i ranking di sicurezza non sono generalizzabili e richiedono test specifici per ogni modello e configurazione.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Il paper propone un framework di apprendimento continuo efficiente per il riconoscimento delle attività umane su dispositivi IoT, basato su una modulazione a gate diagonale delle rappresentazioni pre-addestrate che riduce drasticamente l'oblio catastrofico e migliora l'accuratezza adattandosi a nuovi soggetti senza trasmettere dati sensibili al cloud.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

Questo studio presenta e valuta cinque strategie di ingegneria dei prompt per ridurre le allucinazioni nei modelli linguistici industriali, dimostrando che l'uso di un registro dati potenziato (M4) garantisce risultati coerenti in tutte le prove, mentre le versioni rivisitate di altre metodologie, come la decomposizione dei prompt (M2), mostrano miglioramenti significativi verso procedure più stabili e affidabili.

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach Gordon2026-03-12🤖 cs.AI

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Il paper propone XSAM, una nuova implementazione della Sharpness-Aware Minimization che supera le limitazioni delle versioni attuali offrendo una stima più accurata della direzione di massima curvatura e un migliore sfruttamento delle informazioni di gradino multi-step, garantendo così prestazioni superiori con un costo computazionale trascurabile.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Il documento introduce InFusionLayer, un nuovo strumento Python open-source basato sull'analisi di fusione combinatoria (CFA) che integra funzioni di caratteristiche punteggio-rank e diversità cognitiva per ottimizzare l'apprendimento di ensemble in problemi di classificazione multiclasse, dimostrando la sua efficacia su vari dataset di visione artificiale e la compatibilità con framework come PyTorch, TensorFlow e Scikit-learn.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Il paper propone FlowSem-MAE, un paradigma di pre-addestramento tabulare nativo dei protocolli che supera i limiti dei modelli basati su byte sequenziali per la classificazione del traffico cifrato, preservando le semantiche dei campi del protocollo e ottenendo prestazioni superiori con meno dati etichettati.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Training Language Models via Neural Cellular Automata

Questo lavoro propone l'uso di automi cellulari neurali per generare dati sintetici non linguistici che, utilizzati in una fase di pre-pre-addestramento, migliorano l'efficienza e le prestazioni dei modelli linguistici su compiti di ragionamento, superando anche l'addestramento su grandi quantità di testo naturale.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation

Questo articolo introduce gli AIBOM (Artificial Intelligence Bills of Materials) agentici, un'estensione dinamica degli SBOM basata su un'architettura multi-agente che integra monitoraggio del runtime, ricostruzione dell'ambiente e ragionamento sulle vulnerabilità per garantire una provenienza del software riproducibile e contestualizzata.

Petar Radanliev, Carsten Maple, Omar Santos, Kayvan Atefi2026-03-12🤖 cs.AI

Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents

Il paper presenta NabaOS, un framework di verifica leggero ispirato all'epistemologia indiana Nyaya Shastra che rileva le allucinazioni degli agenti AI in tempo reale tramite ricevute di esecuzione crittograficamente firmate, offrendo un compromesso superiore tra latenza e copertura rispetto alle prove a conoscenza zero.

Abhinaba Basu2026-03-12🤖 cs.AI

Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead

Questo articolo di posizione inquadra la memoria dei sistemi multi-agente come un problema di architettura informatica, proponendo una gerarchia a tre livelli e identificando la coerenza della memoria come la sfida aperta più critica per garantire sistemi scalabili e affidabili.

Zhongming Yu, Naicheng Yu, Hejia Zhang, Wentao Ni, Mingrui Yin, Jiaying Yang, Yujie Zhao, Jishen Zhao2026-03-12🤖 cs.AI

The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification

Questo articolo dimostra che il Filtro del Punto di Supporto Epistemico (ESPF) è il filtro ottimale unico che sintetizza il principio di massima entropia di Jaynes nella propagazione e la falsificazione popperiana nell'aggiornamento, minimizzando l'ignoranza epistemica nel caso peggiore senza ricorrere a prior soggettivi, come confermato da validazioni numeriche nel tracciamento orbitale.

Moriba Kemessia Jah2026-03-12🔢 math

← Precedente Successivo →