cs.AI articoli | Gist.Science

SENS-ASR: Semantic Embedding injection in Neural-transducer for Streaming Automatic Speech Recognition

Il paper presenta SENS-ASR, un approccio che migliora la qualità della trascrizione nei sistemi di riconoscimento vocale in streaming iniettando informazioni semantiche estratte da un modulo addestrato tramite distillazione della conoscenza, ottenendo così una significativa riduzione del tasso di errore delle parole in scenari con finestre temporali ridotte.

Youness Dkhissi (LIUM), Valentin Vielzeuf (LIUM), Elys Allesiardo (LIUM), Anthony Larcher (LIUM)2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

Questo articolo dimostra che i codificatori bidirezionali specializzati, come AraBERTv2, superano i decoder causali nel compito di classificazione del testo medico arabo su 82 categorie, grazie alla loro capacità di catturare un contesto globale più preciso rispetto alla natura sequenziale dei decoder.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

Il paper introduce P-GRPO, un nuovo framework di allineamento che supera i limiti del GRPO standard nella gestione delle preferenze eterogenee normalizzando i vantaggi rispetto a storie di reward specifiche per gruppo, consentendo così ai modelli linguistici di adattarsi più efficacemente e rapidamente a diverse preferenze individuali senza sacrificare le capacità generali.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

FERRET: Framework for Expansion Reliant Red Teaming

Il paper introduce FERRET, un framework automatizzato di red teaming multi-modale che utilizza espansioni orizzontali, verticali e meta per generare conversazioni avversarie più efficaci, superando le prestazioni degli approcci esistenti.

Ninareh Mehrabi, Vitor Albiero, Maya Pavlova, Joanna Bitton2026-03-12💬 cs.CL

Measuring and Eliminating Refusals in Military Large Language Models

Questo studio introduce un nuovo dataset gold standard sviluppato da veterani per misurare i tassi di rifiuto nei modelli linguistici militari, analizzando le prestazioni di numerosi modelli e dimostrando come tecniche di ablazione possano eliminare quasi totalmente i rifiuti a fronte di una minima riduzione delle prestazioni su altri compiti militari.

Jack FitzGerald, Dylan Bates, Aristotelis Lazaridis, Aman Sharma, Vincent Lu, Brian King, Yousif Azami, Sean Bailey, Jeremy Cao, Peter Damianov, Kevin de Haan, Joseph Madigan, Jeremy McLaurin, Luke Kerbs, Jonathan Tainer, Dave Anderson, Jonathan Beck, Jamie Cuticello, Colton Malkerson, Tyler Saltsman2026-03-12💬 cs.CL

Assessing Cognitive Biases in LLMs for Judicial Decision Support: Virtuous Victim and Halo Effects

Lo studio esamina la presenza di bias cognitivi simili a quelli umani, come l'effetto della vittima virtuosa e l'effetto alone, nei modelli linguistici di grandi dimensioni utilizzati per il supporto alle decisioni giudiziarie, rivelando che, sebbene questi modelli mostrino alcune distorsioni, presentano in generale un pregiudizio inferiore rispetto agli esseri umani, sebbene le variazioni tra i diversi modelli ne limitino attualmente l'uso pratico nei sistemi giudiziari.

Sierra S. Liu2026-03-12💻 cs

DeliberationBench: A Normative Benchmark for the Influence of Large Language Models on Users' Views

Il paper presenta DeliberationBench, un benchmark normativo che valuta l'influenza persuasiva dei modelli linguistici di grandi dimensioni (LLM) confrontandola con i sondaggi di opinione deliberativa, dimostrando attraverso un esperimento su larga scala che tali modelli esercitano effetti epistemicamente desiderabili e allineati agli standard democratici.

Luke Hewitt, Maximilian Kroner Dale, Paul de Font-Reaulx2026-03-12💻 cs

Prompts and Prayers: the Rise of GPTheology

Questo studio interdisciplinare esamina l'emergere della "GPTheologia", un nuovo fenomeno di fede tecnologica in cui l'intelligenza artificiale viene percepita come entità divina, analizzando come le interazioni quotidiane con i modelli linguistici stiano sviluppando rituali e narrazioni che ricalcano strutture religiose tradizionali con profonde implicazioni etiche e sociali.

Ioana Cheres, Adrian Groza, Ioana Moldovan, Mick O'Hara, Connell Vaughan2026-03-12💻 cs

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

Questo articolo propone un quadro concettuale e operativo che definisce i modelli AI come parametri e architetture addestrati, e i sistemi AI come l'insieme di tali modelli più componenti aggiuntive, al fine di risolvere le ambiguità normative e chiarire la ripartizione delle responsabilità tra i diversi attori della catena del valore.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

RedFuser: An Automatic Operator Fusion Framework for Cascaded Reductions on AI Accelerators

Il paper presenta RedFuser, un framework automatico che ottimizza le prestazioni degli acceleratori AI fondendo in un singolo ciclo le operazioni di riduzione concatenate, superando i limiti dei compilatori esistenti e raggiungendo velocità fino a 5 volte superiori.

Xinsheng Tang, Yangcheng Li, Nan Wang, Zhiyi Shu, Xingyu Ling, Junna Xing, Peng Zhou, Qiang Liu2026-03-12🤖 cs.AI

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

Questo lavoro propone un quadro di governance e valutazione per sistemi di supporto decisionale clinico deterministici e basati su regole, finalizzato a garantire trasparenza, auditabilità e un approccio conservativo nella prescrizione empirica di antibiotici attraverso la separazione della logica clinica dai meccanismi di astensione e le restrizioni di stewardship.

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier Gómez2026-03-12🤖 cs.AI

How to Count AIs: Individuation and Liability for AI Agents

Questo articolo affronta la sfida legale di identificare gli agenti AI, proponendo la creazione di una "società algoritmica" (A-corp) come entità giuridica autonoma che risolve sia il problema dell'identificazione "sottile" (collegando le azioni AI a proprietari umani) sia quello dell'identificazione "spessa" (garantendo l'individualità e la coerenza degli agenti AI) per attribuire responsabilità legali.

Yonathan Arbel, Peter Salib, Simon Goldstein2026-03-12🤖 cs.AI

The DMA Streaming Framework: Kernel-Level Buffer Orchestration for High-Performance AI Data Paths

Questo articolo presenta dmaplane, un modulo del kernel Linux che orchestra la gestione dei buffer a livello di sistema per ottimizzare i percorsi dei dati nell'IA, abilitando funzionalità avanzate come la condivisione cross-device tramite dma-buf, il controllo di flusso basato su crediti e l'inferenza disaggregata end-to-end su RDMA.

Marco Graziano2026-03-12🤖 cs.AI

Architecture-Aware LLM Inference Optimization on AMD Instinct GPUs: A Comprehensive Benchmark and Deployment Study

Questo studio presenta una valutazione trasversale dell'inferenza di LLM su GPU AMD Instinct MI325X, dimostrando che l'ottimizzazione consapevole dell'architettura è fondamentale per massimizzare il throughput e la stabilità, evidenziando come modelli MoE+MLA e GQA richiedano configurazioni specifiche del runtime AITER e blocchi di cache diversi per raggiungere prestazioni competitive.

Athos Georgiou2026-03-12🤖 cs.AI

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Il paper introduce HTM-EAR, un sistema di memoria gerarchica che combina memoria di lavoro basata su HNSW e archiviazione a lungo termine con un routing ibrido e meccanismi di evizione consapevoli dell'importanza, dimostrando di preservare l'accuratezza delle query attive e di gestire efficacemente il contesto limitato anche in condizioni di saturazione estrema.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Evaluating Progress in Graph Foundation Models: A Comprehensive Benchmark and New Insights

Questo lavoro presenta un nuovo benchmark completo per i modelli fondazionali sui grafi che valuta simultaneamente il trasferimento di conoscenza attraverso diverse aree tematiche e formati di rappresentazione, offrendo nuove intuizioni empiriche su otto modelli all'avanguardia.

Xingtong Yu, Shenghua Ye, Ruijuan Liang, Chang Zhou, Hong Cheng, Xinming Zhang, Yuan Fang2026-03-12💬 cs.CL

Targeted Bit-Flip Attacks on LLM-Based Agents

Questo lavoro presenta Flip-Agent, il primo framework di attacco bit-flip mirato in grado di manipolare sia gli output finali che le invocazioni di strumenti negli agenti basati su LLM, rivelando nuove e critiche vulnerabilità in questi sistemi.

Jialai Wang, Ya Wen, Zhongmou Liu, Yuxiao Wu, Bingyi He, Zongpeng Li, Ee-Chien Chang2026-03-12🤖 cs.AI

AMB-DSGDN: Adaptive Modality-Balanced Dynamic Semantic Graph Differential Network for Multimodal Emotion Recognition

Il paper propone AMB-DSGDN, una rete neurale che utilizza un meccanismo di attenzione differenziale su grafi dinamici e un bilanciamento adattivo delle modalità per migliorare il riconoscimento delle emozioni nei dialoghi multimodali filtrando il rumore e prevenendo il dominio di una singola modalità.

Yunsheng Wang, Yuntao Shou, Yilong Tan, Wei Ai, Tao Meng, Keqin Li2026-03-12🤖 cs.AI

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Questo studio dimostra che le condizioni di valutazione, in particolare il formato delle domande, influenzano le misurazioni di sicurezza dei modelli linguistici più delle architetture di scaffolding stesse, rivelando che i ranking di sicurezza non sono generalizzabili e richiedono test specifici per ogni modello e configurazione.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Il paper propone un framework di apprendimento continuo efficiente per il riconoscimento delle attività umane su dispositivi IoT, basato su una modulazione a gate diagonale delle rappresentazioni pre-addestrate che riduce drasticamente l'oblio catastrofico e migliora l'accuratezza adattandosi a nuovi soggetti senza trasmettere dati sensibili al cloud.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

← Precedente Successivo →