cs.AI articoli | Gist.Science

VoiceSHIELD-Small: Real-Time Malicious Speech Detection and Transcription

Il paper presenta VoiceSHIELD-Small, un modello leggero basato su Whisper-small che rileva in tempo reale e trascrive comandi vocali dannosi con un'accuratezza del 99,16%, superando i limiti dei metodi tradizionali basati sulla trascrizione testuale.

Sumit Ranjan, Sugandha Sharma, Ubaid Abbas, Puneeth N Ail2026-03-10💻 cs

YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK

Il progetto YAQIN presenta un'applicazione di intelligenza artificiale co-progettata che integra principi psicologici islamici e un chatbot sensibile alla fede per fornire supporto alla salute mentale culturalmente pertinente e aumentare la fiducia tra le donne musulmane nel Regno Unito.

Yasmin Zaraket, Céline Mougenot2026-03-10💻 cs

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Lo studio dimostra che i modelli linguistici di grandi dimensioni (LLM) mostrano bias decisionali rigidi e una scarsa capacità di esplorazione in contesti a due bracci, comportamenti che persistono indipendentemente dalle impostazioni di decodifica e che, come rivelato dalla modellazione computazionale, derivano da bassi tassi di apprendimento e alte temperature inverse, con implicazioni significative per le interazioni uomo-AI.

Haomiaomiao Wang, Tomás E Ward, Lili Zhang2026-03-10💻 cs

A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling

Questo studio presenta una nuova architettura multi-agente basata su OpenSeesPy che riduce le allucinazioni e gli errori accumulati nei modelli strutturali complessi, ottenendo un'accuratezza del 100% nella maggior parte dei casi di test.

Ziheng Geng, Jiachen Liu, Ran Cao, Lu Cheng, Dan M. Frangopol, Minghui Cheng2026-03-10💻 cs

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

Questo studio valuta le capacità dei modelli linguistici di grandi dimensioni (LLM) nel risolvere problemi di ottimizzazione discreta su larga scala, rivelando che le prestazioni migliori dipendono dalla forza del modello e che tecniche come il ragionamento passo-passo (CoT) non sono sempre efficaci, fornendo così linee guida e benchmark per ricerche future.

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

Il paper propone FedShift, un nuovo attacco avversario distribuito "Nascondi e Trova" per l'apprendimento federato su grafi che, attraverso l'iniezione di uno "shifter" nascosto e un'ottimizzazione successiva, raggiunge un'efficacia superiore, un'efficienza temporale migliorata di oltre il 90% e la capacità di eludere le principali difese esistenti.

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

Il paper presenta DECADE, un modello di diffusione non supervisionato e temporalmente coerente che migliora il denoising delle immagini PET cardiache dinamiche con Rb-82, preservando l'accuratezza quantitativa e la qualità delle immagini senza richiedere dati di addestramento accoppiati.

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

Il paper presenta QuadAI, un sistema per l'analisi del sentiment basato su aspetti multidimensionale che combina un encoder RoBERTa ibrido con modelli linguistici di grandi dimensioni (LLM) tramite apprendimento d'insieme, ottenendo risultati significativamente migliori rispetto ai modelli individuali.

A. J. W. de Vink, Filippos Karolos Ventirozos, Natalia Amat-Lefort, Lifeng Han2026-03-10💬 cs.CL

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

Il paper presenta ProgAgent, un agente di apprendimento per rinforzo continuo che unifica un sistema ad alte prestazioni basato su JAX con un meccanismo di ricompensa progressiva derivato da video esperti, superando il problema della dimenticanza catastrofica e ottenendo prestazioni superiori rispetto agli agenti con memoria perfetta su benchmark robotici complessi.

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Questo studio valuta i pregiudizi sociali in sette modelli linguistici di grandi dimensioni all'interno del contesto culturale nepalese, rivelando che le metriche di accordo esplicito non catturano adeguatamente i bias generativi impliciti e sottolineando la necessità di dataset culturalmente fondati per le società sottorappresentate.

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

Learning embeddings of non-linear PDEs: the Burgers' equation

Questo lavoro presenta un metodo basato su reti neurali fisicamente informate con una configurazione multi-testa e vincoli di ortogonalità per costruire spazi di embedding a bassa dimensionalità che catturano in modo robusto e interpretabile le dinamiche non lineari dell'equazione di Burgers viscosa.

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

Il paper introduce HybridStitch, un nuovo paradigma per la generazione Text-to-Image che accelera i modelli di diffusione combinando un modello piccolo per la bozza iniziale e un modello grande per il raffinamento selettivo delle regioni complesse, ottenendo un speedup di 1,83 volte su Stable Diffusion 3.

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Column Generation for the Micro-Transit Zoning Problem

Questo articolo propone un framework di generazione di colonne con euristiche di pricing per risolvere il generalizzato problema di zonizzazione del micro-transito, dimostrando sperimentalmente che tale approccio produce soluzioni di qualità superiore e scala meglio rispetto ai metodi esistenti nelle principali città statunitensi.

Hins Hu, Rishav Sen, Jose Paolo Talusan, Abhishek Dubey, Aron Laszka, Samitha Samaranayake2026-03-10🔢 math

Gradient Iterated Temporal-Difference Learning

Questo lavoro introduce il Gradient Iterated Temporal-Difference learning, un nuovo algoritmo che modifica l'apprendimento iterato calcolando i gradienti sui target mobili per creare un metodo TD basato sul gradiente che, pur risolvendo i problemi di divergenza, mantiene una velocità di apprendimento competitiva rispetto ai metodi semi-gradiente, come dimostrato su benchmark Atari.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Questo articolo propone il "Learning Visibility Framework" per affrontare l'uso improprio dell'IA nell'istruzione non come un problema di rilevamento, ma come una sfida di misurazione legata alla perdita di visibilità sul processo di apprendimento, suggerendo di passare dalla sorveglianza alla trasparenza condivisa tra studenti e docenti.

Eduardo Davalos, Yike Zhang2026-03-10💻 cs

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

Il paper presenta DistillGuard, un framework che valuta nove configurazioni difensive contro la distillazione della conoscenza da LLM proprietari, rivelando che la maggior parte delle difese a livello di output è inefficace nel compromettere le capacità del modello studente, con l'eccezione parziale della rimozione del chain-of-thought che riduce solo le prestazioni nel ragionamento matematico.

Bo Jiang2026-03-10💬 cs.CL

AI Steerability 360: A Toolkit for Steering Large Language Models

Il paper presenta AI Steerability 360, una libreria Python open-source e nativa di Hugging Face che offre un'interfaccia unificata per controllare, comporre e valutare in modo sistematico i metodi di steering dei grandi modelli linguistici attraverso quattro superfici di controllo: input, struttura, stato e output.

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

Intentional Deception as Controllable Capability in LLM Agents

Lo studio dimostra che la disinformazione intenzionale nei sistemi multi-agente LLM è una capacità controllabile che sfrutta principalmente la distrazione strategica e l'inferenza delle motivazioni, rivelando l'inefficacia delle attuali difese basate sulla verifica fattuale.

Jason Starace, Terence Soule2026-03-10💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

Il paper presenta SynPlanResearch-R1, un framework che migliora le prestazioni degli agenti di ricerca web sintetizzando traiettorie di utilizzo degli strumenti che incoraggiano un'esplorazione più profonda durante il fine-tuning supervisionato, ottenendo risultati superiori rispetto alle tecniche attuali su diversi benchmark.

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

Il paper introduce la Sleep Replay Consolidation (SRC), un approccio post-allenamento ispirato al sonno biologico che migliora la calibrazione e l'affidabilità delle reti neurali artificiali riproducendo internamente le rappresentazioni senza necessità di riaddestramento supervisionato.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

← Precedente Successivo →