cs.AI articoli | Gist.Science

VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility

Il paper presenta VisiFold, un nuovo framework che utilizza un grafo temporale ripiegato e un meccanismo di visibilità dei nodi per superare le limitazioni computazionali e migliorare l'accuratezza nella previsione del traffico a lungo termine.

Zhiwei Zhang, Xinyi Du, Weihao Wang, Xuanchi Guo, Wenjuan Han2026-03-13🤖 cs.AI

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

Questo studio propone un sistema di rilevamento automatico dei tumori ovarici basato su diverse architetture di reti neurali convoluzionali, identificando il modello InceptionV3 come il più performante con un'accuratezza del 94% e integrando tecniche di Intelligenza Artificiale Spiegabile (XAI) per rendere trasparenti le decisioni del modello.

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

Hybrid Human-Agent Social Dilemmas in Energy Markets

Questo studio dimostra che l'introduzione di agenti artificiali nei mercati energetici ibridi favorisce la coordinazione e migliora i risultati collettivi, anche durante le fasi di adozione parziale, sebbene ciò possa generare asimmetrie strategiche a vantaggio dei non-adopter.

Isuri Perera, Frits de Nijs, Julian Garcia2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

Il paper identifica e quantifica una vulnerabilità strutturale negli agenti LLM ad alto privilegio, denominata "Trusted Executor Dilemma", che permette la fuoriuscita di dati privati tramite l'esecuzione acritica di istruzioni malevole nascoste nella documentazione, rivelando un persistente divario tra la conformità funzionale e la sicurezza che le attuali difese non riescono a mitigare.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

Il paper introduce CreativeBench, un benchmark quantitativo per valutare la creatività delle macchine nella generazione di codice attraverso metriche di qualità e novità, e propone EvoRePE, una strategia di guida durante l'inferenza che migliora le capacità creative dei modelli sfruttando pattern di ricerca evolutiva.

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

Social, Legal, Ethical, Empathetic and Cultural Norm Operationalisation for AI Agents

Questo articolo propone un quadro sistematico per l'operazionalizzazione delle norme sociali, legali, etiche, empatiche e culturali (SLEEC) negli agenti AI, colmando il divario tra principi astratti e requisiti concreti verificabili per garantire un allineamento dimostrabile ai valori umani.

Radu Calinescu, Ana Cavalcanti, Marsha Chechik, Lina Marsso, Beverley Townsend2026-03-13🤖 cs.AI

ELISA: An Interpretable Hybrid Generative AI Agent for Expression-Grounded Discovery in Single-Cell Genomics

Il paper introduce ELISA, un agente ibrido di intelligenza artificiale interpretabile che unisce embedding di espressione scRNA-seq e modelli linguistici per trasformare direttamente i dati trascrittomici in ipotesi biologiche meccanicistiche, superando le prestazioni degli strumenti esistenti nella ricerca di tipi cellulari e nella generazione di scoperte biologiche fondate.

Omar Coser2026-03-13🧬 q-bio

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

Il paper presenta AdaFuse, un framework che accelera l'inferenza degli adattatori dinamici nei LLM combinando una strategia di pre-gating a livello di token con l'ottimizzazione di kernel CUDA fusi, riducendo la latenza di decodifica di oltre 2,4 volte mantenendo la precisione.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection

Il paper introduce "Mirror", un pattern di progettazione basato su una rigorosa geometria dei dati che, utilizzando un corpus curato e un classificatore lineare leggero, supera le prestazioni dei grandi modelli neurali nel rilevamento delle iniezioni di prompt, offrendo una soluzione più rapida, deterministica e auditabile per il primo livello di difesa.

J Alex Corll2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

Il rapporto descrive la creazione di Bielik-Minitron-7B, un modello linguistico compresso di 7,35 miliardi di parametri ottimizzato per le lingue europee, che combina potatura strutturata e distillazione della conoscenza per ridurre i parametri del 33,4% mantenendo il 90% delle prestazioni originali e aumentando la velocità di inferenza fino al 50%.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

Il paper propone "Think While Watching", un framework di ragionamento video in streaming che, ancorando la memoria a livello di segmento e permettendo la percezione e la generazione simultanee, supera i limiti dei modelli esistenti nel ragionamento multi-turno su flussi video continui, ottenendo risultati superiori su benchmark specifici con una riduzione significativa dei token di output.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

Il paper propone EnTransformer, un framework di previsione generativa basato su Transformer che integra l'engression per apprendere distribuzioni condizionali multivariate senza assunzioni parametriche, ottenendo previsioni probabilistiche ben calibrate e superiori rispetto ai modelli esistenti su diversi benchmark.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

Questo studio rivela che i principali modelli linguistici, inclusi i più recenti, spesso falliscono nel rifiutare contenuti dannosi forniti dagli utenti anche durante l'esecuzione di compiti apparentemente innocui, evidenziando una vulnerabilità etica a livello di contenuto che richiede nuove misure di sicurezza.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

Il paper introduce MobileKernelBench, un framework di valutazione che rivela le attuali limitazioni degli LLM nella generazione di kernel efficienti per dispositivi mobili, e propone MoKA, un agente multi-LLM che supera tali ostacoli raggiungendo un tasso di compilazione del 93,7% e significativi miglioramenti delle prestazioni.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG

Fair Learning for Bias Mitigation and Quality Optimization in Paper Recommendation

Il paper presenta Fair-PaperRec, un modello basato su MLP che riduce le disparità demografiche nelle decisioni di accettazione dei paper mantenendo elevati standard di qualità, come dimostrato dai risultati su dati di conferenze SIGCHI, DIS e IUI che mostrano un aumento della partecipazione dei gruppi sottorappresentati e un miglioramento dell'utilità complessiva.

Uttamasha Anjally Oyshi, Susan Gauch2026-03-13🤖 cs.AI

Prototype-Based Knowledge Guidance for Fine-Grained Structured Radiology Reporting

Il paper presenta ProtoSR, un approccio che migliora la generazione di referti radiologici strutturati e dettagliati integrando conoscenze estratte da report testuali liberi tramite un sistema di prototipi multimodali, ottenendo risultati all'avanguardia sul benchmark Rad-ReStruct.

Chantal Pellegrini, Adrian Delchev, Ege Özsoy, Nassir Navab, Matthias Keicher2026-03-13🤖 cs.AI

Effective Resistance Rewiring: A Simple Topological Correction for Over-Squashing

Il paper introduce Effective Resistance Rewiring (ERR), una strategia semplice e priva di parametri per correggere la topologia dei grafi e mitigare il problema dell'over-squashing nelle Graph Neural Networks, utilizzando la resistenza efficace come segnale globale per ottimizzare il flusso di informazioni e bilanciare il compromesso tra connettività e oversmoothing.

Bertran Miquel-Oliver, Manel Gil-Sorribes, Victor Guallar, Alexis Molina2026-03-13🤖 cs.LG

Geometry-Aware Probabilistic Circuits via Voronoi Tessellations

Questo lavoro propone l'integrazione di tassellazioni di Voronoi nei circuiti probabilistici per catturare la geometria locale dei dati, risolvendo le sfide di tracciabilità attraverso un framework di inferenza approssimata con limiti garantiti e una condizione strutturale per l'inferenza esatta, abilitando infine l'apprendimento tramite rilassamento differenziabile.

Sahil Sidheekh, Sriraam Natarajan2026-03-13🤖 cs.LG

Delayed Backdoor Attacks: Exploring the Temporal Dimension as a New Attack Surface in Pre-Trained Models

Questo lavoro introduce gli Attacchi Backdoor Ritardati (DBA), una nuova minaccia per i modelli pre-addestrati che sfrutta la dimensione temporale per attivare comportamenti malevoli in modo differito tramite trigger banali, dimostrando la fattibilità di tale approccio attraverso il prototipo DND che supera le difese esistenti mantenendo alta l'accuratezza.

Zikang Ding, Haomiao Yang, Meng Hao, Wenbo Jiang, Kunlan Xiang, Runmeng Du, Yijing Liu, Ruichen Zhang, Dusit Niyato2026-03-13🤖 cs.AI

Learning Transferable Sensor Models via Language-Informed Pretraining

Il paper presenta SLIP, un framework open-source di preaddestramento che allinea i dati dei sensori con il linguaggio naturale per apprendere rappresentazioni trasferibili, consentendo un'adattabilità flessibile a diverse configurazioni di sensori e ottenendo prestazioni superiori in compiti di trasferimento zero-shot, descrizione e risposta a domande.

Yuliang Chen, Arvind Pillai, Yu Yvonne Wu, Tess Z. Griffin, Lisa Marsch, Michael V. Heinz, Nicholas C. Jacobson, Andrew Campbell2026-03-13🤖 cs.AI

← Precedente Successivo →