cs.AI articoli | Gist.Science

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Il paper propone MSSR, un framework di replay esperienziale che stima la forza della memoria a livello di campione e pianifica la ripetizione adattiva per mitigare l'oblio catastrofico durante il fine-tuning continuo dei grandi modelli linguistici, ottenendo prestazioni superiori rispetto agli approcci esistenti.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Il paper presenta MedMASLab, un framework unificato e una piattaforma di benchmarking per sistemi multi-agente medici multimodali che affronta la frammentazione architettonica attraverso un protocollo di comunicazione standardizzato, un valutatore automatico del ragionamento clinico e un vasto benchmark su 473 malattie, rivelando al contempo una significativa fragilità delle attuali architetture nel transito tra diversi sottodomini medici.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Questo articolo presenta un approccio basato sull'intelligenza artificiale e sui dati per stimare la domanda di spettro radio, validato su cinque città canadesi, che consente ai regolatori di ottimizzare l'allocazione delle risorse e la pianificazione dinamica dello spettro.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Il paper presenta ACADiff, un framework basato su diffusione latente adattiva e consapevole dei dati clinici che sintetizza con successo le modalità di neuroimaging cerebrali mancanti (come sMRI, FDG-PET e AV45-PET) per migliorare la diagnosi dell'Alzheimer, ottenendo prestazioni superiori rispetto ai metodi esistenti anche in scenari con fino all'80% di dati mancanti.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Questo articolo presenta una metodologia basata sui dati e sull'apprendimento automatico per stimare le variazioni della domanda di spettro nello spazio e identificare i fattori chiave che la influenzano, offrendo ai regolatori approfondimenti cruciali per la gestione flessibile delle risorse nelle reti 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Il paper presenta PathMem, un framework multimodale incentrato sulla memoria che, ispirandosi al processo cognitivo dei patologi umani, integra conoscenze strutturate e dinamiche per migliorare significativamente le prestazioni dei modelli linguistici multimodali nella diagnosi e nella generazione di report di patologia computazionale.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Il paper presenta k-MTR, un framework di apprendimento rappresentazionale che bypassa la ricostruzione delle immagini per eseguire direttamente analisi cardiache multi-task (come classificazione, regressione e segmentazione) dai dati k-space sottocampionati, allineandoli a uno spazio latente semantico condiviso con le immagini complete.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Questo studio dimostra che l'astensione basata sulla confidenza nei sistemi di decisione ordinata migliora la qualità solo in presenza di incertezza strutturale, mentre fallisce sotto l'incertezza contestuale, fornendo un protocollo diagnostico per selezionare il segnale di confidenza appropriato prima del dispiegamento.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Questo studio introduce l'indicatore di sovrapposizione-sottosopraffazione (OUI) come segnale strutturale precoce per discriminare i tassi di apprendimento ottimali nell'algoritmo PPO, rivelando asimmetrie distintive tra le reti attore e critico e permettendo una selezione efficiente delle configurazioni di addestramento prima del completamento.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Il paper introduce i "neural debugger", modelli linguistici addestrati a emulare i debugger tradizionali per prevedere l'esecuzione del codice Python in modo interattivo e condizionale, aprendo la strada a sistemi di coding autonomi più avanzati.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Questo studio dimostra che, al contrario degli esseri umani, il processo di ragionamento aumenta la coerenza onesta nei modelli linguistici di grandi dimensioni, poiché lo spazio rappresentativo sottostante rende le risposte ingannevoli metastabili e più suscettibili di destabilizzazione rispetto a quelle oneste.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Il paper presenta BEACON, un metodo che supera i limiti delle tecniche di navigazione basate su immagini prevedendo mappe di affordanza in vista dall'alto (BEV) per identificare target nascosti da ostacoli, ottenendo un miglioramento significativo rispetto allo stato dell'arte grazie alla fusione di cue spaziali e modelli visione-linguaggio.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Questo studio estende l'equazione delle api per modellare come valenza ed eccitazione emotiva modulino i tassi di interazione in uno sciame, rivelando come la contagione emotiva e i punti di svolta strutturali influenzino la velocità e l'esito dei processi decisionali collettivi.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Questo studio presenta un assistente guidato da un modello linguistico di grandi dimensioni per rendere la realtà virtuale accessibile a persone non vedenti o ipovedenti, rivelando attraverso un test con 16 partecipanti che la percezione dell'assistente evolve da strumento a compagno sociale a seconda del contesto, fornendo così raccomandazioni progettuali per il futuro.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Questo paper introduce il modello Bag-of-Words Superposition (BOWS) per dimostrare che, nei dati reali, le correlazioni tra le caratteristiche permettono agli interferenze nella sovrapposizione di essere costruttive anziché solo rumorose, generando così strutture semantiche e cicliche che spiegano meglio il comportamento dei modelli linguistici reali rispetto alle teorie basate su caratteristiche non correlate.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Questo articolo presenta due approcci di rilevamento dei punti di cambiamento basati su reti neurali e apprendimento online, caratterizzati da complessità computazionale lineare e prestazioni superiori rispetto agli algoritmi esistenti su dati sintetici e reali, con una dimostrazione teorica della loro convergenza verso soluzioni ottimali.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

Questo articolo offre una panoramica completa sull'Automated Reinforcement Learning (AutoRL), esaminando la letteratura esistente, le recenti tecniche basate sui grandi modelli linguistici, le potenziali integrazioni future e le sfide aperte nel campo dell'automazione della modellazione, della selezione degli algoritmi e dell'ottimizzazione degli iperparametri per l'apprendimento per rinforzo.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

Questo lavoro propone un modello di classificazione basato su sottosequenze e consapevole dell'incertezza dei dati, che combina prestazioni elevate con l'interpretabilità per l'analisi delle serie temporali astronomiche, offrendo agli esperti di dominio la possibilità di ispezionare le previsioni e ispirare nuovi sviluppi nella modellazione astrofisica.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

A Survey of Large Language Models

Questa rassegna esamina i recenti progressi dei grandi modelli linguistici (LLM), analizzando il loro background, le tecniche principali e le applicazioni in quattro aree chiave: pre-addestramento, adattamento, utilizzo e valutazione delle capacità, oltre a fornire risorse e discutere le sfide future.

Wayne Xin Zhao, Kun Zhou, Junyi Li + 19 more2026-03-10💬 cs.CL

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Questa rassegna esamina l'applicazione della teoria dell'utilità alla modellazione cognitiva nella robotica, analizzando l'evoluzione dai sistemi basati sul comportamento alle architetture cognitive e ai sistemi di valore, con particolare attenzione al processo decisionale, all'apprendimento e all'interazione in ambienti multi-agente e uomo-robot, proponendo infine nuove direzioni di ricerca e problemi aperti.

Qin Yang2026-03-10💻 cs

← Precedente Successivo →