cs.AI articoli | Gist.Science

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Questo articolo presenta HR-GAT, un modello di rete neurale a attenzione gerarchica basato su grafi che utilizza dati geospaziali per prevedere la domanda di spettro radio, dimostrando una precisione superiore del 21% rispetto ad altri modelli in cinque città canadesi.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Questo articolo presenta il framework DAPL, che facilita l'apprendimento di politiche dinamiche consapevoli per abilitare la destrezza estrinseca in scenari affollati, superando i metodi esistenti grazie a una modellazione esplicita delle dinamiche indotte dal contatto e ottenendo risultati superiori sia in simulazione che nel mondo reale.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Il paper propone un nuovo approccio per l'apprendimento continuo basato sulla "Local Classifier Alignment" (LCA), una funzione di perdita che allinea i classificatori specifici per compito al backbone adattato, mitigando il fenomeno della catastrofica dimenticanza e ottenendo prestazioni superiori rispetto agli stati dell'arte su diversi benchmark.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Questo paper propone un framework innovativo che tratta i prompt come azioni parametrizzate per influenzare il comportamento e la dinamica delle conversazioni tra agenti basati su LLM senza necessità di addestramento, offrendo un approccio leggero e efficace per la simulazione sociale.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Il paper propone MSSR, un framework di replay esperienziale che stima la forza della memoria a livello di campione e pianifica la ripetizione adattiva per mitigare l'oblio catastrofico durante il fine-tuning continuo dei grandi modelli linguistici, ottenendo prestazioni superiori rispetto agli approcci esistenti.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Il paper presenta MedMASLab, un framework unificato e una piattaforma di benchmarking per sistemi multi-agente medici multimodali che affronta la frammentazione architettonica attraverso un protocollo di comunicazione standardizzato, un valutatore automatico del ragionamento clinico e un vasto benchmark su 473 malattie, rivelando al contempo una significativa fragilità delle attuali architetture nel transito tra diversi sottodomini medici.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Questo articolo presenta un approccio basato sull'intelligenza artificiale e sui dati per stimare la domanda di spettro radio, validato su cinque città canadesi, che consente ai regolatori di ottimizzare l'allocazione delle risorse e la pianificazione dinamica dello spettro.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Il paper presenta ACADiff, un framework basato su diffusione latente adattiva e consapevole dei dati clinici che sintetizza con successo le modalità di neuroimaging cerebrali mancanti (come sMRI, FDG-PET e AV45-PET) per migliorare la diagnosi dell'Alzheimer, ottenendo prestazioni superiori rispetto ai metodi esistenti anche in scenari con fino all'80% di dati mancanti.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Questo articolo presenta una metodologia basata sui dati e sull'apprendimento automatico per stimare le variazioni della domanda di spettro nello spazio e identificare i fattori chiave che la influenzano, offrendo ai regolatori approfondimenti cruciali per la gestione flessibile delle risorse nelle reti 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Il paper presenta PathMem, un framework multimodale incentrato sulla memoria che, ispirandosi al processo cognitivo dei patologi umani, integra conoscenze strutturate e dinamiche per migliorare significativamente le prestazioni dei modelli linguistici multimodali nella diagnosi e nella generazione di report di patologia computazionale.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Il paper presenta k-MTR, un framework di apprendimento rappresentazionale che bypassa la ricostruzione delle immagini per eseguire direttamente analisi cardiache multi-task (come classificazione, regressione e segmentazione) dai dati k-space sottocampionati, allineandoli a uno spazio latente semantico condiviso con le immagini complete.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Questo studio dimostra che l'astensione basata sulla confidenza nei sistemi di decisione ordinata migliora la qualità solo in presenza di incertezza strutturale, mentre fallisce sotto l'incertezza contestuale, fornendo un protocollo diagnostico per selezionare il segnale di confidenza appropriato prima del dispiegamento.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Questo studio introduce l'indicatore di sovrapposizione-sottosopraffazione (OUI) come segnale strutturale precoce per discriminare i tassi di apprendimento ottimali nell'algoritmo PPO, rivelando asimmetrie distintive tra le reti attore e critico e permettendo una selezione efficiente delle configurazioni di addestramento prima del completamento.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Il paper introduce i "neural debugger", modelli linguistici addestrati a emulare i debugger tradizionali per prevedere l'esecuzione del codice Python in modo interattivo e condizionale, aprendo la strada a sistemi di coding autonomi più avanzati.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Questo studio dimostra che, al contrario degli esseri umani, il processo di ragionamento aumenta la coerenza onesta nei modelli linguistici di grandi dimensioni, poiché lo spazio rappresentativo sottostante rende le risposte ingannevoli metastabili e più suscettibili di destabilizzazione rispetto a quelle oneste.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Il paper presenta BEACON, un metodo che supera i limiti delle tecniche di navigazione basate su immagini prevedendo mappe di affordanza in vista dall'alto (BEV) per identificare target nascosti da ostacoli, ottenendo un miglioramento significativo rispetto allo stato dell'arte grazie alla fusione di cue spaziali e modelli visione-linguaggio.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Questo studio estende l'equazione delle api per modellare come valenza ed eccitazione emotiva modulino i tassi di interazione in uno sciame, rivelando come la contagione emotiva e i punti di svolta strutturali influenzino la velocità e l'esito dei processi decisionali collettivi.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Questo studio presenta un assistente guidato da un modello linguistico di grandi dimensioni per rendere la realtà virtuale accessibile a persone non vedenti o ipovedenti, rivelando attraverso un test con 16 partecipanti che la percezione dell'assistente evolve da strumento a compagno sociale a seconda del contesto, fornendo così raccomandazioni progettuali per il futuro.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Questo paper introduce il modello Bag-of-Words Superposition (BOWS) per dimostrare che, nei dati reali, le correlazioni tra le caratteristiche permettono agli interferenze nella sovrapposizione di essere costruttive anziché solo rumorose, generando così strutture semantiche e cicliche che spiegano meglio il comportamento dei modelli linguistici reali rispetto alle teorie basate su caratteristiche non correlate.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Questo articolo presenta due approcci di rilevamento dei punti di cambiamento basati su reti neurali e apprendimento online, caratterizzati da complessità computazionale lineare e prestazioni superiori rispetto agli algoritmi esistenti su dati sintetici e reali, con una dimostrazione teorica della loro convergenza verso soluzioni ottimali.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

← Precedente Successivo →