cs.AI articoli | Gist.Science

Think Before You Lie: How Reasoning Improves Honesty

Questo studio dimostra che, al contrario degli esseri umani, il processo di ragionamento aumenta la coerenza onesta nei modelli linguistici di grandi dimensioni, poiché lo spazio rappresentativo sottostante rende le risposte ingannevoli metastabili e più suscettibili di destabilizzazione rispetto a quelle oneste.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Il paper presenta BEACON, un metodo che supera i limiti delle tecniche di navigazione basate su immagini prevedendo mappe di affordanza in vista dall'alto (BEV) per identificare target nascosti da ostacoli, ottenendo un miglioramento significativo rispetto allo stato dell'arte grazie alla fusione di cue spaziali e modelli visione-linguaggio.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Questo studio estende l'equazione delle api per modellare come valenza ed eccitazione emotiva modulino i tassi di interazione in uno sciame, rivelando come la contagione emotiva e i punti di svolta strutturali influenzino la velocità e l'esito dei processi decisionali collettivi.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Questo studio presenta un assistente guidato da un modello linguistico di grandi dimensioni per rendere la realtà virtuale accessibile a persone non vedenti o ipovedenti, rivelando attraverso un test con 16 partecipanti che la percezione dell'assistente evolve da strumento a compagno sociale a seconda del contesto, fornendo così raccomandazioni progettuali per il futuro.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Questo paper introduce il modello Bag-of-Words Superposition (BOWS) per dimostrare che, nei dati reali, le correlazioni tra le caratteristiche permettono agli interferenze nella sovrapposizione di essere costruttive anziché solo rumorose, generando così strutture semantiche e cicliche che spiegano meglio il comportamento dei modelli linguistici reali rispetto alle teorie basate su caratteristiche non correlate.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Online Neural Networks for Change-Point Detection

Questo articolo presenta due approcci di rilevamento dei punti di cambiamento basati su reti neurali e apprendimento online, caratterizzati da complessità computazionale lineare e prestazioni superiori rispetto agli algoritmi esistenti su dati sintetici e reali, con una dimostrazione teorica della loro convergenza verso soluzioni ottimali.

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Automated Reinforcement Learning: An Overview

Questo articolo offre una panoramica completa sull'Automated Reinforcement Learning (AutoRL), esaminando la letteratura esistente, le recenti tecniche basate sui grandi modelli linguistici, le potenziali integrazioni future e le sfide aperte nel campo dell'automazione della modellazione, della selezione degli algoritmi e dell'ottimizzazione degli iperparametri per l'apprendimento per rinforzo.

Reza Refaei Afshar, Joaquin Vanschoren, Uzay Kaymak, Rui Zhang, Yaoxin Wu, Wen Song, Yingqian Zhang2026-03-10🤖 cs.LG

Explainable classification of astronomical uncertain time series

Questo lavoro propone un modello di classificazione basato su sottosequenze e consapevole dell'incertezza dei dati, che combina prestazioni elevate con l'interpretabilità per l'analisi delle serie temporali astronomiche, offrendo agli esperti di dominio la possibilità di ispezionare le previsioni e ispirare nuovi sviluppi nella modellazione astrofisica.

Michael Franklin Mbouopda (LIMOS, UCA), Emille E. O. Ishida (LIMOS, UCA), Engelbert Mephu Nguifo (LIMOS, UCA), Emmanuel Gangler (LPC, UCA)2026-03-10🔭 astro-ph

A Survey of Large Language Models

Questa rassegna esamina i recenti progressi dei grandi modelli linguistici (LLM), analizzando il loro background, le tecniche principali e le applicazioni in quattro aree chiave: pre-addestramento, adattamento, utilizzo e valutazione delle capacità, oltre a fornire risorse e discutere le sfide future.

Wayne Xin Zhao, Kun Zhou, Junyi Li + 19 more2026-03-10💬 cs.CL

Utility Theory based Cognitive Modeling in the Application of Robotics: A Survey

Questa rassegna esamina l'applicazione della teoria dell'utilità alla modellazione cognitiva nella robotica, analizzando l'evoluzione dai sistemi basati sul comportamento alle architetture cognitive e ai sistemi di valore, con particolare attenzione al processo decisionale, all'apprendimento e all'interazione in ambienti multi-agente e uomo-robot, proponendo infine nuove direzioni di ricerca e problemi aperti.

Qin Yang2026-03-10💻 cs

Online Dispatching and Routing for Automated Guided Vehicles in Pickup and Delivery Systems on Loop-Based Graphs

Il paper propone un algoritmo basato su loop per la pianificazione e il routing online senza conflitti di veicoli guidati automatici (AGV) in grafi a loop, dimostrando sperimentalmente che esso supera o eguaglia le prestazioni di metodi esatti ed euristiche in termini di qualità della soluzione e tempo di calcolo.

Louis Stubbe, Jens Goemaere, Jan Goedgebeur2026-03-10💻 cs

Agent-OM: Leveraging LLM Agents for Ontology Matching

Il paper introduce Agent-OM, un nuovo framework basato su agenti LLM che utilizza due agenti siamesi e strumenti specifici per il matching di ontologie, dimostrando prestazioni competitive su compiti semplici e significativamente superiori su compiti complessi e few-shot rispetto agli stati dell'arte attuali.

Zhangcheng Qiang, Weiqing Wang, Kerry Taylor2026-03-10💬 cs.CL

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Questo articolo offre una panoramica incentrata sull'apprendimento automatico del Computerized Adaptive Testing (CAT), esaminando come le tecniche di ML possano ottimizzare i modelli di misurazione, la selezione delle domande e il controllo dei test per creare sistemi più robusti, equi ed efficienti rispetto ai metodi psicometrici tradizionali.

Yan Zhuang, Qi Liu, Haoyang Bi, Zhenya Huang, Weizhe Huang, Jiatong Li, Junhao Yu, Zirui Liu, Zirui Hu, Yuting Hong, Zachary A. Pardos, Haiping Ma, Mengxiao Zhu, Shijin Wang, Enhong Chen2026-03-10🤖 cs.LG

Fast Explanations via Policy Gradient-Optimized Explainer

Il documento presenta FEX, un nuovo framework che utilizza l'ottimizzazione del gradiente della politica per generare spiegazioni basate su attribuzioni in tempo reale, riducendo drasticamente i tempi di inferenza e l'uso di memoria rispetto ai metodi tradizionali senza comprometterne la qualità o l'applicabilità.

Deng Pan, Nuno Moniz, Nitesh Chawla2026-03-10🤖 cs.LG

Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks

Questo paper identifica e modella teoricamente la fase di "corruzione" durante il fine-tuning few-shot dei modelli di diffusione, proponendo l'integrazione di reti neurali bayesiane per mitigare tale fenomeno e migliorare la fedeltà, la qualità e la diversità delle immagini generate senza costi aggiuntivi di inferenza.

Xiaoyu Wu, Jiaru Zhang, Yang Hua, Bohan Lyu, Hao Wang, Tao Song, Haibing Guan2026-03-10🤖 cs.LG

LAMBDA: A Large Model Based Data Agent

LAMBDA è un sistema open-source e privo di codice basato su modelli linguistici di grandi dimensioni che utilizza agenti multipli (programmatore e ispettore) e un'interfaccia utente per facilitare l'analisi dei dati attraverso l'integrazione tra intelligenza umana e artificiale.

Maojun Sun, Ruijian Han, Binyan Jiang + 4 more2026-03-10🤖 cs.AI

OTAD: An Optimal Transport-Induced Robust Model for Agnostic Adversarial Attack

Il paper presenta OTAD, un nuovo modello di difesa avversaria basato sul trasporto ottimo che combina l'addestramento su dati reali con l'interpolazione tramite problemi di integrazione convessa per garantire continuità di Lipschitz locale, offrendo così robustezza certificata e alta espressività su diverse architetture di deep learning.

Kuo Gai, Sicong Wang, Shihua Zhang2026-03-10🤖 cs.LG

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Questo lavoro propone un metodo di apprendimento variazionale per i Modelli a Variabili Latenti con Processi Gaussiani che utilizza il campionamento per importanza annealato stocastico per superare le limitazioni degli approcci esistenti in spazi ad alta dimensionalità, ottenendo legami variazionali più stretti e una convergenza più robusta.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Questo articolo presenta il MLVAS, un sistema multimodale che combina analisi video e audio per estrarre segmenti clinici rilevanti e generare metriche oggettive al fine di assistere nella diagnosi della paralisi delle corde vocali.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Questo articolo esplora come l'intelligenza artificiale trasformi il testing del software automatizzando la generazione e la validazione dei casi di test, migliorando così efficienza, copertura e affidabilità delle release, pur affrontando le sfide legate alla qualità dei dati e alla necessità di un equilibrio tra automazione e supervisione umana.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

← Precedente Successivo →