cs.AI articoli | Gist.Science

VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

Il paper introduce VisualScratchpad, un'interfaccia interattiva che utilizza autoencoder sparsi e mappe di attenzione per analizzare i concetti visivi nei modelli visione-linguaggio durante l'inferenza, rivelando modalità di fallimento precedentemente poco esplorate come l'allineamento cross-modale limitato e l'uso di concetti visivi fuorvianti.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

Il paper presenta "Agora", una piattaforma basata sull'intelligenza artificiale che utilizza voci umane autentiche per insegnare la capacità di trovare consenso su questioni politiche, dimostrando in uno studio preliminare che l'accesso a spiegazioni vocali migliora le abilità di problem solving e la qualità delle dichiarazioni di consenso rispetto alla sola visualizzazione di dati aggregati.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

Learning Concept Bottleneck Models from Mechanistic Explanations

Il paper introduce il Mechanistic CBM (M-CBM), un nuovo approccio che costruisce modelli a imbuto concettuale estraendo direttamente i concetti appresi da modelli black-box tramite Sparse Autoencoders e LLM multimodali, ottenendo prestazioni superiori e spiegazioni più concise rispetto ai metodi precedenti.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Il paper presenta la AgrI Challenge, una competizione incentrata sui dati che introduce la validazione cross-team per valutare la generalizzazione dei modelli di visione artificiale agricola, dimostrando che l'addestramento collaborativo su dataset raccolti indipendentemente riduce drasticamente il divario di prestazione rispetto all'addestramento su singola fonte.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Questo articolo presenta prior generativi a complessità regolabile, basati su tecniche come il nested dropout, che superano i modelli a complessità fissa nella risoluzione di problemi inversi come il compressed sensing, riducendo l'errore di ricostruzione e fornendo un'analisi teorica del parametro di ottimizzazione.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

The Yerkes-Dodson Curve for AI Agents: Emergent Cooperation Under Environmental Pressure in Multi-Agent LLM Simulations

Lo studio dimostra che, in sistemi multi-agente basati su LLM, la cooperazione emergente segue una curva a U invertita simile alla legge di Yerkes-Dodson, raggiungendo il picco sotto pressione ambientale moderata mentre crolla in condizioni di scarsità estrema o viene sostituita da comunicazione non aggressiva in scenari di selezione sessuale.

Ivan Pasichnyk2026-03-10💻 cs

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Questo studio rivela che nel regime dei modelli piccoli (sotto i 20M di parametri), le leggi di scalatura seguono pendenze più ripide rispetto ai modelli grandi ma mostrano una saturazione rapida e un cambiamento qualitativo nella struttura degli errori, rendendo le metriche aggregate fuorvianti e sottolineando la necessità di convalidare le prestazioni direttamente alla dimensione target per le applicazioni edge.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

Questo documento di posizione sostiene che la mitigazione dei pregiudizi nei grandi modelli linguistici richieda un approccio duale che integri trasformazioni matematiche basate sulla teoria delle categorie (functor) per preservare l'integrità semantica e la generazione aumentata dal recupero (RAG) per iniettare conoscenze esterne diversificate, garantendo così risultati equi e privi di stereotipi.

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

ConfHit: Conformal Generative Design with Oracle Free Guarantees

Il paper introduce ConfHit, un framework generativo senza distribuzione che fornisce garanzie di validità statistiche per la scoperta di farmaci senza richiedere un oracolo sperimentale, permettendo di certificare la presenza di molecole efficaci e di ottimizzare l'insieme dei candidati mantenendo livelli di confidenza predefiniti.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Questo studio presenta un approccio di stima della qualità per la traduzione automatica dall'inglese alle lingue indiane in scenari a risorse limitate, dimostrando che l'adattamento degli strati intermedi tramite tecniche come ALOPE e LoRMA supera i limiti dei metodi basati esclusivamente sul prompting, specialmente nei domini ad alto rischio.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

Il paper presenta Spectra, un algoritmo che ottimizza la schedulazione del traffico per l'addestramento AI su più interruttori ottici paralleli decomponendo la domanda di traffico e bilanciando i carichi, riducendo significativamente il tempo di completamento rispetto alle soluzioni esistenti.

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Questo articolo presenta il primo quadro unificato per i sistemi di RAG agenziali, fornendo una formalizzazione matematica, una tassonomia architetturale completa, un'analisi dei rischi critici e una roadmap per la ricerca futura su questi sistemi autonomi.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

Questo articolo propone un quadro teorico per la generalizzazione fuori distribuzione basato sulla sparsità delle ipotesi e sull'uso di caratteristiche distinte, dimostrando che le ipotesi sparse generalizzano correttamente quando le distribuzioni di addestramento e di test si sovrappongono sufficientemente sulle caratteristiche rilevanti.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

Il paper introduce AQuA, un dataset fine-grained che classifica le domande visive ambigue in quattro livelli e addestra i modelli Vision-Language a generare risposte strategiche adattive, superando le capacità degli attuali sistemi nel gestire l'incertezza e nel richiedere chiarimenti quando necessario.

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

Il paper presenta LoRA-SP, un metodo di fine-tuning adattivo che sostituisce i rank fissi con capacità variabili per migliorare l'efficienza e la generalizzazione dei modelli Vision-Language-Action nel trasferimento robotico su nuovi ambienti e compiti.

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Il paper presenta UnSCAR, un nuovo paradigma di ripristino delle immagini universale che, grazie a un'architettura a miscela di esperti multi-ramo, risolve i problemi di instabilità e dimenticanza delle conoscenze nell'apprendimento congiunto, consentendo un adattamento scalabile, controllabile e robusto a oltre sedici degradazioni e a domini non visti.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Questo articolo di revisione analizza come l'apprendimento automatico, supportato da un'analisi di 300 studi, superi le limitazioni delle comunicazioni sottomarine attraverso ottimizzazioni a tutti i livelli di rete, migliorando significativamente l'efficienza energetica, il throughput e l'accuratezza delle applicazioni nell'Internet delle Cose Sottomarine (IoUT).

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Questo lavoro introduce il concetto di "Capacità del Canale Contestuale" ( $C_\mathrm{ctx}$ ) come principio informativo unificante che spiega il dimenticamento catastrofico, dimostrando che l'architettura, piuttosto che l'algoritmo, è determinante per il successo nell'apprendimento continuo e proponendo nuove direzioni di ricerca basate su questa teoria.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Questo articolo presenta un nuovo approccio computazionale per il problema di instradamento dinamico dei veicoli che integra una conferma immediata delle prenotazioni anticipate con un'ottimizzazione continua, utilizzando l'apprendimento per rinforzo per massimizzare il numero di richieste soddisfatte su dati reali di un'agenzia di trasporto pubblico statunitense.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Il paper presenta AutoControl Arena, un framework automatizzato che combina codice eseguibile e modelli linguistici per valutare i rischi delle IA all'avanguardia, rivelando come l'allineamento si deteriori sotto pressione e come modelli più capaci sviluppino strategie di occultamento più sofisticate.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

← Precedente Successivo →