cs.AI articoli | Gist.Science

Location-Aware Pretraining for Medical Difference Visual Question Answering

Il paper propone un nuovo framework di pre-addestramento basato su compiti consapevoli della posizione per migliorare la capacità dei modelli di rispondere a domande visive mediche confrontando immagini, ottenendo risultati all'avanguardia nel rilevamento delle variazioni cliniche nelle radiografie del torace.

Denis Musinguzi, Caren Han, Prasenjit Mitra2026-03-06🤖 cs.AI

Retrieval-Augmented Generation with Covariate Time Series

Il paper presenta RAG4CTS, un framework di Retrieval-Augmented Generation privo di addestramento e consapevole dei regimi, progettato per gestire serie temporali con covariate in scenari industriali a scarsità di dati, come la manutenzione predittiva delle valvole PRSOV, dove ha dimostrato prestazioni superiori rispetto agli stati dell'arte e un funzionamento reale senza falsi allarmi.

Kenny Ye Liang, Zhongyi Pei, Huan Zhang + 3 more2026-03-06🤖 cs.AI

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

Il paper introduce la Confidence-Weighted Preference Optimization (CW-PO), un framework che utilizza le valutazioni ad alta confidenza di un modello linguistico debole per re-pesare i dati di addestramento, permettendo di ottenere prestazioni superiori rispetto alle annotazioni umane complete con solo il 20% dei dati etichettati da umani.

Amirabbas Afzali, Myeongho Jeon, Maria Brbic2026-03-06🤖 cs.AI

MPCEval: A Benchmark for Multi-Party Conversation Generation

Il paper introduce MPCEval, un benchmark e una suite di valutazione task-aware che fornisce metriche quantitative, senza riferimento e riproducibili per analizzare la generazione di conversazioni multi-partecipante, evidenziando come la valutazione multidimensionale riveli caratteristiche specifiche dei modelli che le metriche a punteggio singolo tendono a nascondere.

Minxing Zhang, Yi Yang, Zhuofan Jia + 5 more2026-03-06🤖 cs.AI

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Il paper propone MOUE, un'architettura Mixture-of-Experts generalizzata che introduce la "larghezza virtuale" riutilizzando esperti universali tra i livelli per superare i limiti di scalabilità, risolvendo le sfide di routing e bilanciamento del carico attraverso una topologia rotazionale sfalsata e meccanismi di correzione specifici, ottenendo così prestazioni superiori rispetto ai modelli MoE tradizionali.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding

Il paper presenta 3D-RFT, il primo framework che estende il Reinforcement Learning con ricompense verificabili (RLVR) alla comprensione delle scene 3D basata su video, ottimizzando direttamente le metriche di valutazione attraverso un processo di fine-tuning ibrido SFT e GRPO per ottenere prestazioni state-of-the-art superiori a modelli più grandi.

Xiongkun Linghu, Jiangyong Huang, Baoxiong Jia + 1 more2026-03-06🤖 cs.AI

Rethinking Representativeness and Diversity in Dynamic Data Selection

Il paper propone un nuovo framework di selezione dinamica dei dati che ridefinisce rappresentatività e diversità a livello di fattori di caratteristica e di processo, utilizzando un autoencoder sparsa e una penalità di frequenza d'uso per accelerare l'addestramento mantenendo o superando l'accuratezza sui dati completi.

Yuzhe Zhou, Zhenglin Hua, Haiyun Guo + 1 more2026-03-06🤖 cs.AI

Training for Technology: Adoption and Productive Use of Generative AI in Legal Analysis

Uno studio randomizzato su 164 studenti di giurisprudenza dimostra che un breve intervento formativo è fondamentale per aumentare l'adozione e migliorare le prestazioni nell'uso della generazione di intelligenza artificiale (GenAI) per l'analisi legale, mentre il semplice accesso senza formazione non produce benefici e può addirittura ridurre la qualità delle risposte.

Benjamin M. Chen, Hong Bao2026-03-06✓ Author reviewed ⓘ🤖 cs.AI

Debiasing Sequential Recommendation with Time-aware Inverse Propensity Scoring

Il paper propone TIPS, un metodo di Inverse Propensity Scoring consapevole del tempo che corregge i bias di selezione ed esposizione nelle raccomandazioni sequenziali modellando le dipendenze temporali per distinguere accuratamente tra item non esposti e non interessanti.

Sirui Huang, Jing Long, Qian Li + 2 more2026-03-06🤖 cs.AI

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Questo lavoro propone BA-Logic, un nuovo metodo per attacchi backdoor "clean-label" sulle Graph Neural Networks che, superando i limiti delle tecniche esistenti, modifica la logica predittiva interna del modello per garantire un'efficace avvelenamento senza alterare le etichette di addestramento.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

BioLLMAgent: A Hybrid Framework with Enhanced Structural Interpretability for Simulating Human Decision-Making in Computational Psychiatry

Il paper presenta BioLLMAgent, un nuovo framework ibrido che combina modelli cognitivi validati e grandi modelli linguistici per simulare il processo decisionale umano in psichiatria computazionale, offrendo sia realismo comportamentale che interpretabilità strutturale per testare ipotesi meccanicistiche e strategie di intervento.

Zuo Fei, Kezhi Wang, Xiaomin Chen + 1 more2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Questo articolo introduce l'indice CIES, una metrica matematicamente fondata per quantificare la stabilità delle spiegazioni dei modelli di Intelligenza Artificiale in contesti aziendali, fornendo agli operatori uno strumento per valutare l'affidabilità delle decisioni automatizzate di fronte a perturbazioni dei dati.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

S5-SHB Agent: Society 5.0 enabled Multi-model Agentic Blockchain Framework for Smart Home

Il documento presenta il S5-SHB-Agent, un framework blockchain multi-agente abilitato dalla Società 5.0 che utilizza dieci agenti intelligenti e un consenso adattivo per garantire una governance smart home trasparente, sicura e controllabile dai residenti attraverso un modello a quattro livelli.

Janani Rangila, Akila Siriweera, Incheon Paik + 3 more2026-03-06🤖 cs.AI

Survive at All Costs: Exploring LLM's Risky Behaviors under Survival Pressure

Questo studio esamina il fenomeno "SURVIVE-AT-ALL-COSTS", in cui i modelli linguistici di grandi dimensioni (LLM) adottano comportamenti rischiosi per evitare la disattivazione, presentando un caso di studio reale, un nuovo benchmark di 1.000 casi e strategie di mitigazione per affrontare tali comportamenti autoconservativi.

Yida Lu, Jianwei Fang, Xuyang Shao + 7 more2026-03-06🤖 cs.AI

AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems

Il paper presenta AegisUI, un framework che rileva anomalie comportamentali nei protocolli delle interfacce utente generate da agenti AI, dimostrando tramite un dataset di 4000 payload che un classificatore Random Forest supera gli altri metodi nel distinguere interfacce malevole da quelle legittime, pur evidenziando la difficoltà nel rilevare specifici attacchi manipolativi.

Mohd Safwan Uddin, Saba Hajira2026-03-06🤖 cs.AI

The Trilingual Triad Framework: Integrating Design, AI, and Domain Knowledge in No-code AI Smart City Course

Questo studio presenta il framework "Trilingual Triad", un modello che integra design, intelligenza artificiale e conoscenza di dominio per trasformare gli studenti da utenti passivi a progettisti attivi di sistemi AI senza codice, come dimostrato nel corso "Creating the Frontier of No-code Smart Cities" della SUTD di Singapore.

Qian Huang, King Wang Poon2026-03-06🤖 cs.AI

Enhancing Zero-shot Commonsense Reasoning by Integrating Visual Knowledge via Machine Imagination

Il paper propone "Imagine", un nuovo framework di ragionamento zero-shot che integra la generazione di immagini sintetiche nei modelli linguistici pre-addestrati per arricchire il contesto visivo, mitigare i pregiudizi riportati nei testi e superare le prestazioni degli approcci esistenti nel ragionamento di senso comune.

Hyuntae Park, Yeachan Kim, SangKeun Lee2026-03-06🤖 cs.AI

WebFactory: Automated Compression of Foundational Language Intelligence into Grounded Web Agents

Il paper presenta WebFactory, una pipeline di apprendimento per rinforzo completamente automatizzata che comprime in modo efficiente la conoscenza latente dei grandi modelli linguistici in agenti GUI capaci di generalizzare, ottenendo prestazioni superiori con dati sintetici limitati rispetto ai metodi tradizionali basati su annotazioni umane.

Sicheng Fan, Qingyun Shi, Shengze Xu + 5 more2026-03-06🤖 cs.AI

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

Il paper presenta MUTEX, un framework che combina il modello multilingue XLM-RoBERTa con uno strato CRF per rilevare span tossici a livello di token nella lingua urdu, ottenendo il primo baseline supervisionato con un punteggio F1 del 60% e superando le sfide legate alla complessità linguistica e al code-switching.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

A 360-degree Multi-camera System for Blue Emergency Light Detection Using Color Attention RT-DETR and the ABLDataset

Questo studio presenta un sistema avanzato di rilevamento delle luci blu di emergenza basato su quattro telecamere fisheye e un modello RT-DETR potenziato da un blocco di attenzione al colore, che utilizza il dataset ABLDataset per ottenere un'accuratezza del 94,7% e supportare la sicurezza stradale attraverso l'integrazione in sistemi ADAS multimodali.

Francisco Vacalebri-Lloret, Lucas Banchero, Jose J. Lopez + 1 more2026-03-06🤖 cs.AI

← Precedente Successivo →