cs.AI articoli | Gist.Science

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Il paper introduce CanvasMAR, un modello autoregressivo per la previsione video che migliora la qualità e la coerenza della generazione con pochi passi di campionamento, integrando un "canvas" come prior globale strutturato, un curriculum di campionamento da facile a difficile basato sul movimento e una guida classificatore composita.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Just-In-Time Objectives: A General Approach for Specialized AI Interactions

Questo paper introduce un approccio chiamato "obiettivi just-in-time" che infere e ottimizza in tempo reale le intenzioni dell'utente per trasformare i modelli linguistici generici in strumenti specializzati di alta qualità, superando significativamente le prestazioni dei chatbot LLM standard.

Michelle S. Lam, Omar Shaikh, Hallie Xu, Alice Guo, Diyi Yang, Jeffrey Heer, James A. Landay, Michael S. Bernstein2026-03-09🤖 cs.AI

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views

Il paper presenta 3DThinker, un framework innovativo che permette ai modelli visione-linguaggio di effettuare un ragionamento spaziale tridimensionale basato sull'immaginazione geometrica partendo da viste limitate, senza richiedere dati 3D espliciti o input 3D preliminari.

Zhangquan Chen, Manyuan Zhang, Xinlei Yu, Xufang Luo, Mingze Sun, Zihao Pan, Xiang An, Yan Feng, Peng Pei, Xunliang Cai, Ruqi Huang2026-03-09🤖 cs.AI

Automated Coding of Communication Data Using ChatGPT: Consistency Across Subgroups

Lo studio dimostra che l'uso di ChatGPT per codificare dati comunicativi su larga scala garantisce una coerenza nelle prestazioni tra diversi sottogruppi demografici (genere ed etnia) paragonabile a quella dei valutatori umani, rendendo la tecnologia affidabile per valutazioni su vasta scala.

Jiangang Hao, Wenju Cui, Patrick Kyllonen, Emily Kerzabi2026-03-09🤖 cs.AI

Shoot First, Ask Questions Later? Building Rational Agents that Explore and Act Like People

Questo articolo presenta il compito di dialogo "Collaborative Battleship" e strategie di inferenza Monte Carlo ispirate alla progettazione sperimentale bayesiana per migliorare le capacità di agenti linguistici nell'esplorazione strategica e nel processo decisionale sotto incertezza, permettendo loro di superare sia i giocatori umani che i modelli all'avanguardia in compiti come Battleship e Guess Who?.

Gabriel Grand, Valerio Pepe, Jacob Andreas, Joshua B. Tenenbaum2026-03-09🤖 cs.AI

REx86: A Local Large Language Model for Assisting in x86 Assembly Reverse Engineering

Il paper presenta REx86, un modello linguistico locale open-weight basato su Qwen2.5-Coder-7B e ottimizzato tramite fine-tuning su un dataset specifico, che dimostra di migliorare significativamente l'efficienza e l'accuratezza nel reverse engineering di codice assembly x86, offrendo un'alternativa sicura e performante rispetto ai modelli cloud chiusi.

Darrin Lea, James Ghawaly, Golden Richard + 2 more2026-03-09🤖 cs.AI

LA-MARRVEL: A Knowledge-Grounded, Language-Aware LLM Framework for Clinically Robust Rare Disease Gene Prioritization

Il paper presenta LA-MARRVEL, un framework basato su LLM che integra conoscenze cliniche e consapevolezza linguistica per migliorare significativamente la priorità dei geni nelle malattie rare, offrendo spiegazioni tracciabili e allineate alle linee guida ACMG senza alterare i flussi di lavoro diagnostici esistenti.

Jaeyeon Lee, Lin Yao, Hyun-Hwan Jeong, Zhandong Liu2026-03-09🤖 cs.AI

The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

Questo studio introduce un quadro di valutazione basato sulla metrica CRT per analizzare come i modelli di diffusione gestiscano l'iconicità multimodale, distinguendo tra il riconoscimento dei riferimenti culturali e la loro realizzazione visiva, e rivelando che tale comportamento dipende da fattori quali la frequenza dei dati, l'unicità testuale e la popolarità del riferimento.

Maria-Teresa De Rosa Palmini, Eva Cetinic2026-03-09🤖 cs.AI

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Il paper propone SQDF, un metodo di fine-tuning per modelli di diffusione che utilizza un gradiente di politica reparametrizzato basato su una stima della funzione Soft Q per allineare i modelli agli obiettivi di reward senza compromettere la diversità e la naturalità dei campioni generati.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Questo articolo presenta XR-DT, un framework di Gemello Digitale potenziato dalla Realtà Estesa che integra un modello di controllo predittivo HA-MPPI e un sistema di previsione delle traiettorie umane basato su Transformer per garantire una pianificazione sicura ed efficiente della navigazione robotica in ambienti condivisi con esseri umani.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Questo lavoro propone un metodo basato sulla divergenza $\alpha$ per allineare i modelli linguistici a una distribuzione target ottenuta filtrando le risposte errate, permettendo di controllare esplicitamente il compromesso tra precisione e diversità e superando gli approcci precedenti nel benchmark di dimostrazione di teoremi Lean.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

Questo lavoro propone un metodo basato su nuvole di punti che sfrutta le proprietà spaziotemporali dei flussi di eventi, integrando moduli di convoluzione temporale e rappresentazione potenziata dei bordi per migliorare l'efficienza e l'accuratezza della stima della posa umana rispetto alle tecniche tradizionali.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

Il paper introduce A-3PO, un metodo che accelera l'addestramento asincrono dei LLM sostituendo il calcolo esplicito della politica prossimale con un'approssimazione tramite interpolazione, ottenendo un speedup di 1,8 volte senza compromettere le prestazioni.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Questo articolo propone una nuova metrica di sensibilità globale basata sulle curve di aspettativa condizionata individuale (ICE) per superare i limiti dei Partial Dependence Plots nell'analisi delle interazioni tra variabili nei modelli di apprendimento automatico applicati al design ingegneristico, dimostrando la sua superiorità attraverso prove matematiche e valutazioni comparative su casi di studio aerospaziali.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Il paper introduce Hyper++, un nuovo agente di reinforcement learning iperbolico che risolve le sfide di ottimizzazione attraverso regolarizzazione delle feature, una funzione di perdita categorica e un'architettura di rete ottimizzata, garantendo così una stabilità di apprendimento superiore e prestazioni migliori rispetto ai metodi esistenti su benchmark come ProcGen e Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Questo studio introduce il rischio di privacy nell'orchestrazione degli strumenti (TOP-R), un nuovo pericolo in cui gli agenti autonomi sintetizzano informazioni sensibili da frammenti non sensibili, presentando un framework formale, un benchmark (TOP-Bench) e strategie di mitigazione che migliorano significativamente il compromesso tra utilità e sicurezza.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

CASA: Cross-Attention over Self-Attention for Efficient Vision-Language Fusion

Il paper CASA reinvestiga l'efficacia dell'attenzione incrociata per la fusione visione-linguaggio, dimostrando che, sebbene spesso sottostimata, questa architettura raggiunge prestazioni competitive rispetto all'inserimento diretto dei token offrendo al contempo vantaggi significativi in termini di efficienza computazionale e memoria per applicazioni video in tempo reale.

Moritz Böhle, Amélie Royer, Juliette Marrie, Edouard Grave, Patrick Pérez2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

Il paper presenta CARE, un framework di post-training multimodale che trasforma gli errori in segnali di supervisione attraverso un obiettivo contrastivo ancorato e un campionamento guidato dalla riflessione, migliorando significativamente l'accuratezza e la stabilità dell'addestramento rispetto ai metodi esistenti.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Il paper presenta LLMTM, un benchmark completo per valutare e ottimizzare le prestazioni dei modelli linguistici nell'analisi dei motivi temporali nei grafi dinamici, proponendo un agente potenziato da strumenti e un dispatcher intelligente che bilancia accuratezza e costi computazionali.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

Il paper introduce WBC, un nuovo metodo di attacco per l'inferenza di appartenenza che supera i limiti delle tecniche globali analizzando segnali localizzati tramite finestre scorrevoli, dimostrando così una maggiore efficacia nel rilevare i dati di addestramento memorizzati nei modelli linguistici su larga scala.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui Li2026-03-09🤖 cs.AI

← Precedente Successivo →