cs.AI articoli | Gist.Science

Reasoned Safety Alignment: Ensuring Jailbreak Defense via Answer-Then-Check

Il paper introduce "Answer-Then-Check", un nuovo approccio di allineamento alla sicurezza che addestra i modelli linguistici a generare una risposta interna e valutarne la sicurezza prima di rispondere all'utente, migliorando così la robustezza contro gli attacchi jailbreak e riducendo i falsi rifiuti senza compromettere le capacità di ragionamento generale.

Chentao Cao, Xiaojun Xu, Bo Han, Hang Li2026-03-09🤖 cs.AI

Better Late Than Never: Meta-Evaluation of Latency Metrics for Simultaneous Speech-to-Text Translation

Questo lavoro presenta la prima meta-valutazione completa delle metriche di latenza per la traduzione simultanea voce-testo, introducendo le nuove metriche YAAL e LongYAAL e lo strumento SoftSegmenter per superare i bias esistenti e fornire valutazioni più accurate sia per contenuti brevi che lunghi.

Peter Polák, Sara Papi, Luisa Bentivogli, Ondřej Bojar2026-03-09🤖 cs.AI

LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference

Il paper introduce LikePhys, un metodo senza addestramento che valuta la comprensione della fisica intuitiva nei modelli di diffusione video misurando la preferenza di verosimiglianza su un benchmark curato, dimostrando che tale capacità migliora con la scalabilità del modello nonostante le attuali difficoltà con dinamiche complesse.

Jianhao Yuan, Fabio Pizzati, Francesco Pinto, Lars Kunze, Ivan Laptev, Paul Newman, Philip Torr, Daniele De Martini2026-03-09🤖 cs.AI

Phys2Real: Fusing VLM Priors with Interactive Online Adaptation for Uncertainty-Aware Sim-to-Real Manipulation

Il paper presenta Phys2Real, un approccio che fonde le stime dei parametri fisici derivate da modelli visione-linguaggio con l'adattamento online basato sull'incertezza per migliorare il trasferimento sim-to-real nelle operazioni di manipolazione robotica.

Maggie Wang, Stephen Tian, Aiden Swann, Ola Shorinwa, Jiajun Wu, Mac Schwager2026-03-09🤖 cs.AI

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Il paper introduce CanvasMAR, un modello autoregressivo per la previsione video che migliora la qualità e la coerenza della generazione con pochi passi di campionamento, integrando un "canvas" come prior globale strutturato, un curriculum di campionamento da facile a difficile basato sul movimento e una guida classificatore composita.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Just-In-Time Objectives: A General Approach for Specialized AI Interactions

Questo paper introduce un approccio chiamato "obiettivi just-in-time" che infere e ottimizza in tempo reale le intenzioni dell'utente per trasformare i modelli linguistici generici in strumenti specializzati di alta qualità, superando significativamente le prestazioni dei chatbot LLM standard.

Michelle S. Lam, Omar Shaikh, Hallie Xu, Alice Guo, Diyi Yang, Jeffrey Heer, James A. Landay, Michael S. Bernstein2026-03-09🤖 cs.AI

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views

Il paper presenta 3DThinker, un framework innovativo che permette ai modelli visione-linguaggio di effettuare un ragionamento spaziale tridimensionale basato sull'immaginazione geometrica partendo da viste limitate, senza richiedere dati 3D espliciti o input 3D preliminari.

Zhangquan Chen, Manyuan Zhang, Xinlei Yu, Xufang Luo, Mingze Sun, Zihao Pan, Xiang An, Yan Feng, Peng Pei, Xunliang Cai, Ruqi Huang2026-03-09🤖 cs.AI

Automated Coding of Communication Data Using ChatGPT: Consistency Across Subgroups

Lo studio dimostra che l'uso di ChatGPT per codificare dati comunicativi su larga scala garantisce una coerenza nelle prestazioni tra diversi sottogruppi demografici (genere ed etnia) paragonabile a quella dei valutatori umani, rendendo la tecnologia affidabile per valutazioni su vasta scala.

Jiangang Hao, Wenju Cui, Patrick Kyllonen, Emily Kerzabi2026-03-09🤖 cs.AI

Shoot First, Ask Questions Later? Building Rational Agents that Explore and Act Like People

Questo articolo presenta il compito di dialogo "Collaborative Battleship" e strategie di inferenza Monte Carlo ispirate alla progettazione sperimentale bayesiana per migliorare le capacità di agenti linguistici nell'esplorazione strategica e nel processo decisionale sotto incertezza, permettendo loro di superare sia i giocatori umani che i modelli all'avanguardia in compiti come Battleship e Guess Who?.

Gabriel Grand, Valerio Pepe, Jacob Andreas, Joshua B. Tenenbaum2026-03-09🤖 cs.AI

REx86: A Local Large Language Model for Assisting in x86 Assembly Reverse Engineering

Il paper presenta REx86, un modello linguistico locale open-weight basato su Qwen2.5-Coder-7B e ottimizzato tramite fine-tuning su un dataset specifico, che dimostra di migliorare significativamente l'efficienza e l'accuratezza nel reverse engineering di codice assembly x86, offrendo un'alternativa sicura e performante rispetto ai modelli cloud chiusi.

Darrin Lea, James Ghawaly, Golden Richard + 2 more2026-03-09🤖 cs.AI

LA-MARRVEL: A Knowledge-Grounded, Language-Aware LLM Framework for Clinically Robust Rare Disease Gene Prioritization

Il paper presenta LA-MARRVEL, un framework basato su LLM che integra conoscenze cliniche e consapevolezza linguistica per migliorare significativamente la priorità dei geni nelle malattie rare, offrendo spiegazioni tracciabili e allineate alle linee guida ACMG senza alterare i flussi di lavoro diagnostici esistenti.

Jaeyeon Lee, Lin Yao, Hyun-Hwan Jeong, Zhandong Liu2026-03-09🤖 cs.AI

The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

Questo studio introduce un quadro di valutazione basato sulla metrica CRT per analizzare come i modelli di diffusione gestiscano l'iconicità multimodale, distinguendo tra il riconoscimento dei riferimenti culturali e la loro realizzazione visiva, e rivelando che tale comportamento dipende da fattori quali la frequenza dei dati, l'unicità testuale e la popolarità del riferimento.

Maria-Teresa De Rosa Palmini, Eva Cetinic2026-03-09🤖 cs.AI

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Il paper propone SQDF, un metodo di fine-tuning per modelli di diffusione che utilizza un gradiente di politica reparametrizzato basato su una stima della funzione Soft Q per allineare i modelli agli obiettivi di reward senza compromettere la diversità e la naturalità dei campioni generati.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

XR-DT: Extended Reality-Enhanced Digital Twin for Safe Motion Planning via Human-Aware Model Predictive Path Integral Control

Questo articolo presenta XR-DT, un framework di Gemello Digitale potenziato dalla Realtà Estesa che integra un modello di controllo predittivo HA-MPPI e un sistema di previsione delle traiettorie umane basato su Transformer per garantire una pianificazione sicura ed efficiente della navigazione robotica in ambienti condivisi con esseri umani.

Tianyi Wang, Jiseop Byeon, Ahmad Yehia, Yiming Xu, Jihyung Park, Tianyi Zeng, Sikai Chen, Ziran Wang, Junfeng Jiao, Christian Claudel2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Questo lavoro propone un metodo basato sulla divergenza $\alpha$ per allineare i modelli linguistici a una distribuzione target ottenuta filtrando le risposte errate, permettendo di controllare esplicitamente il compromesso tra precisione e diversità e superando gli approcci precedenti nel benchmark di dimostrazione di teoremi Lean.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

Questo lavoro propone un metodo basato su nuvole di punti che sfrutta le proprietà spaziotemporali dei flussi di eventi, integrando moduli di convoluzione temporale e rappresentazione potenziata dei bordi per migliorare l'efficienza e l'accuratezza della stima della posa umana rispetto alle tecniche tradizionali.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

Il paper introduce A-3PO, un metodo che accelera l'addestramento asincrono dei LLM sostituendo il calcolo esplicito della politica prossimale con un'approssimazione tramite interpolazione, ottenendo un speedup di 1,8 volte senza compromettere le prestazioni.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Questo articolo propone una nuova metrica di sensibilità globale basata sulle curve di aspettativa condizionata individuale (ICE) per superare i limiti dei Partial Dependence Plots nell'analisi delle interazioni tra variabili nei modelli di apprendimento automatico applicati al design ingegneristico, dimostrando la sua superiorità attraverso prove matematiche e valutazioni comparative su casi di studio aerospaziali.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Il paper introduce Hyper++, un nuovo agente di reinforcement learning iperbolico che risolve le sfide di ottimizzazione attraverso regolarizzazione delle feature, una funzione di perdita categorica e un'architettura di rete ottimizzata, garantendo così una stabilità di apprendimento superiore e prestazioni migliori rispetto ai metodi esistenti su benchmark come ProcGen e Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Questo studio introduce il rischio di privacy nell'orchestrazione degli strumenti (TOP-R), un nuovo pericolo in cui gli agenti autonomi sintetizzano informazioni sensibili da frammenti non sensibili, presentando un framework formale, un benchmark (TOP-Bench) e strategie di mitigazione che migliorano significativamente il compromesso tra utilità e sicurezza.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

← Precedente Successivo →