cs articoli | Gist.Science

Quantal Response Equilibrium as a Measure of Strategic Sophistication: Theory and Validation for LLM Evaluation

Questo lavoro introduce un framework di valutazione basato sull'equilibrio di risposta quantale (QRE) per misurare la sofisticazione strategica dei modelli linguistici su una scala continua calibrata rispetto ai dati umani, superando i limiti delle metriche aggregate tradizionali attraverso la derivazione teorica di equilibri chiusi e la validazione empirica su oltre 1.800 giochi.

Mateo Pechon-Elkins, Jon Chun2026-03-12💻 cs

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Il paper presenta Tureis, un metodo auto-supervisionato basato su Transformer che rileva e localizza con precisione i guasti dei sensori in ambienti domestici intelligenti complessi, offrendo un'implementazione efficiente ed edge-friendly senza richiedere dati etichettati.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Questo studio valuta la capacità di generalizzazione di agenti di attacco informatico autonomi di fronte a cambiamenti imprevisti negli indirizzi IP, rivelando che, sebbene gli agenti basati su LLM ottenano i migliori risultati di adattamento, lo fanno a scapito di costi computazionali elevati, ridotta trasparenza e nuove vulnerabilità operative.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Il paper presenta OmniGuide, un framework universale che migliora le prestazioni dei modelli generalisti robotici (VLA) su compiti complessi integrando diverse fonti di guida come modelli fondazionali 3D e VLM semantici tramite funzioni di energia differenziabili che influenzano l'azione del robot.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub

Il paper presenta OAuthHub, un framework di sviluppo che utilizza i dispositivi personali degli utenti come intermediari per mitigare l'eccessivo accesso ai dati OAuth, consentendo un controllo granulare delle autorizzazioni e riducendo significativamente il tempo e il codice necessari per gli sviluppatori.

Qiyu Li, Yuhe Tian, Haojian Jin2026-03-12💻 cs

Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception

Questo lavoro presenta una pipeline computazionale basata sui dati che ottimizza in modo congiunto e senza modelli la disposizione dei sensori flessibili e i parametri di una rete neurale, migliorando significativamente l'accuratezza della previsione delle deformazioni in robotica soft e dispositivi indossabili rispettando al contempo i vincoli di fabbricabilità.

Yingjun Tian, Guoxin Fang, Aoran Lyu, Xilong Wang, Zikang Shi, Yuhu Guo, Weiming Wang, Charlie C. L. Wang2026-03-12💻 cs

Decision-Aware Uncertainty Evaluation of Vision-Language Model-Based Early Action Anticipation for Human-Robot Interaction

Questo lavoro presenta la prima valutazione sistematica dell'incertezza nei modelli visione-linguaggio per l'anticipazione delle azioni umane in contesti di interazione uomo-robot, introducendo nuovi protocolli e metriche per garantire previsioni affidabili e sicure anche in presenza di osservazioni parziali e ambigue.

Zhaoda Du, Michael Bowman, Qiaojie Zheng, Xiaoli Zhang2026-03-12💻 cs

Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research

Il paper presenta FLA³, una piattaforma di apprendimento federato che integra meccanismi di autenticazione, autorizzazione e contabilità (AAA) conformi a XACML per garantire la sovranità dei dati e la conformità normativa, dimostrando attraverso studi reali e simulati che tale approccio governativo permette di ottenere prestazioni predittive paragonabili all'addestramento centralizzato nel contesto della ricerca sanitaria globale.

Fan Zhang, Daniel Kreuter, Javier Fernandez-Marques, BloodCounts Consortium, Gregory Verghese, Bernard Butler, Nicholas Lane, Suthesh Sivapalaratnam, Joseph Taylor, Norbert C. J. de Wit, Nicholas S. Gleadall, Carola-Bibiane Schönlieb, Michael Roberts2026-03-12💻 cs

Categorical Calculus and Algebra for Multi-Model Data

Questo articolo propone un fondamento teorico per l'interrogazione di database categoriali, introducendo il calcolo e l'algebra categoriali come estensioni dei rispettivi formalismi relazionali, dimostrandone l'equivalenza e analizzando le regole di ottimizzazione, l'espressività e la complessità computazionale.

Jiaheng Lu (University of Helsinki)2026-03-12💻 cs

Pooling Engram Conditional Memory in Large Language Models using CXL

Questo articolo propone l'utilizzo di un pool di memoria CXL per archiviare la memoria engramma condizionale nei grandi modelli linguistici, integrandolo in SGLang per ottenere prestazioni end-to-end vicine a quelle della DRAM e offrire una soluzione di storage scalabile ed economica senza compromettere l'inferenza.

Ruiyang Ma, Teng Ma, Zhiyuan Su, Hantian Zha, Xinpeng Zhao, Xuchun Shang, Xingrui Yi, Zheng Liu, Zhu Cao, An Wu, Zhichong Dou, Ziqian Liu, Daikang Kuang, Guojie Luo2026-03-12💻 cs

Detecting Privilege Escalation with Temporal Braid Groups

Il paper propone l'uso dell'esponente di Lyapunov di Burau come sonda algebrica all'interno dei componenti fortemente connessi di un grafo temporale dei permessi cloud per discriminare tra regimi di rischio dispersi e focalizzati, dimostrando che tale approccio non abeliano supera i limiti delle statistiche tradizionali per l'automazione della classificazione e della remediation.

Christophe Parisel2026-03-12💻 cs

4DEquine: Disentangling Motion and Appearance for 4D Equine Reconstruction from Monocular Video

Il paper presenta 4DEquine, un nuovo framework che disaccoppia il movimento dall'aspetto per ricostruire in 4D cavalli da video monoculare, introducendo dataset sintetici e reti neurali specializzate che raggiungono prestazioni all'avanguardia su dati reali pur essendo addestrate esclusivamente su dati sintetici.

Jin Lyu, Liang An, Pujin Cheng, Yebin Liu, Xiaoying Tang2026-03-12💻 cs

HG-Lane: High-Fidelity Generation of Lane Scenes under Adverse Weather and Lighting Conditions without Re-annotation

Il paper presenta HG-Lane, un framework di generazione ad alta fedeltà che crea scenari di rilevamento delle corsie in condizioni meteorologiche e di illuminazione avverse senza necessità di nuova annotazione, migliorando significativamente le prestazioni dei modelli esistenti e fornendo un nuovo benchmark di 30.000 immagini.

Daichao Zhao, Qiupu Chen, Feng He, Xin Ning, Qiankun Li2026-03-12💻 cs

Performance Evaluation of Delay Tolerant Network Protocols to Improve Nepal Earthquake Rescue Communications

Questo studio valuta le prestazioni di protocolli di rete tolleranti ai ritardi (DTN) in uno scenario simulato del terremoto di Kathmandu, dimostrando l'efficacia delle comunicazioni distribuite per migliorare la trasmissione dei messaggi di soccorso e identificando i compromessi tra affidabilità e utilizzo delle risorse.

Xiaofei Liu, Milena Radenkovic2026-03-12💻 cs

Cross-Hand Latent Representation for Vision-Language-Action Models

Il paper introduce XL-VLA, un framework visione-linguaggio-azione che utilizza uno spazio latente unificato e invariante all'effettivo per abilitare un apprendimento scalabile e cross-embodiment per la manipolazione dattile, superando le limitazioni dei modelli basati su spazi articolari grezzi.

Guangqi Jiang, Yutong Liang, Jianglong Ye, Jia-Yang Huang, Changwei Jing, Rocky Duan, Pieter Abbeel, Xiaolong Wang, Xueyan Zou2026-03-12💻 cs

Dance2Hesitate: A Multi-Modal Dataset of Dancer-Taught Hesitancy for Understandable Robot Motion

Il paper introduce "Dance2Hesitate", un dataset open-source multi-modale generato da ballerini e robot Franka Emika Panda che cattura movimenti esitanti a diversi livelli di intensità per migliorare la comprensione e la sicurezza nelle collaborazioni uomo-robot.

Srikrishna Bangalore Raghu, Anna Soukhovei, Divya Sai Sindhuja Vankineni, Alexandra Bacula, Alessandro Roncone2026-03-12💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

Utilizzando il dataset OpenRobotRehab 1.0, questo studio analizza le differenze comportamentali neuromotorie tra utenti sani e post-ictus durante compiti isometrici a 6 gradi di libertà su un robot a effetto terminale, dimostrando che le specifiche del compito influenzano il comportamento, che le caratteristiche patologiche sono rilevabili nei dati di forza e che un modello nascosto di Markov basato su segnali sEMG classifica più efficacemente le dinamiche neuromotorie rispetto alle decomposizioni basate sulla sinergia, fornendo così indicazioni cruciali per la progettazione di interfacce robotiche riabilitative adattive.

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. Hallock2026-03-12💻 cs

Autonomous Search for Sparsely Distributed Visual Phenomena through Environmental Context Modeling

Questo studio propone un metodo per veicoli subacquei autonomi che utilizza l'ambiente visivo circostante, rilevato tramite embedding DINOv2, per guidare la ricerca efficiente di specie coralline rare, permettendo di campionare fino al 75% degli obiettivi in metà del tempo necessario per una copertura esaustiva.

Eric Chen, Travis Manderson, Nare Karapetyan, Peter Edmunds, Nicholas Roy, Yogesh Girdhar2026-03-12💻 cs

K-Join: Combining Vertex Covers for Parallel Joins

Il paper presenta K-Join, un nuovo algoritmo semplice per l'elaborazione di join in ambienti di calcolo parallelo massivo che, combinando partizionamento dei dati e il primitivo HyperCube attraverso una scelta innovativa delle quote basata su coperture dei vertici, raggiunge un carico di lavoro ottimale pari a $n/p^{1/\kappa}$ , dove $\kappa$ è una nuova misura teorica chiamata "reduced quasi vertex-cover".

Simon Frisk, Austen Fan, Paraschos Koutris2026-03-12💻 cs

Fully Symbolic Analysis of Loop Locality: Using Imaginary Reuse to Infer Real Performance

Questo articolo presenta una teoria completamente simbolica per l'analisi della località dei cicli che deriva polinomi di prestazioni della cache con un'accuratezza del 99,6%, permettendo previsioni di movimenti di dati in meno di un millisecondo dopo un'analisi di circa 41 secondi.

Yifan Zhu, Yekai Pan, Chen Ding, Yanghui Wu2026-03-12💻 cs

← Precedente Successivo →