cs articoli | Gist.Science

Serving Compound Inference Systems on Datacenter GPUs

Il paper presenta JigsawServe, un nuovo framework di servizio che ottimizza congiuntamente latenza, accuratezza e costi delle risorse GPU per sistemi di inferenza composti, aumentando la domanda servibile fino a 11,3 volte rispetto alle soluzioni precedenti attraverso la selezione adattiva dei modelli e la partizione spaziale fine delle GPU.

Sriram Devata, Rahul Singh, Sarita Adve2026-03-11💻 cs

Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM

Il paper presenta Granulon, un nuovo modello MLLM basato su DINOv3 che integra un controller di granularità testuale e un modulo di aggregazione adattiva per unificare il ragionamento visivo a più livelli di dettaglio, migliorando significativamente l'accuratezza e riducendo le allucinazioni.

Junyuan Mao, Qiankun Li, Linghao Meng, Zhicheng He, Xinliang Zhou, Kun Wang, Yang Liu, Yueming Jin2026-03-11💻 cs

Time warping with Hellinger elasticity

Il documento presenta l'algoritmo Elastic Time Warping, che risolve il problema di allineamento di serie temporali in spazi metrici arbitrari utilizzando una penalità basata sul kernel di Hellinger con una complessità computazionale cubica.

Yuly Billig2026-03-11💻 cs

Where, What, Why: Toward Explainable 3D-GS Watermarking

Il paper presenta un framework nativo per la rappresentazione che implementa una filigrana robusta e impercettibile per il 3D Gaussian Splatting, garantendo un eccellente compromesso tra qualità visiva e resilienza ai disturbi grazie a moduli intelligenti per la selezione dei portatori e all'uso di decoupled finetuning per fornire spiegazioni auditabili.

Mingshu Cai, Jiajun Li, Osamu Yoshie, Yuya Ieiri, Yixuan Li2026-03-11💻 cs

Age-Related Differences in the Perception of Eye-Gaze from a Social Robot

Questo studio esamina come le differenze legate all'età influenzino la percezione dello sguardo deittico da parte di anziani e giovani nell'interazione con robot sociali, al fine di guidare la progettazione di segnali non verbali adattivi.

Lucas Morillo-Mendez, Martien G. S. Schrooten, Oscar Martinez Mozos2026-03-11💻 cs

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model

Il paper presenta VisionCreator-R1, un agente nativo per la generazione visiva potenziato da meccanismi di riflessione e addestrato tramite un metodo di ottimizzazione congiunta (RPCO) che risolve l'asimmetria nell'apprendimento per rinforzo tra pianificazione e riflessione, superando le prestazioni di Gemini2.5Pro su benchmark per la generazione di immagini singole e multiple.

Jinxiang Lai, Wenzhe Zhao, Zexin Lu, Hualei Zhang, Qinyu Yang, Rongwei Quan, Zhimin Li, Shuai Shao, Song Guo, Qinglin Lu2026-03-11💻 cs

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Questo lavoro presenta HMR-1, un sistema robotico di massaggio gerarchico basato su modelli linguistici visivi che, grazie al nuovo dataset multimodale MedMassage-12K, identifica con precisione i punti di agopuntura e pianifica traiettorie di controllo per applicazioni pratiche nella riabilitazione fisica.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng Zhang2026-03-11💻 cs

Clarifying the Compass: A Reflexive Narrative on Entry Barriers into HCI and Aging Research

Questo saggio riflette sulle barriere all'ingresso nella ricerca interdisciplinare tra HCI e invecchiamento, esplorando il divario tra le esigenze degli anziani e la progettazione tecnologica attraverso le esperienze personali di due ricercatori che hanno sviluppato empatia volontando in una comunità residenziale per anziani.

Tianyi Li, Jin Wei-Kocsis2026-03-11💻 cs

Impact of Different Failures on a Robot's Perceived Reliability

Uno studio controllato dimostra che, in un'interazione uomo-robot, i fallimenti dovuti a errori di scelta sono percepiti come meno dannosi per l'affidabilità rispetto a scivolamenti o blocchi, e che la fiducia può essere ripristinata semplicemente attraverso esecuzioni di successo successive, senza necessità di riparazioni sociali esplicite.

Andrew Violette, Zhanxin Wu, Haruki Nishimura, Masha Itkina, Leticia Priebe Rocha, Mark Zolotas, Guy Hoffman, Hadas Kress-Gazit2026-03-11💻 cs

d-QBF with Few Existential Variables Revisited

Questo lavoro chiude il divario sulla complessità parametrizzata del QBF con poche variabili esistenziali dimostrando che la dipendenza doppiamente esponenziale è ottimale sotto l'ETH per formule CNF generali, mentre per il caso limitato a due blocchi quantificatori ( $\forall\exists$ ) viene proposto un algoritmo quasi ottimale con complessità significativamente ridotta.

Andreas Grigorjew, Michael Lampis2026-03-11💻 cs

Computer Vision-Based Vehicle Allotment System using Perspective Mapping

Questa ricerca presenta un sistema intelligente di assegnazione dei parcheggi basato sulla visione artificiale e sul modello YOLOv8, che utilizza la mappatura prospettica inversa per integrare viste multiple e simulare un ambiente 3D al fine di ottimizzare l'efficienza e la sostenibilità nei contesti urbani.

Prachi Nandi, Sonakshi Satapathy, Suchismita Chinara2026-03-11💻 cs

HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings

Il paper presenta HeteroFedSyn, il primo framework di sintesi di dati tabulari con privacy differenziale progettato per ambienti federati orizzontali eterogenei, che supera le limitazioni delle metodologie esistenti mediante innovazioni nella selezione distribuita dei margini per garantire un'utilità paragonabile a quella dei sistemi centralizzati.

Xiaochen Li, Fengyu Gao, Xizixiang Wei, Tianhao Wang, Cong Shen, Jing Yang2026-03-11💻 cs

NaviNote: Enabling In-situ Spatial Annotation Authoring to Support Exploration and Navigation for Blind and Low Vision People

Il paper presenta NaviNote, un sistema che combina localizzazione visiva ad alta precisione e un'architettura agentica per consentire a persone con disabilità visiva di creare annotazioni spaziali in situ e migliorare la navigazione in ambienti sconosciuti.

Ruijia Chen, Yuheng Wu, Charlie Houseago, Filipe Gaspar, Filippo Aleotti, Dorian Gálvez-López, Oliver Johnston, Diego Mazala, Guillermo Garcia-Hernando, Maryam Bandukda, Gabriel Brostow, Jessica Van Brummelen2026-03-11💻 cs

Investigating the Effects of LLM Use on Critical Thinking Under Time Constraints: Access Timing and Time Availability

Lo studio dimostra che l'impatto dell'uso dei modelli linguistici di grandi dimensioni (LLM) sul pensiero critico dipende dal contesto temporale: l'accesso immediato agli LLM migliora le prestazioni sotto pressione temporale ma le riduce quando il tempo è sufficiente, mentre l'accesso ritardato o nullo mostra l'effetto opposto.

Jiayin Zhi, Harsh Kumar, Mina Lee2026-03-11💻 cs

HECTOR: Hybrid Editable Compositional Object References for Video Generation

HECTOR è un nuovo pipeline generativo che supera i limiti dei modelli attuali consentendo un controllo compositivo fine-granularità sui video attraverso un'ibridazione di riferimenti statici e dinamici, permettendo agli utenti di definire esplicitamente le traiettorie, la posizione, la scala e la velocità di ciascun elemento per garantire coerenza spaziotemporale e alta fedeltà visiva.

Guofeng Zhang, Angtian Wang, Jacob Zhiyuan Fang, Liming Jiang, Haotian Yang, Alan Yuille, Chongyang Ma2026-03-11💻 cs

DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination

Il documento presenta deZent, un'implementazione decentralizzata di z-anonimato che utilizza strutture di conteggio stocastico e somme sicure per garantire la privacy nei dati dei sensori riducendo al contempo la fiducia necessaria in un'entità centrale e l'overhead di comunicazione.

Carolin Brunn, Florian Tschorsch2026-03-11💻 cs

Adaptive SINDy: Residual Force System Identification Based UAV Disturbance Rejection

Il documento propone un metodo innovativo che integra l'identificazione del sistema basata sui dati SINDy con un controllo adattivo RLS per migliorare il rifiuto delle perturbazioni del vento e la precisione nel tracciamento di traiettorie complesse di droni UAV in ambienti turbolenti, superando le prestazioni dei controllori PID e INDI tradizionali.

Fawad Mehboob, Amir Atef Habel, Roohan Ahmed Khan, Mikhail Derevianchenko, Clement Fortin, Dzmitry Tsetserukou2026-03-11💻 cs

OptBench: An Interactive Workbench for AI/ML-SQL Co-Optimization[Extended Demonstration Proposal]

Il paper presenta OptBench, un ambiente di lavoro interattivo basato su DuckDB che consente a ricercatori e professionisti di costruire, confrontare e visualizzare in modo trasparente e standardizzato ottimizzatori di query per carichi di lavoro ibridi SQL e AI/ML.

Jaykumar Tandel, Douglas Oscarson, Jia Zou2026-03-11💻 cs

Touching Emotions, Smelling Shapes: Exploring Tactile, Olfactory and Emotional Cross-sensory Correspondences in Preschool Aged Children

Questo studio esamina le corrispondenze incrociate tra olfatto, tatto ed emozioni in 26 bambini in età prescolare, rivelando associazioni sistematiche che offrono indicazioni empiriche per la progettazione di tecnologie educative e affettive adeguate a questa fascia d'età.

Tegan Roberts-Morgan, Min S. Li, Priscilla Lo, Zhuzhi Fan, Dan Bennett, Oussama Metatla2026-03-11💻 cs

Computing $L_\infty$ Hausdorff Distances Under Translations: The Interplay of Dimensionality, Symmetry and Discreteness

Questo lavoro analizza la complessità computazionale fine della distanza di Hausdorff $L_\infty$ tra insiemi di punti sotto traslazioni, rivelando come dimensione, simmetria (distanza diretta vs. indistinta) e discrezione (continuo vs. discreto) influenzino in modo intricato i limiti superiori e inferiori del tempo di esecuzione, fornendo nuovi algoritmi quasi-lineari e dimostrando la durezza condizionale per diverse varianti del problema.

Sebastian Angrick, Kevin Buchin, Geri Gokaj, Marvin Künnemann2026-03-11💻 cs

← Precedente Successivo →

cs