cs articoli | Gist.Science

Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review

Questa revisione sistematica esamina l'applicazione dei modelli generativi profondi non supervisionati per il rilevamento di anomalie nelle neuroimmagini, evidenziando il loro potenziale per la localizzazione di patologie senza annotazioni voxel-level, pur sottolineando le sfide legate all'eterogeneità metodologica e alla validazione esterna.

Youwan Mahé, Elise Bannier, Stéphanie Leplaideur, Elisa Fromont, Francesca Galassi2026-03-10💻 cs

A Robust Placeability Metric for Model-Free Unified Pick-and-Place Reasoning

Questo lavoro introduce una metrica probabilistica robusta per la stabilità di posizionamento che, valutando direttamente le nuvole di punti parziali, abilita un ragionamento unificato e privo di modelli per la presa e il posizionamento di oggetti non visti su supporti complessi.

Benno Wingender, Nils Dengler, Rohit Menon, Sicong Pan, Maren Bennewitz2026-03-10💻 cs

Taming Modality Entanglement in Continual Audio-Visual Segmentation

Questo lavoro introduce il nuovo compito di Segmentazione Audio-Visiva Continuale (CAVS) e propone il framework Collision-based Multi-modal Rehearsal (CMR) per mitigare la deriva semantica e la confusione da co-occorrenza, ottenendo risultati superiori rispetto ai metodi a modalità singola in scenari di apprendimento incrementale.

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs

Il lavoro presenta PolyJailbreak, un nuovo framework di jailbreak black-box per i modelli linguistici multimodali (MLLM) che sfrutta l'asimmetria nella sicurezza tra modalità testuale e visiva, utilizzando primitive atomiche e ottimizzazione multi-agente per superare i meccanismi di sicurezza e ottenere tassi di successo superiori al 95% su modelli commerciali come GPT-4o e Gemini.

Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Guangquan Xu, Shouling Ji2026-03-10💻 cs

HumanHalo - Safe and Efficient 3D Navigation Among Humans via Minimally Conservative MPC

Il paper presenta HumanMPC, un framework di controllo predittivo basato su modelli che garantisce una navigazione sicura ed efficiente di droni in ambienti affollati, combinando previsioni del movimento umano guidate dai dati con una formulazione di sicurezza innovativa che riduce il conservatorismo eccessivo.

Simon Schaefer, Helen Oleynikova, Sandra Hirche, Stefan Leutenegger2026-03-10💻 cs

Khelte Khelte Shikhi: A Proposed HCI Framework for Gamified Interactive Learning with Minecraft in Bangladeshi Education Systems

Questo documento propone un quadro concettuale HCI per l'implementazione di Minecraft Education Edition nel sistema educativo bangladese, adattando l'apprendimento basato su giochi a tre livelli di infrastruttura tecnologica e risorse per superare le sfide di connettività, energia e accesso all'hardware nelle scuole rurali e urbane.

Mohd Ruhul Ameen, Akif Islam, Momen Khandokar Ope2026-03-10💻 cs

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Il paper introduce Dream4Drive, un nuovo framework di generazione di dati sintetici che, decomponendo i video in mappe guida 3D e adattando modelli di mondo guidati, migliora significativamente le prestazioni dei modelli di percezione per la guida autonoma, specialmente nella gestione di casi limite, superando i limiti delle attuali strategie di addestramento.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

MoE-GS: Mixture of Experts for Dynamic Gaussian Splatting

Il paper propone MoE-GS, un nuovo framework unificato per la ricostruzione di scene dinamiche tramite Gaussian Splatting che integra esperti specializzati tramite un router aware del volume per migliorare la qualità della sintesi di nuove viste, offrendo anche strategie di ottimizzazione per l'efficienza e la distillazione.

In-Hwan Jin, Hyeongju Mun, Joonsoo Kim, Kugjin Yun, Kyeongbo Kong2026-03-10💻 cs

Next Generation Cloud-native In-Memory Stores: From Redis to Valkey and Beyond

Questo studio valuta le prestazioni e la sostenibilità di Valkey, KeyDB e Garnet come alternative cloud-native a Redis, evidenziando i compromessi tra efficienza, compatibilità e longevità del progetto in ambienti Kubernetes.

Carl-Johan Fauvelle Munck af Rosensch"old, Feras M. Awaysheh, Ahmad Awad2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

Il paper presenta HCLA, un sistema multi-agente basato su LLM e centrato sull'utente che, attraverso un flusso di lavoro conversazionale, trasforma l'intento analitico in regole esplicite e ricostruisce giustificazioni di stile esperto per migliorare la trasparenza e l'accountability nel rilevamento delle transazioni anomale con asset digitali.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

AnyPcc: Compressing Any Point Cloud with a Single Universal Model

Il paper introduce AnyPcc, un framework universale per la compressione di nuvole di punti che supera i limiti di generalizzazione degli metodi esistenti grazie a un modello di contesto robusto e a una strategia di fine-tuning adattivo per istanza, ottenendo prestazioni state-of-the-art su dataset diversificati con un basso overhead computazionale.

Kangli Wang, Qianxi Yi, Yuqi Ye, Shihao Li, Wei Gao2026-03-10💻 cs

Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling

Questo articolo propone un metodo automatizzato per il conteggio dei parassiti nelle trappole ad acqua che utilizza un sistema di agitazione robotica attiva e adattiva per ridurre l'occlusione, migliorando significativamente l'accuratezza e riducendo i tempi di esecuzione rispetto ai metodi tradizionali basati su immagini statiche.

Xumin Gao, Mark Stevens, Grzegorz Cielniak2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

Il paper introduce CountFormer, un framework basato su DINOv2 che, sostituendo l'encoder di immagini con rappresentazioni foundation auto-supervisionate, mira a migliorare la consistenza strutturale nel conteggio di oggetti senza esempi, ottenendo risultati competitivi su FSC-147 e riducendo gli errori di sovrastima legati a componenti simmetriche o strutture complesse.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

Il paper presenta LagMemo, un sistema di navigazione robotica che utilizza una memoria 3D basata su Gaussian Splatting arricchita da informazioni linguistiche per gestire in modo efficace la navigazione multi-obiettivo con query a vocabolario aperto, dimostrando prestazioni superiori rispetto agli stati dell'arte su un nuovo benchmark curato chiamato GOAT-Core.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SAGE: Structure-Aware Generative Video Transitions between Diverse Clips

Il paper presenta SAGE, un approccio zero-shot che genera transizioni video strutturalmente coerenti tra clip diverse combinando guida strutturale e sintesi generativa, superando le limitazioni dei metodi tradizionali e generativi attuali senza richiedere addestramento su dati specifici.

Mia Kan, Yilin Liu, Niloy Mitra2026-03-10💻 cs

MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

Il paper presenta MobiDock, un sistema mobile manipolatore bimanuale modulare e auto-ricostituibile che, grazie a una strategia di aggancio autonoma basata su visione artificiale e un meccanismo di bloccaggio a vite, trasforma il controllo complesso di due robot indipendenti in un'unica piattaforma stabile e più efficiente.

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs

Vectorized Online POMDP Planning

Il paper presenta VOPP, un nuovo pianificatore POMDP online vettorializzato che sfrutta il calcolo massivamente parallelo per eliminare le dipendenze e le sincronizzazioni, risultando fino a 20 volte più efficiente dei solutori paralleli esistenti e superiore ai solutori sequenziali con un budget di pianificazione 1000 volte inferiore.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Questo studio propone un metodo forense per rilevare immagini generate dall'IA analizzando il "rimbalzo diffusivo", ovvero come le immagini reagiscono a una leggera perturbazione e ricostruzione tramite modelli di diffusione, ottenendo un'accuratezza eccezionale (AUROC 0,993) nel distinguere foto reali da sintetiche anche in presenza di distorsioni comuni.

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

PhantomFetch: Obfuscating Loads against Prefetcher Side-Channel Attacks

Il paper presenta PhantomFetch, la prima difesa hardware-agnostica che protegge i prefetcher IP-stride da attacchi side-channel offuscando i carichi sensibili senza disabilitare il prefetching né richiedere modifiche all'hardware.

Xingzhi Zhang, Buyi Lv, Yimin Lu, Kai Bu2026-03-10💻 cs

MUGSQA: Novel Multi-Uncertainty-Based Gaussian Splatting Quality Assessment Method, Dataset, and Benchmarks

Il paper presenta MUGSQA, un nuovo metodo, dataset e benchmark basati su una valutazione soggettiva multi-distanza che tiene conto di diverse incertezze dei dati di input per analizzare la qualità percettiva e la robustezza dei metodi di ricostruzione 3D tramite Gaussian Splatting.

Tianang Chen, Jian Jin, Shilv Cai, Zhuangzi Li, Weisi Lin2026-03-10💻 cs

← Precedente Successivo →