cs articoli | Gist.Science

From Ideal to Real: Stable Video Object Removal under Imperfect Conditions

Il paper presenta SVOR, un framework robusto che supera le limitazioni delle condizioni reali nella rimozione di oggetti dai video grazie a tre innovazioni chiave (MUSE, DA-Seg e un training curricolare su due stadi), ottenendo risultati all'avanguardia nella stabilità temporale e nella gestione di ombre, movimenti bruschi e maschere difettose.

Jiagao Hu, Yuxuan Chen, Fuhao Li, Zepeng Wang, Fei Wang, Daiguo Zhou, Jian Luan2026-03-11💻 cs

Learning Convex Decomposition via Feature Fields

Questo lavoro propone il primo modello feed-forward per la decomposizione convessa in mondi aperti, apprendendo campi di caratteristiche continui che, tramite un obiettivo auto-supervisionato basato sulla geometria, permettono di scomporre forme 3D complesse in corpi convessi di alta qualità per applicazioni come la rilevazione delle collisioni.

Yuezhi Yang, Qixing Huang, Mikaela Angelina Uy, Nicholas Sharp2026-03-11💻 cs

CogBlender: Towards Continuous Cognitive Intervention in Text-to-Image Generation

Il paper presenta CogBlender, un framework che permette un intervento continuo e multidimensionale sulle proprietà cognitive (come valenza, arousal, dominanza e memorabilità) nella generazione di immagini da testo, colmando il divario tra contenuto semantico e intento psicologico attraverso l'interpolazione di campi di velocità tra ancoraggi cognitivi definiti.

Shengqi Dang, Jiaying Lei, Yi He, Ziqing Qian, Nan Cao2026-03-11💻 cs

Exploring Modality-Aware Fusion and Decoupled Temporal Propagation for Multi-Modal Object Tracking

Il paper presenta MDTrack, un nuovo framework per il tracciamento multimodale che supera i limiti delle strategie di fusione uniformi adottando una fusione adattiva basata su esperti dedicati per ciascuna modalità e una propagazione temporale decoupled tramite due modelli di spazio di stato separati, ottenendo così prestazioni all'avanguardia su cinque benchmark.

Shilei Wang, Pujian Lai, Dong Gao, Jifeng Ning, Gong Cheng2026-03-11💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Il paper presenta ToolRosetta, un framework unificato che automatizza la conversione di repository di codice open-source in strumenti MCP compatibili per agenti LLM, riducendo lo sforzo umano e migliorando le prestazioni dei task attraverso un'ispezione di sicurezza integrata.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong Rui2026-03-11💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

Il paper introduce SPR, un framework visione-linguaggio-azione che migliora la robustezza della manipolazione robotica attraverso un ciclo continuo di osservazione, pianificazione e riavvio basato sul monitoraggio esplicito del progresso del compito, ottenendo risultati superiori rispetto agli stati dell'arte su benchmark complessi.

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun Chang2026-03-11💻 cs

Latency Effects on Multi-Dimensional QoE in Networked VR Whiteboards

Questo studio analizza l'impatto della latenza sulla qualità dell'esperienza (QoE) nelle lavagne virtuali di realtà aumentata, esaminando come essa influisca diversamente su aspetti pragmatici ed edonici in vari modalità di collaborazione e tra piattaforme con o senza avatar, al fine di fornire linee guida per l'ottimizzazione di tali sistemi.

Jiarun Song, Yongkang Hou, Fuzheng Yang2026-03-11💻 cs

CORAL: Scalable Multi-Task Robot Learning via LoRA Experts

Il paper presenta CORAL, un framework scalabile per l'apprendimento robotico multi-task che risolve il problema dell'interferenza tra compiti congelando un backbone VLA pre-addestrato e assegnando un esperto LoRA leggero e isolato per ogni attività, permettendo così un adattamento continuo senza dimenticare le competenze precedenti e con un overhead di inferenza nullo.

Yuankai Luo, Woping Chen, Tong Liang, Zhenguo Li2026-03-11💻 cs

Paralinguistic Emotion-Aware Validation Timing Detection in Japanese Empathetic Spoken Dialogue

Questo studio propone un modello che rileva il momento ottimale per fornire validazione emotiva nel dialogo parlato giapponese analizzando esclusivamente segnali paralinguistici ed emozioni vocali, senza fare affidamento sul contesto testuale, al fine di migliorare l'interazione empatica tra uomo e robot.

Zi Haur Pang, Yahui Fu, Yuan Gao, Tatsuya Kawahara2026-03-11💻 cs

External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment

Questo articolo presenta una soluzione basata su un Ambiente di Esecuzione Attendibile (TEE) RISC-V che fornisce entropia crittografica sicura a dispositivi IoT vincolati, risolvendo il problema della generazione di chiavi crittografiche affidabili attraverso un servizio esterno verificabile.

Arttu Paju, Alejandro Cabrera Aldaya, Nicola Tuveri, Juha Savimäki, Marko Kivikangas, Brian McGillion2026-03-11💻 cs

IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework

Il paper presenta IntroSVG, un framework che migliora la generazione di grafica vettoriale (SVG) da testo integrando un ciclo chiuso di generazione e critica basato su feedback visivo, che utilizza tecniche di affinamento supervisionato e ottimizzazione delle preferenze per produrre risultati di alta qualità con strutture complesse e allineamento semantico superiore.

Feiyu Wang, Jiayuan Yang, Zhiyuan Zhao, Da Zhang, Bingyu Li, Peng Liu, Junyu Gao2026-03-11💻 cs

NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors

Il paper presenta NLiPsCalib, un framework di calibrazione efficiente e fisicamente coerente che utilizza la stereo fotometrica con sorgenti luminose vicine per abilitare la ricostruzione 3D ad alta fedeltà di sensori visuotattili curvi attraverso procedure di calibrazione semplici e accessibili.

Xuhao Qin, Feiyu Zhao, Yatao Leng, Runze Hu, Chenxi Xiao2026-03-11💻 cs

OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models

Il paper presenta OddGridBench, un benchmark controllato che rivela la scarsa sensibilità delle Multimodal Large Language Models alle discrepanze visive fini, e propone OddGrid-GRPO, un framework di apprendimento per rinforzo che ne migliora significativamente la capacità di discriminazione attraverso l'uso di apprendimento curricolare e ricompense consapevoli della distanza spaziale.

Tengjin Weng, Wenhao Jiang, Jingyi Wang, Ming Li, Lin Ma, Zhong Ming2026-03-11💻 cs

Measuring onion website discovery and Tor users' interests with honeypots

Questo studio utilizza honeypot distribuiti tramite il motore di ricerca Ahmia e altri canali per dimostrare che gli utenti umani di Tor provengono quasi esclusivamente da Ahmia.fi e che, tra le varie tematiche illegali testate, i siti a tema CSAM generano un coinvolgimento significativamente superiore, con una preferenza marcata per le versioni in lingua inglese.

Arttu Paju, Waris Abdullah, Juha Nurmi2026-03-11💻 cs

Dynamic Precision Math Engine for Linear Algebra and Trigonometry Acceleration on Xtensa LX6 Microcontrollers

Questo articolo presenta un motore di calcolo matematico a precisione dinamica per microcontrollori Xtensa LX6 come l'ESP32, che combina un'aritmetica in punto fisso, un modulo CORDIC e una moltiplicazione di matrici ottimizzata per ottenere accelerazioni fino a 24,7 volte rispetto alle librerie standard, permettendo un cambio di precisione in tempo reale senza ricompilazione.

Elian Alfonso Lopez Preciado2026-03-11💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

Questo studio dimostra che, sebbene ChatGPT possa generare specifiche di requisiti di sistema sintetiche realistiche fino al 62% secondo gli esperti, l'uso esclusivo di valutazioni basate su modelli linguistici non può sostituire le revisioni approfondite degli esperti a causa di allucinazioni e contraddizioni intrinseche.

Alex R. Mattukat, Florian M. Braun, Horst Lichter2026-03-11💻 cs

Predictive Spectral Calibration for Source-Free Test-Time Regression

Il paper propone la Calibrazione Spettrale Predittiva (PSC), un framework senza sorgente che estende l'allineamento del sottospazio al matching spettrale a blocchi per migliorare l'adattamento al test nella regressione di immagini, ottenendo risultati superiori rispetto alle basi esistenti, specialmente in presenza di forti spostamenti distribuzionali.

Nguyen Viet Tuan Kiet, Huynh Thanh Trung, Pham Huy Hieu2026-03-11💻 cs

The Virtuous Cycle: AI-Powered Vector Search and Vector Search-Augmented AI

Questo tutorial presentato all'ICDE 2026 esplora il ciclo virtuoso di reciproco potenziamento tra l'intelligenza artificiale e la ricerca vettoriale, analizzando come l'AI ottimizzi i sistemi di ricerca e come la ricerca vettoriale, in particolare attraverso il framework RAG, estenda le capacità dei modelli linguistici di grandi dimensioni.

Jiuqi Wei, Quanqing Xu, Chuanhui Yang2026-03-11💻 cs

Robust Provably Secure Image Steganography via Latent Iterative Optimization

Il paper propone un framework di steganografia d'immagine robusto e provabilmente sicuro basato sull'ottimizzazione iterativa nello spazio latente, che migliora significativamente l'accuratezza dell'estrazione del messaggio sotto compressione e vari processi di elaborazione delle immagini mantenendo al contempo la sicurezza teorica.

Yanan Li, Zixuan Wang, Qiyang Xiao, Yanzhen Ren2026-03-11💻 cs

ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation

ProvAgent è un framework innovativo che supera i limiti della collaborazione uomo-modello nella rilevazione delle minacce APT, integrando screening iniziale, profilazione basata su coerenza identità-comportamento e indagine autonoma tramite agenti multipli per ricostruire processi di attacco complessi con alta precisione e costi ridotti.

Wenhao Yan, Ning An, Linxu Li, Bingsheng Bi, Bo Jiang, Zhigang Lu, Baoxu Liu, Junrong Liu, Cong Dong2026-03-11💻 cs

← Precedente Successivo →