cs articoli | Gist.Science

Diffusion Stabilizer Policy for Automated Surgical Robot Manipulations

Il documento presenta la "Diffusion Stabilizer Policy" (DSP), un framework di apprendimento basato su modelli di diffusione che permette ai robot chirurgici di essere addestrati anche con traiettorie imperfette o fallite, garantendo prestazioni superiori e robustezza in ambienti chirurgici perturbati.

Chonlam Ho, Jianshu Hu, Lei Song, Hesheng Wang, Qi Dou, Yutong Ban2026-03-10💻 cs

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

Questo articolo propone un nuovo framework parallelo per sistemi multi-agente basati su LLM in Minecraft, che supera i limiti delle esecuzioni seriali adottando un'architettura a doppio thread per consentire la pianificazione e l'azione simultanee, migliorando così la reattività in ambienti dinamici.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Il paper propone un modello di apprendimento profondo geometrico basato su transformer che, integrando punti di riferimento anatomici in mesh tetraedriche derivanti da risonanza magnetica strutturale, migliora la diagnosi dell'Alzheimer e la previsione della positività all'amiloide cerebrale, riducendo la necessità di scansioni PET costose e invasive.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

Il paper presenta ViLAM, un metodo innovativo che distilla il ragionamento visivo-linguistico da grandi modelli in mappe di attenzione spaziale per guidare la navigazione socialmente consapevole di robot, ottenendo miglioramenti significativi nel tasso di successo rispetto alle tecniche esistenti.

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Il paper introduce Snapmoji, un sistema che genera istantaneamente avatar 3D animabili e personalizzabili su dispositivi mobili a 30-40 FPS, trasformando un selfie in uno stile principale tramite l'adattamento del dominio Gaussiano (GDA) e applicando successivamente uno stile secondario pur preservando l'identità dell'utente.

Eric M. Chen, Di Liu, Sizhuo Ma, Michael Vasilkovsky, Bing Zhou, Qiang Gao, Wenzhou Wang, Jiahao Luo, Dimitris N. Metaxas, Vincent Sitzmann, Jian Wang2026-03-10💻 cs

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Il paper presenta iProg, uno strumento di programmazione induttiva strutturata interattiva che, sfruttando un protocollo di comunicazione bidirezionale tra umani e modelli linguistici per decomporre i compiti in diagrammi di flusso dati e generare codice verificato, permette di costruire sistemi di analisi dati scientifici con qualità superiore e tempi di sviluppo drasticamente ridotti rispetto alle alternative No Code.

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Il paper presenta SceneEval, un nuovo framework di valutazione e un benchmark di 500 campioni (SceneEval-500) progettati per misurare in modo completo e interpretabile la coerenza semantica e il rispetto delle specifiche testuali nella sintesi di scene 3D interne, evidenziando le lacune attuali nei metodi di generazione esistenti.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning

Questo paper propone un nuovo approccio per l'apprendimento compatibile con il passato che, rilassando i vincoli di allineamento tramite perturbazioni sui prototipi delle vecchie caratteristiche, preserva la capacità discriminatoria del nuovo modello senza richiedere il costoso ricalcolo delle embedding.

Zikun Zhou, Yushuai Sun, Wenjie Pei, Xin Li, Yaowei Wang2026-03-10💻 cs

Privacy Enhanced QKD Networks: Zero Trust Relay Architecture based on Homomorphic Encryption

Il documento propone un'architettura di ripetitori a fiducia zero per le reti QKD che utilizza la crittografia omomorfica per eseguire la riconversione delle chiavi senza esporle in chiaro, superando così le vulnerabilità dei nodi intermedi tradizionali e migliorando la scalabilità e la sicurezza delle infrastrutture di comunicazione quantistica.

Aitor Brazaola-Vicario, Oscar Lage, Julen Bernabé-Rodríguez + 2 more2026-03-10💻 cs

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Questo lavoro propone un metodo unificato per la ricostruzione robusta di due mani da immagini monoculare, che combina un codificatore di fusione per allineare eterogenee priorità 2D da modelli fondazionali con un modello di diffusione privo di penetrazione per garantire interazioni 3D fisicamente plausibili e coerenti.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

MediTools -- Medical Education Powered by LLMs

Il progetto MediTools sfrutta i modelli linguistici di grandi dimensioni per rivoluzionare l'educazione medica attraverso un'applicazione interattiva che include simulazioni di casi clinici, strumenti di analisi della letteratura scientifica e aggiornamenti sulle notizie mediche, validati da un sondaggio tra professionisti e studenti del settore.

Amr Alshatnawi, Remi Sampaleanu, David Liebovitz2026-03-10💻 cs

Medium Access for Push-Pull Data Transmission in 6G Wireless Systems

Questo articolo propone una tassonomia e linee guida per i protocolli di controllo dell'accesso al mezzo (MAC) nei sistemi 6G basati sull'intelligenza artificiale, focalizzandosi sulla coesistenza e l'integrazione delle comunicazioni di tipo "push" e "pull" all'interno delle reti O-RAN.

Shashi Raj Pandey, Fabio Saggese, Junya Shiraishi, Federico Chiariotti, Petar Popovski2026-03-10💻 cs

Point-based Instance Completion with Scene Constraints

Il paper propone un modello di completamento istanza basato su nuvole di punti che integra vincoli di scena tramite un meccanismo di cross-attention per gestire oggetti a scale e pose arbitrarie, accompagnato dalla creazione del nuovo dataset ScanWCF per valutare il completamento in ambienti interni.

Wesley Khademi, Li Fuxin2026-03-10💻 cs

LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Il documento presenta LEL, un innovativo framework di apprendimento ensemble vincolato dalla continuità di Lipschitz che migliora stabilità, accuratezza e robustezza nel riconoscimento delle emozioni basato su segnali EEG intra-soggetto, ottenendo risultati superiori su tre dataset pubblici.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs

GeoNav: Empowering MLLMs with dual-scale geospatial reasoning for language-goal aerial navigation

Il paper presenta GeoNav, un agente multimodale che potenzia i MLLM con una capacità di ragionamento geospaziale a doppia scala, combinando mappe cognitive globali e grafi di scena locali per migliorare significativamente la navigazione aerea verso obiettivi basati su istruzioni testuali in ambienti urbani complessi.

Haotian Xu, Yue Hu, Chen Gao, Zhengqiu Zhu, Yong Zhao, Yong Li, Quanjun Yin2026-03-10💻 cs

Task-Oriented Semantic Compression for Localization at the Network Edge

Il paper propone un framework di comunicazione orientato al compito, basato sull'encoder O-VIB ispirato alla cognizione spaziale mammifera, che permette una localizzazione visiva ad alta precisione in ambienti urbani privi di GPS tramite la compressione efficiente delle caratteristiche multi-vista ai margini della rete.

Zhengru Fang, Senkang Hu, Yu Guo, Yiqin Deng, Yuguang Fang2026-03-10💻 cs

Smart placement, faster robots-a comparison of algorithms for robot base-pose optimization

Questo studio confronta diversi algoritmi per l'ottimizzazione della posa di base dei robot industriali, dimostrando che la discesa del gradiente stocastica offre il miglior tasso di successo mentre gli algoritmi genetici raggiungono i costi finali più bassi, riducendo complessivamente i tempi di ciclo.

Matthias Mayer, Matthias Althoff2026-03-10💻 cs

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Il paper propone SFIBA, un attacco backdoor invisibile basato su regioni spaziali specifiche e tecniche di dominio frequenziale che garantisce l'efficacia multi-target, l'impercettibilità visiva e la capacità di eludere le difese esistenti in scenari black-box.

Yangxu Yin, Honglong Chen, Yudong Gao, Peng Sun, Zhishuai Li, Weifeng Liu2026-03-10💻 cs

Holistic Optimization of Modular Robots

Questo lavoro presenta il primo approccio olistico che ottimizza congiuntamente la composizione, il posizionamento della base e la traiettoria dei robot modulari per minimizzare il tempo di ciclo, ottenendo miglioramenti significativi nelle prestazioni rispetto ai metodi tradizionali e validando con successo la soluzione in scenari reali.

Matthias Mayer, Matthias Althoff2026-03-10💻 cs

A Coordinated Routing Approach for Enhancing Bus Timeliness and Travel Efficiency in Mixed-Traffic Environment

Questo studio propone un approccio di routing coordinato che utilizza veicoli connessi e automatizzati (CAV) nelle corsie riservate agli autobus, sfruttando dati in tempo reale per ottimizzare la puntualità del servizio di trasporto pubblico e l'efficienza di viaggio dei CAV in ambienti a traffico misto.

Tanlu Liang, Ting Bai, Andreas A. Malikopoulos2026-03-10💻 cs

← Precedente Successivo →