cs articoli | Gist.Science

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

Questo studio empirico su larga scala analizza l'uso dell'aritmetica in virgola mobile in milioni di repository GitHub per linguaggi staticamente tipizzati, fornendo un dataset di 10 milioni di funzioni reali e valutando la rappresentatività degli attuali benchmark rispetto al codice di produzione.

Andrea Gilot, Tobias Wrigstad, Eva Darulova2026-03-11💻 cs

Large Language Model Assisted Automated Algorithm Generation and Evolution via Meta-black-box optimization

Questo lavoro presenta AwesomeDE, un approccio che utilizza i grandi modelli linguistici per generare automaticamente e ottimizzare algoritmi evolutivi per problemi vincolati, superando i metodi esistenti in termini di efficienza computazionale, accuratezza e generalizzazione.

Xu Yang, Rui Wang, Kaiwen Li + 2 more2026-03-11💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

Il paper presenta VocSegMRI, un framework multimodale che integra segnali video, audio e fonologici tramite fusione cross-attention e apprendimento contrastivo per ottenere una segmentazione precisa e robusta delle strutture articolatorie nella risonanza magnetica in tempo reale, raggiungendo prestazioni state-of-the-art sul dataset USC-75.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Questo lavoro propone un approccio decentralizzato per il trasporto cooperativo di oggetti non agganciabili da parte di squadre di robot quadrupedi, utilizzando una politica gerarchica e una formulazione ricompensa innovativa che permette il coordinamento tramite forze di contatto senza comunicazione né vincoli meccanici rigidi, garantendo robustezza e scalabilità fino a dieci robot.

Bikram Pandit, Aayam Kumar Shrestha, Alan Fern2026-03-11💻 cs

Designing Culturally Aligned AI Systems For Social Good in Non-Western Contexts

Questo articolo analizza otto implementazioni reali di intelligenza artificiale in contesti non occidentali per identificare sei fattori chiave e proporre dodici linee guida che enfatizzano la collaborazione interdisciplinare e l'allineamento culturale nella progettazione di sistemi di AI per il bene sociale.

Deepak Varuvel Dennison, Mohit Jain, Tanuja Ganu, Aditya Vashistha2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

Il documento presenta il CSLICS, un sistema di imaging automatizzato a basso costo che utilizza tecniche di visione artificiale per contare con precisione le uova di corallo e le larve, riducendo drasticamente il lavoro manuale e facilitando il ripristino delle barriere coralline.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks

Questo lavoro propone un metodo non supervisionato per recuperare i meccanismi di codifica e decodifica dei concetti nei network di visione profonda, identificando coppie di direzioni latenti che permettono di interpretare, correggere e manipolare il comportamento dei modelli senza ricorrere alla ricostruzione delle feature.

Alexandros Doumanoglou, Kurt Driessens, Dimitrios Zarpalas2026-03-11💻 cs

LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models

Il paper introduce LLaVAShield, un sistema di sicurezza progettato per proteggere i dialoghi multimodali multi-turno nei modelli visione-linguaggio, supportato dal nuovo dataset MMDS e dal framework di red teaming MMRT, che supera le soluzioni esistenti nella rilevazione dei rischi contestuali e nell'adattabilità alle policy.

Guolei Huang, Qinzhi Peng, Gan Xu, Yao Huang, Yuxuan Lu, Yongjun Shen2026-03-11💻 cs

Mapping Historic Urban Footprints in France: Balancing Quality, Scalability and AI Techniques

Questo studio presenta un pipeline di deep learning scalabile basato su una rete U-Net a doppio passaggio che, analizzando le mappe storiche Scan Histo (1925-1950), genera il primo dataset nazionale a scala aperta degli impronte urbane in Francia, superando le sfide legate alla complessità radiometrica e stilistica delle fonti originali.

Walid Rabehi, Marion Le Texier, Rémi Lemoy2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

Il paper propone un algoritmo di pianificazione del movimento in tempo reale basato su curve di Bézier (MPC-CLF-CBF) che garantisce la connettività e la capacità di recupero di flotte robotiche in ambienti ostacolati, superando i limiti dei controllori reattivi e validando l'approccio tramite simulazioni e esperimenti fisici con otto quadricotteri Crazyflie.

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

Il paper presenta LARA-Gen, un framework che abilita un controllo continuo e fine-granulare delle emozioni nella generazione musicale allineando le rappresentazioni latenti a un modello di comprensione esterna e disaccoppiando gli attributi emotivi dal contenuto testuale, superando così i limiti dei prompt testuali e ottenendo risultati superiori rispetto alle basi di confronto.

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs

Asset-Centric Metric-Semantic Maps of Indoor Environments

Questo articolo presenta un approccio che combina rappresentazioni metriche dettagliate degli oggetti con informazioni semantiche per creare mappe indoor ad alta precisione, superando i limiti delle metodologie esistenti in termini di accuratezza e velocità, e dimostrando la loro efficacia nel ragionamento dei robot tramite modelli linguistici e nella navigazione semantica.

Christopher D. Hsu, Pratik Chaudhari2026-03-11💻 cs

NaviGait: Navigating Dynamically Feasible Gait Libraries using Deep Reinforcement Learning

Il paper presenta NaviGait, un framework gerarchico che combina l'ottimizzazione di traiettoria con l'apprendimento per rinforzo per generare politiche di locomozione bipede robuste e intuitive, selezionando e adattando dinamicamente i passi da una libreria offline pre-calcolata.

Neil Janwani, Varun Madabushi, Maegan Tucker2026-03-11💻 cs

BanaServe: Unified KV Cache and Dynamic Module Migration for Balancing Disaggregated LLM Serving in AI Infrastructure

Il paper presenta BanaServe, un framework di orchestrazione dinamica che bilancia le risorse computazionali e di memoria nei sistemi LLM disaggregati attraverso la migrazione dinamica dei pesi e della cache KV, risolvendo gli squilibri di carico e le limitazioni delle strategie di routing basate sulla cache per migliorare significativamente throughput e latenza rispetto alle soluzioni esistenti.

Yiyuan He, Minxian Xu, Jingfeng Wu + 7 more2026-03-11💻 cs

Real-Time Neural Video Compression with Unified Intra and Inter Coding

Il paper presenta un nuovo framework di compressione video neurale in tempo reale che unifica la codifica intra e inter in un unico modello, risolvendo problemi come la disocclusione e la propagazione degli errori e ottenendo una riduzione del 12,1% del tasso BD rispetto a DCVC-RT.

Hui Xiang, Yifan Bian, Li Li, Jingran Wu, Xianguo Zhang, Dong Liu2026-03-11💻 cs

Polynomial-time Configuration Generator for Connected Unlabeled Multi-Agent Pathfinding

Questo articolo presenta PULL, un algoritmo completo e polinomiale che risolve in modo efficiente il problema della ricerca di percorsi multi-agente sconnessi e connessi (CUMAPF) per sciami robotici, superando i limiti di scalabilità delle formulazioni di programmazione lineare intera.

Takahiro Suzuki, Keisuke Okumura2026-03-11💻 cs

Revisiting Replanning from Scratch: Real-Time Incremental Planning with Fast Almost-Surely Asymptotically Optimal Planners

Questo articolo dimostra che il ri-pianificazione incrementale in ambienti dinamici può essere risolta più efficientemente trattando ogni richiesta come un problema indipendente utilizzando algoritmi di pianificazione quasi-sicuramente asintoticamente ottimali (ASAO), come EIT* e AORRTC, che trovano percorsi globali coerenti senza la necessità di aggiornare esplicitamente i piani esistenti.

Mitchell E. C. Sabbadini, Andrew H. Liu, Joseph Ruan, Tyler S. Wilson, Zachary Kingston, Jonathan D. Gammell2026-03-11💻 cs

Proper Body Landmark Subset Enables More Accurate and 5X Faster Recognition of Isolated Signs in LIBRAS

Questo studio dimostra che la selezione di un sottoinsieme appropriato di punti di riferimento corporei, combinata con tecniche di imputazione basate su spline, consente un riconoscimento dei segni isolati in LIBRAS con un'accuratezza pari o superiore agli stati dell'arte e con una velocità di elaborazione cinque volte superiore rispetto ai metodi precedenti.

Daniele L. V. dos Santos, Thiago B. Pereira, Carlos Eduardo G. R. Alves, Richard J. M. G. Tello, Francisco de A. Boldt, Thiago M. Paixão2026-03-11💻 cs

Who Made This? Fake Detection and Source Attribution with Diffusion Features

Il paper presenta FRIDA, un framework leggero ed efficiente che utilizza le caratteristiche di un modello Stable Diffusion pre-addestrato per rilevare e attribuire le immagini generate dall'IA, ottenendo prestazioni all'avanguardia nella rilevazione cross-generatori e nell'identificazione della fonte.

Simone Bonechi, Paolo Andreini, Barbara Toniella Corradini2026-03-11💻 cs

EgoMI: Learning Active Vision and Whole-Body Manipulation from Egocentric Human Demonstrations

Il paper presenta EgoMI, un framework che colma il divario di incarnazione tra umani e robot semi-umanoidi apprendendo la manipolazione attiva e la coordinazione testa-mano da dimostrazioni umane in prima persona, utilizzando una politica potenziata da memoria per gestire i cambiamenti dinamici del punto di vista.

Justin Yu, Yide Shentu, Di Wu, Pieter Abbeel, Ken Goldberg, Philipp Wu2026-03-11💻 cs

← Precedente Successivo →