cs articoli | Gist.Science

ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

Il paper presenta ASTER, un framework di apprendimento per rinforzo che, grazie a una strategia di inizializzazione dello stato informata dalla dinamica ibrida, permette per la prima volta il volo autonomo invertito e manovri agili per un quadrotore con carico sospeso, superando le sfide della sparsità del reward e garantendo un trasferimento zero-shot dalla simulazione alla realtà.

Dongcheng Cao, Jin Zhou, Shuo Li2026-03-12💻 cs

Sublinear-Time Reconfiguration of Programmable Matter with Joint Movements

Questo articolo dimostra che, nel modello di movimento congiunto per la materia programmabile, è possibile riconfigurare qualsiasi struttura in un segmento lineare canonico in tempo sublineare $O(\sqrt{n}\log n)$ , risolvendo positivamente un problema aperto e fornendo nuovi primitivi per il movimento parallelo efficiente.

Manish Kumar, Othon Michail, Andreas Padalkin, Christian Scheideler2026-03-12💻 cs

eLasmobranc Dataset: An Image Dataset for Elasmobranch Species Recognition and Biodiversity Monitoring

Il paper presenta il dataset eLasmobranc, una raccolta pubblica di immagini curata di sette specie di elasmobranchi del Mediterraneo spagnolo, acquisita principalmente in ambiente terrestre e annotata da esperti per supportare il riconoscimento delle specie a livello fine-grained e il monitoraggio della biodiversità.

Ismael Beviá-Ballesteros, Mario Jerez-Tallón, Nieves Aranda-Garrido, Isabel Abel-Abellán, Irene Antón-Linares, Jorge Azorín-López, Marcelo Saval-Calvo, Andres Fuster-Guilló, Francisca Giménez-Casalduero2026-03-12💻 cs

Just-in-Time: Training-Free Spatial Acceleration for Diffusion Transformers

Questo paper introduce Just-in-Time (JiT), un nuovo framework senza addestramento che accelera l'inferenza dei Diffusion Transformers sfruttando la ridondanza spaziale attraverso una selezione dinamica di token di ancoraggio, ottenendo un aumento di velocità fino a 7 volte con prestazioni quasi senza perdite.

Wenhao Sun, Ji Li, Zhaoqiang Liu2026-03-12💻 cs

Pneuma-Seeker: A Relational Reification Mechanism to Align AI Agents with Human Work over Relational Data

Il paper presenta Pneuma-Seeker, un sistema basato sulla reificazione relazionale che allinea gli agenti AI al lavoro umano su dati relazionali trasformando le esigenze informative in schemi concreti e iterativamente raffinati, superando le limitazioni dei modelli linguistici tradizionali e garantendo maggiore accuratezza, trasparenza e fiducia.

Muhammad Imam Luthfi Balaka, John Hillesland, Kemal Badur, Raul Castro Fernandez2026-03-12💻 cs

Event-based Photometric Stereo via Rotating Illumination and Per-Pixel Learning

Il paper propone un sistema di fotometria stereo basato su eventi che utilizza una singola sorgente luminosa rotante e una rete neurale leggera per-pixel per stimare le normali superficiali senza calibrazione, ottenendo risultati superiori in termini di precisione e robustezza rispetto ai metodi esistenti in condizioni di illuminazione variabile e ad alto dinamico.

Hyunwoo Kim, Won-Hoe Kim, Sanghoon Lee, Jianfei Cai, Giljoo Nam, Jae-Sang Hyun2026-03-12💻 cs

AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations

AttriGuard è un nuovo sistema di difesa per agenti LLM che contrasta l'iniezione indiretta di prompt (IPI) utilizzando l'attribuzione causale e test controfattuali paralleli per verificare se le chiamate agli strumenti sono realmente motivate dall'intento dell'utente e non da osservazioni non attendibili, ottenendo così un tasso di successo degli attacchi nullo con una perdita minima di utilità.

Yu He, Haozhe Zhu, Yiming Li, Shuo Shao, Hongwei Yao, Zhihao Liu, Zhan Qin2026-03-12💻 cs

CodePercept: Code-Grounded Visual STEM Perception for MLLMs

Il paper "CodePercept" identifica le carenze percettive come il principale limite del ragionamento visivo STEM negli MLLM e propone un nuovo paradigma che utilizza l'esecuzione di codice per migliorare la percezione, supportato dal dataset su larga scala ICC-1M e dalla nuova benchmark STEM2Code-Eval.

Tongkun Guan, Zhibo Yang, Jianqiang Wan, Mingkun Yang, Zhengtao Guo, Zijian Hu, Ruilin Luo, Ruize Chen, Songtao Jiang, Peng Wang, Wei Shen, Junyang Lin, Xiaokang Yang2026-03-12💻 cs

RAGPerf: An End-to-End Benchmarking Framework for Retrieval-Augmented Generation Systems

Il paper presenta RAGPerf, un framework open source end-to-end per il benchmarking dei sistemi di Retrieval-Augmented Generation che, decodificando il flusso di lavoro in componenti modulari, permette un'analisi dettagliata delle prestazioni e della qualità attraverso la configurazione flessibile di modelli, database vettoriali e carichi di lavoro realistici.

Shaobo Li, Yirui Zhou, Yuan Xu, Kevin Chen, Daniel Waddington, Swaminathan Sundararaman, Hubertus Franke, Jian Huang2026-03-12💻 cs

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Il paper presenta Aceso, un sistema adattivo che ottimizza il posizionamento dei microservizi per le PMI considerando vincoli di carbonio, costi e latenza, riducendo le emissioni di carbonio del 37,4% e i costi operativi del 3,6% rispetto alle distribuzioni statiche.

Georgia Christofidi, Francisco Álvarez-Terribas, Ioannis Roumpos, Nicolas Kourtellis, Jesus Omaña Iglesias, Thaleia Dimitra Doudali2026-03-12💻 cs

AI-Generated Rubric Interfaces: K-12 Teachers' Perceptions and Practices

Questo studio esamina le percezioni e le pratiche di 25 insegnanti K-12 riguardo all'uso di MagicSchool.ai per generare rubriche, rivelando che, sebbene gli strumenti AI siano considerati utili per creare bozze strutturate e fornire feedback dettagliati, gli educatori ne sottolineano la necessità di una revisione sostanziale e di un controllo umano per correggere allineamenti impropri e garantire la personalizzazione.

Bahare Riahi, Sayali Patukale, Joy Niranjan, Yogya Koneru, Tiffany Barnes, Veronica Cateté2026-03-12💻 cs

Incremental Federated Learning for Intrusion Detection in IoT Networks under Evolving Threat Landscape

Questo studio analizza l'efficacia dell'apprendimento federato incrementale con modelli LSTM per migliorare la resilienza a lungo termine dei sistemi di rilevamento delle intrusioni nelle reti IoT, dimostrando che strategie come l'apprendimento cumulativo e rappresentativo offrono le prestazioni più stabili di fronte al drift concettuale, pur rispettando i vincoli di risorse dei dispositivi.

Muaan Ur Rehman, Hayretdin Bahs, Rajesh Kalakoti2026-03-12💻 cs

Guiding Diffusion Models with Semantically Degraded Conditions

Il paper propone la Condition-Degradation Guidance (CDG), un metodo plug-and-play che sostituisce il prompt nullo nella guida senza classificatore con una condizione semanticamente degradata, migliorando significativamente l'accuratezza compositiva e l'allineamento testo-immagine nei modelli di diffusione moderni.

Shilong Han, Yuming Zhang, Hongxia Wang2026-03-12💻 cs

Phase-Interface Instance Segmentation as a Visual Sensor for Laboratory Process Monitoring

Il paper propone LGA-RCM-YOLO, un modello di segmentazione istanziata basato su YOLO11m-seg e addestrato sul dataset CTG 2.0, che supera le sfide del monitoraggio visivo in vetreria trasparente identificando con precisione le interfacce di fase e le attributi di colore per abilitare il controllo automatico dei processi di laboratorio.

Mingyue Li, Xin Yang, Shilin Yan, Jinye Ran, Morui Zhu, Zirui Peng, Huanqing Peng, Wei Peng, Guanghua Zhang, Shuo Li, Hao Zhang2026-03-12💻 cs

The Quadratic Geometry of Flow Matching: Semantic Granularity Alignment for Text-to-Image Synthesis

Il paper propone la Semantic Granularity Alignment (SGA), un metodo che, analizzando la dinamica di ottimizzazione del Flow Matching attraverso una forma quadratica e un kernel NTK, allinea la granularità semantica per mitigare i conflitti di gradiente e migliorare l'efficienza e la qualità nella sintesi di immagini da testo.

Zhinan Xiong, Shunqi Yuan2026-03-12💻 cs

Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security?

Questo studio ricalibra le aspettative sull'auditing automatizzato dei contratti intelligenti, dimostrando che gli agenti AI, sebbene capaci di rilevare vulnerabilità note, mancano di stabilità e non riescono a sfruttare completamente le falle in scenari reali, evidenziando la necessità di un approccio ibrido uomo-macchina piuttosto che una soluzione completamente autonoma.

Chaoyuan Peng, Lei Wu, Yajin Zhou2026-03-12💻 cs

PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction

Il paper presenta PolGS++, un nuovo framework di Gaussian Splatting polarimetrico guidato dalla fisica che integra un modello pBRDF e una maschera di visibilità guidata dalla profondità per ricostruire rapidamente e con alta precisione superfici riflettenti, superando i limiti dei metodi precedenti nel recupero di geometria e normali.

Yufei Han, Chu Zhou, Youwei Lyu, Qi Chen, Si Li, Boxin Shi, Yunpeng Jia, Heng Guo, Zhanyu Ma2026-03-12💻 cs

Backdoor Directions in Vision Transformers

Questo paper indaga come gli attacchi backdoor siano rappresentati nei Vision Transformers, identificando una specifica "direzione del trigger" nelle attivazioni del modello che ne conferma il ruolo causale, permettendo di tracciare l'elaborazione delle caratteristiche malevole, analizzare le differenze tra trigger statici e distribuiti, e proporre un metodo di rilevamento basato sui pesi senza necessità di dati.

Sengim Karayalcin, Marina Krcek, Pin-Yu Chen, Stjepan Picek2026-03-12💻 cs

Beyond Standard Datacubes: Extracting Features from Irregular and Branching Earth System Data

Questo articolo presenta un nuovo framework basato su ipercubi di dati compressi ad albero all'interno del sistema Polytope, progettato per superare i limiti dei modelli tradizionali e abilitare un'estrazione efficiente e flessibile delle caratteristiche da dataset di scienze della Terra irregolari e complessi.

Mathilde Leuridan, James Hawkes, Tiago Quintino, Martin Schultz2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

Il paper introduce HanMoVLM, un modello visione-linguaggio su larga scala specializzato nella valutazione professionale di dipinti cinesi che, grazie a un nuovo dataset (HanMo-Bench) e a un ragionamento guidato da esperti, colma il divario tra capacità generiche dei VLM e giudizio artistico umano, fungendo anche da validatore per migliorare la generazione di immagini artistiche.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs

← Precedente Successivo →