Modeling Concurrency Control as a Learnable Function

Il paper presenta NeurCC, un nuovo algoritmo di controllo della concorrenza basato sull'apprendimento automatico che, superando i limiti degli approcci tradizionali, ottimizza rapidamente le prestazioni su carichi di lavoro dinamici e diversificati tramite una funzione appresa e implementata come tabella di ricerca all'interno del database.

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

Scalable and Performant Data Loading

Il paper presenta SPDL, una libreria open-source e agnostica rispetto al framework che risolve i colli di bottiglia nel caricamento dei dati per l'IA rilasciando il GIL di Python, ottenendo così un'elaborazione fino al 74% più veloce rispetto a PyTorch DataLoader e un ulteriore guadagno di prestazioni con Python 3.13t a thread liberi.

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

Il paper introduce M4-SAR, un nuovo dataset su larga scala e un benchmark standardizzato per la rilevazione di oggetti tramite fusione ottica-SAR, accompagnati dal framework E2E-OSDet che dimostra come l'integrazione di queste due modalità migliori significativamente l'accuratezza della rilevazione rispetto all'uso di singoli sensori.

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei LuoWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Questo studio presenta una valutazione empirica su larga scala che dimostra come i modelli linguistici di grandi dimensioni (LLM), in particolare GPT-4o ottimizzato, superino i modelli linguistici pre-addestrati (PLM) nel rilevamento delle vulnerabilità software multilingue a livello di funzione e di riga, offrendo prestazioni superiori nella identificazione delle minacce più critiche.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

Il paper presenta SpikeSMOKE, un'architettura di reti neurali spiking per il rilevamento 3D di oggetti da singola immagine che, grazie a un innovativo meccanismo di codifica a gate multi-scala (CSGC) e a blocchi residui leggeri, migliora significativamente le prestazioni rispetto ai modelli esistenti riducendo al contempo il consumo energetico e la complessità computazionale.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Questo lavoro presenta un vasto dataset longitudinale di oltre 75 milioni di commenti e 400 milioni di voti provenienti dal forum del quotidiano austriaco DerStandard tra il 2013 e il 2022, progettato per facilitare l'analisi delle dinamiche di discussione e della struttura semantica in lingua tedesca garantendo al contempo la privacy degli utenti attraverso l'anonymizzazione e la condivisione di rappresentazioni vettoriali anziché dei testi grezzi.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

Il paper introduce FieldLVLM, un nuovo framework che migliora la comprensione dei dati di campo scientifici da parte dei Large Vision-Language Models attraverso una strategia di generazione linguistica consapevole del campo e un adattamento multimodale con compressione dei dati, ottenendo risultati superiori su benchmark specifici.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

Il paper presenta CoRe-GS, un framework di Gaussian Splatting che ottimizza selettivamente solo le regioni di interesse (POI) attraverso un approccio "coarse-to-refined" e un filtraggio basato sul colore, riducendo drasticamente i tempi di calcolo e migliorando la qualità della ricostruzione per applicazioni robotiche in tempo reale.

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel RothWed, 11 Ma💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

Il paper presenta VocSegMRI, un framework multimodale che integra segnali video, audio e fonologici tramite fusione cross-attention e apprendimento contrastivo per ottenere una segmentazione precisa e robusta delle strutture articolatorie nella risonanza magnetica in tempo reale, raggiungendo prestazioni state-of-the-art sul dataset USC-75.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-ToroWed, 11 Ma💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Questo lavoro propone un approccio decentralizzato per il trasporto cooperativo di oggetti non agganciabili da parte di squadre di robot quadrupedi, utilizzando una politica gerarchica e una formulazione ricompensa innovativa che permette il coordinamento tramite forze di contatto senza comunicazione né vincoli meccanici rigidi, garantendo robustezza e scalabilità fino a dieci robot.

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs