Modeling Trend Dynamics with Variational Neural ODEs for Information Popularity Prediction

Il paper propone VNOIP, un metodo innovativo basato su equazioni differenziali ordinarie neurali variazionali con meccanismi di attenzione e distillazione della conoscenza, che supera i limiti degli approcci esistenti modellando esplicitamente la dinamica temporale continua delle tendenze di popolarità per prevedere con maggiore accuratezza l'evoluzione delle informazioni nelle reti sociali.

Yuchen Wang, Dongpeng Hou, Weikai Jing, Chao Gao, Xianghua Li, Yang LiuWed, 11 Ma💻 cs

SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation

Il paper introduce SPAN-Nav, un modello fondazionale end-to-end che potenzia la navigazione visione-linguaggio con una consapevolezza spaziale 3D universale, ottenendo prestazioni all'avanguardia grazie a un nuovo dataset massivo di annotazioni e a un meccanismo efficiente che utilizza un singolo token spaziale per guidare il ragionamento delle azioni.

Jiahang Liu, Tianyu Xu, Jiawei Chen, Lu Yue, Jiazhao Zhang, Zhiyong Wang, Minghan Li, Qisheng Zhao, Anqi Li, Qi Su, Zhizheng Zhang, He WangWed, 11 Ma💻 cs

Fast and Optimal Differentially Private Frequent-Substring Mining

Questo lavoro presenta un nuovo algoritmo di mining dei sottostringhe frequenti con garanzia di privacy differenziale che, mantenendo gli stessi errori ottimali della ricerca precedente, riduce drasticamente la complessità spaziale e temporale da O(n24)O(n^2\ell^4) a O(n+Σ)O(n \ell+ |\Sigma| ) e O(nlogΣ+Σ)O(n \ell\log |\Sigma| + |\Sigma| ) grazie a una strategia di generazione dei candidati raffinata e a un'efficace potatura dello spazio di ricerca.

Peaker Guo, Rayne Holland, Hao WuWed, 11 Ma💻 cs

Point Cloud as a Foreign Language for Multi-modal Large Language Model

Il paper presenta SAGE, il primo modello linguistico grande multimodale end-to-end che elabora direttamente nuvole di punti grezze trattandole come un "linguaggio straniero" tramite un tokenizzatore 3D leggero e una strategia di ottimizzazione delle preferenze, superando i metodi basati su encoder pre-addestrati in termini di efficienza computazionale, allineamento semantico e robustezza.

Sneha Paul, Zachary Patterson, Nizar BouguilaWed, 11 Ma💻 cs

STONE Dataset: A Scalable Multi-Modal Surround-View 3D Traversability Dataset for Off-Road Robot Navigation

Il paper presenta STONE, un dataset multi-modale su larga scala per la navigazione robotica off-road che offre mappe di traversabilità 3D generate automaticamente e dati sensoriali sincronizzati (LiDAR, telecamere e radar) per abilitare la previsione di terreni percorribili senza annotazione manuale.

Konyul Park, Daehun Kim, Jiyong Oh, Seunghoon Yu, Junseo Park, Jaehyun Park, Hongjae Shin, Hyungchan Cho, Jungho Kim, Jun Won ChoiWed, 11 Ma💻 cs

Evaluating the Practical Effectiveness of LLM-Driven Index Tuning with Microsoft Database Tuning Advisor

Questo studio valuta l'efficacia pratica del tuning degli indici guidato dai LLM confrontandolo con il Database Tuning Advisor (DTA) di Microsoft, rivelando che, sebbene i LLM possano identificare configurazioni superiori in alcuni casi grazie a intuizioni umane, la loro adozione in produzione è attualmente limitata da una significativa variabilità delle prestazioni e da costi di validazione elevati.

Xiaoying Wang, Wentao Wu, Vivek Narasayya, Surajit ChaudhuriWed, 11 Ma💻 cs

Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC

Questo articolo presenta un framework innovativo per la pianificazione del movimento in gare autonome multi-agente ad alta velocità, che combina l'identificazione topologica dei varchi tramite processi gaussiani spaziotemporali e un MPC accelerato per garantire manovre di sorpasso robuste, sicure e computazionalmente efficienti.

Mingyi Zhang, Cheng Hu, Yiqin Wang, Haotong Qin, Hongye Su, Lei XieWed, 11 Ma💻 cs

Hierarchical Observe-Orient-Decide-Act Enabled UAV Swarms in Uncertain Environments: Frameworks, Potentials, and Challenges

Questo articolo propone un framework gerarchico basato sul ciclo OODA (Osserva-Orienta-Decidi-Agisci) distribuito su livelli cloud-edge-terminal e potenziato dalla virtualizzazione delle funzioni di rete, per migliorare l'adattabilità, l'efficienza e il processo decisionale cooperativo degli sciami di droni in ambienti incerti.

Ziye Jia, Yao Wu, Qihui Wu, Lijun He, Qiuming Zhu, Fuhui Zhou, Zhu HanWed, 11 Ma💻 cs

WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors

Il paper presenta WESPR, un framework rapido che integra percezione geometrica e dati meteorologici per prevedere i campi di vento locali e adattare proattivamente la pianificazione e il controllo dei droni, migliorando significativamente stabilità e precisione di volo in ambienti turbolenti.

Khuzema Habib, Pranav Deshakulkarni Manjunath, Kasra Torshizi, Troi Williams, Pratap TokekarWed, 11 Ma💻 cs

Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints

Questo articolo propone un framework di apprendimento metrico basato su descrittori geometrici invarianti (angoli inter-articolari) derivati da punti chiave statici delle mani, che supera i limiti delle rappresentazioni coordinate tradizionali consentendo un trasferimento cross-linguistico efficace nel riconoscimento della lingua dei segni con pochi esempi.

Chayanin Chamachot, Kanokphan LertniponphanWed, 11 Ma💻 cs

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Il paper introduce PIM-SHERPA, un metodo software che risolve le inconsistenze negli attributi e nel layout della memoria per abilitare un'efficiente inferenza di modelli linguistici di grandi dimensioni (LLM) su dispositivi edge tramite Processing-in-Memory (PIM), ottenendo risparmi significativi nella capacità di memoria senza compromettere le prestazioni.

Sunjung Lee, Sanghoon Cha, Hyeonsu Kim, Seungwoo Seo, Yuhwan Ro, Sukhan Lee, Byeongho Kim, Yongjun Park, Kyomin Sohn, Seungwon Lee, Jaehoon YuWed, 11 Ma💻 cs

TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy

Il paper presenta TubeMLLM, un modello fondazionale multimodale che integra conoscenze topologiche tramite prompt testuali e un'architettura condivisa per migliorare la percezione e la generazione coerente di anatomie vascolari, superando gli attuali limiti di consistenza topologica e dimostrando prestazioni all'avanguardia in compiti zero-shot su diverse modalità di imaging medico.

Yaoyu Liu, Minghui Zhang, Xin You, Hanxiao Zhang, Yun GuWed, 11 Ma💻 cs

Distributed Convolutional Neural Networks for Object Recognition

Questo articolo propone una nuova funzione di perdita per le reti neurali convoluzionali distribuite (DisCNN) che, mappando i campioni positivi in uno spazio compatto e quelli negativi nell'origine, estrae esclusivamente le caratteristiche della classe positiva, garantendo un'architettura leggera, un'eccellente generalizzazione su dati non visti e una rilevazione efficace degli oggetti in contesti complessi.

Liang SunWed, 11 Ma💻 cs