cs.LG articoli | Gist.Science

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Il paper introduce un nuovo framework e dataset per valutare l'informatività orientata alle decisioni dei modelli visione-linguaggio nel settore alberghiero, rivelando che, sebbene le prestazioni migliorino con un fine-tuning specifico, i modelli attuali non sono intrinsecamente consapevoli delle esigenze informative degli utenti.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

Questo articolo propone il framework CTP (Contrastive Tensor Pre-training), che supera i limiti dell'allineamento a coppie delle modalità sostituendo la similarità coseno con un tensore di similarità multimodale per ottenere un allineamento unificato e coerente di testo, immagini e nuvole di punti, migliorando così le prestazioni dei sistemi di guida autonoma.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Questo articolo introduce un quadro teorico basato sul filtraggio particellare per analizzare e migliorare i metodi di inferenza parallela nei modelli linguistici, identificando sia criteri per garantire l'accuratezza del campionamento sia limiti fondamentali intrinseci a tali approcci.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

Il paper introduce VLM-SubtleBench, un nuovo benchmark progettato per valutare la capacità dei modelli visione-linguaggio di distinguere sottili differenze visive in ambiti diversificati come quello medico e industriale, rivelando un significativo divario tra le prestazioni attuali dei modelli e quelle umane.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Questo studio presenta un quadro decisionale probabilistico che combina modelli di intelligenza artificiale con un modello statistico delle aspettative degli agricoltori per generare previsioni monsoniche più accurate, le quali sono state implementate con successo nel 2025 per fornire informazioni cruciali a 38 milioni di agricoltori indiani.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

Il paper introduce SMGI, una teoria strutturale dell'intelligenza artificiale generale che ridefinisce l'apprendimento come evoluzione controllata dell'interfaccia di apprendimento, formalizzando un modello meta-strutturale che unifica e generalizza approcci esistenti come l'empirical risk minimization, il reinforcement learning e i modelli basati su prior di programma.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Il paper presenta LeJOT-AutoML, un framework AutoML guidato da agenti LLM che automatizza l'ingegneria delle caratteristiche per la previsione dei tempi di esecuzione su Databricks, riducendo drasticamente i cicli di sviluppo e ottenendo un risparmio dei costi del 19,01% grazie a una migliore ottimizzazione dell'orchestrazione dei job.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

Il paper propone E²OAL, un quadro unificato e privo di rilevatori per l'apprendimento attivo in scenari open-set che sfrutta le classi sconosciute etichettate attraverso clustering strutturale e calibrazione Dirichlet per migliorare simultaneamente la precisione, l'efficienza e la discriminazione delle classi note.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Questo studio propone un Framework Transformer Bayesiano che integra tre meccanismi di incertezza complementari in un'architettura PatchTST per ottenere previsioni probabilistiche del carico elettrico altamente calibrate e robuste, superando le prestazioni degli attuali modelli di deep learning su diversi dataset delle reti elettriche, specialmente durante eventi meteorologici estremi.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

Il paper presenta NaviDriveVLM, un framework decoupled che separa il ragionamento di alto livello dalla pianificazione del movimento utilizzando un grande modello "Navigator" e un driver leggero, ottenendo prestazioni superiori rispetto ai modelli VLM esistenti nel benchmark nuScenes.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

Il paper presenta DyQ-VLA, un framework di quantizzazione dinamica per modelli Vision-Language-Action che, sfruttando proxy cinematici in tempo reale per adattare dinamicamente la precisione dei bit, riduce l'ingombro di memoria del 69,1% mantenendo il 99,5% delle prestazioni originali e accelerando l'esecuzione sia in simulazione che nel mondo reale.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Il paper introduce Rel-MOSS, un nuovo approccio di apprendimento profondo relazionale che affronta il problema dello squilibrio delle classi nei database relazionali mediante un sintetizzatore di minoranza guidato dalle relazioni e un controllore di gate relazionale, ottenendo prestazioni superiori rispetto agli stati dell'arte su 12 dataset.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

Questo lavoro propone un framework di trasferimento robusto per MDP che, integrando informazioni secondarie come vincoli sui momenti delle caratteristiche e distanze distribuzionali all'interno di insiemi di incertezza centrati sulla stima, genera politiche ottimali nel caso peggiore con minori livelli di conservatorismo e una maggiore efficienza nel campionamento rispetto agli approcci tradizionali.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Il paper propone un framework AI modulare che utilizza l'analisi semantica e sintattica delle definizioni SQL per assegnare punteggi di rischio alle metriche aggregate in ambito sanitario, consentendo una governance proattiva della privacy e la condivisione sicura dei dati tra diversi dipartimenti senza accedere a informazioni sensibili.

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

Il paper presenta ELLMob, un framework basato su LLM auto-allineati e sul primo dataset annotato con eventi, progettato per generare traiettorie umane realistiche che bilanciano efficacemente le abitudini individuali con i vincoli imposti da eventi su larga scala come tifoni, pandemie e Olimpiadi.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

Gli autori sviluppano una pipeline di apprendimento per rinforzo che semplifica i diagrammi di nodi, dimostrando la sua efficacia su nodi banali complessi e recuperando il limite superiore sorprendente di tre per il numero di svincolo del nodo composto $4_1\#9_{10}$ .

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

Il documento presenta PSTNet, una rete neurale leggera e fisicamente strutturata che integra principi aerodinamici fondamentali per stimare in tempo reale l'intensità della turbolenza atmosferica su microcontrollori, offrendo un'alternativa efficiente e più accurata ai modelli tradizionali per i sistemi di guida aerei.

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

Il paper propone la Local Constrained Bayesian Optimization (LCBO), un nuovo framework che supera le limitazioni dei metodi a regione di fiducia nei problemi vincolati ad alta dimensionalità alternando discesa locale ed esplorazione guidata dall'incertezza, garantendo teoricamente un tasso di convergenza polinomiale rispetto alla dimensionalità e dimostrando prestazioni superiori rispetto agli stati dell'arte su benchmark fino a 100 dimensioni.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Il paper presenta architetture di potenziali interatomici basati su apprendimento automatico che utilizzano miscele di esperti (MoE) e miscele di esperti lineari (MoLE), dimostrando che l'attivazione sparsa con esperti condivisi e il routing elemento per elemento migliorano significativamente l'accuratezza e la stabilità, ottenendo risultati all'avanguardia su diversi benchmark e rivelando una specializzazione degli esperti allineata alle tendenze della tavola periodica.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

$OneMillion-Bench: How Far are Language Agents from Human Experts?

Il paper introduce $OneMillion-Bench, un nuovo benchmark composto da 400 task curati da esperti in ambiti professionali critici come diritto e finanza, progettato per valutare la capacità dei agenti linguistici di gestire scenari complessi del mondo reale attraverso un protocollo di valutazione basato su rubriche che misura accuratezza, coerenza logica e conformità professionale.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG

← Precedente Successivo →