Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Il paper introduce un nuovo framework e dataset per valutare l'informatività orientata alle decisioni dei modelli visione-linguaggio nel settore alberghiero, rivelando che, sebbene le prestazioni migliorino con un fine-tuning specifico, i modelli attuali non sono intrinsecamente consapevoli delle esigenze informative degli utenti.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Questo articolo introduce un quadro teorico basato sul filtraggio particellare per analizzare e migliorare i metodi di inferenza parallela nei modelli linguistici, identificando sia criteri per garantire l'accuratezza del campionamento sia limiti fondamentali intrinseci a tali approcci.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Questo studio presenta un quadro decisionale probabilistico che combina modelli di intelligenza artificiale con un modello statistico delle aspettative degli agricoltori per generare previsioni monsoniche più accurate, le quali sono state implementate con successo nel 2025 per fornire informazioni cruciali a 38 milioni di agricoltori indiani.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Il paper presenta LeJOT-AutoML, un framework AutoML guidato da agenti LLM che automatizza l'ingegneria delle caratteristiche per la previsione dei tempi di esecuzione su Databricks, riducendo drasticamente i cicli di sviluppo e ottenendo un risparmio dei costi del 19,01% grazie a una migliore ottimizzazione dell'orchestrazione dei job.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Questo studio propone un Framework Transformer Bayesiano che integra tre meccanismi di incertezza complementari in un'architettura PatchTST per ottenere previsioni probabilistiche del carico elettrico altamente calibrate e robuste, superando le prestazioni degli attuali modelli di deep learning su diversi dataset delle reti elettriche, specialmente durante eventi meteorologici estremi.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

Il paper presenta DyQ-VLA, un framework di quantizzazione dinamica per modelli Vision-Language-Action che, sfruttando proxy cinematici in tempo reale per adattare dinamicamente la precisione dei bit, riduce l'ingombro di memoria del 69,1% mantenendo il 99,5% delle prestazioni originali e accelerando l'esecuzione sia in simulazione che nel mondo reale.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Il paper introduce Rel-MOSS, un nuovo approccio di apprendimento profondo relazionale che affronta il problema dello squilibrio delle classi nei database relazionali mediante un sintetizzatore di minoranza guidato dalle relazioni e un controllore di gate relazionale, ottenendo prestazioni superiori rispetto agli stati dell'arte su 12 dataset.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

Questo lavoro propone un framework di trasferimento robusto per MDP che, integrando informazioni secondarie come vincoli sui momenti delle caratteristiche e distanze distribuzionali all'interno di insiemi di incertezza centrati sulla stima, genera politiche ottimali nel caso peggiore con minori livelli di conservatorismo e una maggiore efficienza nel campionamento rispetto agli approcci tradizionali.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

Il paper propone la Local Constrained Bayesian Optimization (LCBO), un nuovo framework che supera le limitazioni dei metodi a regione di fiducia nei problemi vincolati ad alta dimensionalità alternando discesa locale ed esplorazione guidata dall'incertezza, garantendo teoricamente un tasso di convergenza polinomiale rispetto alla dimensionalità e dimostrando prestazioni superiori rispetto agli stati dell'arte su benchmark fino a 100 dimensioni.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Il paper presenta architetture di potenziali interatomici basati su apprendimento automatico che utilizzano miscele di esperti (MoE) e miscele di esperti lineari (MoLE), dimostrando che l'attivazione sparsa con esperti condivisi e il routing elemento per elemento migliorano significativamente l'accuratezza e la stabilità, ottenendo risultati all'avanguardia su diversi benchmark e rivelando una specializzazione degli esperti allineata alle tendenze della tavola periodica.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

$OneMillion-Bench: How Far are Language Agents from Human Experts?

Il paper introduce $OneMillion-Bench, un nuovo benchmark composto da 400 task curati da esperti in ambiti professionali critici come diritto e finanza, progettato per valutare la capacità dei agenti linguistici di gestire scenari complessi del mondo reale attraverso un protocollo di valutazione basato su rubriche che misura accuratezza, coerenza logica e conformità professionale.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG