Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Este trabalho introduz o framework "Informativeness" e um novo conjunto de dados específico para o setor de hospitalidade a fim de avaliar a capacidade de Modelos Visuais-Linguísticos (VLMs) em fornecer informações úteis para a tomada de decisão, revelando que, embora esses modelos necessitem de ajuste fino específico para o domínio, eles podem se tornar eficazes ao identificar sinais visuais-chave para necessidades informativas dos usuários.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Este artigo utiliza o filtro de partículas (SMC) para analisar teoricamente e empiricamente o compromisso entre custo e precisão em métodos de inferência de linguagem que agregam múltiplas amostras, identificando critérios de garantia, melhorias algorítmicas e limites fundamentais, embora os resultados empíricos sugiram que a precisão final dependa de fatores além do erro de amostragem.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Este artigo apresenta um sistema de previsão de monções baseado em inteligência artificial e inferência bayesiana, desenvolvido sob uma estrutura de teoria da decisão para atender às necessidades heterogêneas dos agricultores, o que resultou na entrega operacional de previsões personalizadas a 38 milhões de agricultores na Índia em 2025.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

O artigo apresenta o LeJOT-AutoML, um framework impulsionado por agentes de IA que automatiza a engenharia de características para prever o tempo de execução de jobs no Databricks, reduzindo o ciclo de desenvolvimento de semanas para minutos e gerando economias de custos de 19,01% através de uma orquestração mais eficiente.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

O artigo propõe o E²OAL, um quadro unificado e sem detectores para aprendizado ativo em conjunto aberto que elimina a sobrecarga de treinamento ao explorar rótulos de classes desconhecidas para melhorar a discriminação de classes conhecidas e a calibração, superando consistentemente os métodos mais avançados em precisão e eficiência.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

O artigo apresenta o NaviDriveVLM, um framework decoplado que separa o raciocínio de alto nível de um grande modelo "Navigator" da geração de ações de um "Driver" leve, superando os modelos VLM existentes em planejamento de movimento para direção autônoma no benchmark nuScenes ao equilibrar eficiência de treinamento e capacidade de interpretação.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

O artigo apresenta o DyQ-VLA, um framework de quantização dinâmica para modelos de Visão-Linguagem-Ação que, ao utilizar proxies cinemáticos em tempo real para ajustar dinamicamente a precisão dos bits, reduz significativamente a pegada de memória e acelera a inferência sem comprometer o desempenho.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

O artigo apresenta o Rel-MOSS, um novo método de aprendizado profundo relacional que utiliza um controlador de portas por tipo de relação e um sintetizador guiado por relações para realizar sobreamostragem de entidades minoritárias, resolvendo eficazmente o problema de desequilíbrio de classes em bancos de dados relacionais e superando os métodos atuais em precisão balanceada e média geométrica.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

O artigo apresenta o ELLMob, um framework baseado em LLM que gera trajetórias humanas realistas durante grandes eventos sociais, superando as limitações de métodos anteriores ao utilizar a Teoria do Rastro Difuso para alinhar padrões habituais com restrições impostas por eventos, apoiado pelo primeiro conjunto de dados anotados com eventos.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Este artigo apresenta o desenvolvimento e análise de arquiteturas de Mistura de Especialistas (MoE) e Mistura de Especialistas Lineares (MoLE) para Potenciais Interatômicos Baseados em Aprendizado de Máquina (MLIPs), demonstrando que o uso de ativação esparsa com especialistas compartilhados e roteamento elemento a elemento resulta em um modelo com precisão de última geração e especialização química interpretável.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

O artigo apresenta o \$OneMillion-Bench, um novo benchmark composto por 400 tarefas curadas por especialistas em áreas como Direito, Finanças e Saúde, projetado para avaliar a confiabilidade e a profundidade profissional de agentes de linguagem em cenários complexos do mundo real que exigem raciocínio de longo prazo e uso de ferramentas, superando as limitações dos testes existentes.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG