cs.LG artigos | Gist.Science

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Este trabalho introduz o framework "Informativeness" e um novo conjunto de dados específico para o setor de hospitalidade a fim de avaliar a capacidade de Modelos Visuais-Linguísticos (VLMs) em fornecer informações úteis para a tomada de decisão, revelando que, embora esses modelos necessitem de ajuste fino específico para o domínio, eles podem se tornar eficazes ao identificar sinais visuais-chave para necessidades informativas dos usuários.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

Este artigo propõe o framework de Pré-treinamento de Tensor Contrastivo (CTP), que supera as limitações do alinhamento por pares ao realizar um alinhamento unificado e simultâneo de múltiplas modalidades (texto, imagem e nuvem de pontos) em um espaço de incorporação comum, melhorando assim a compreensão de cena para a condução autônoma.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Este artigo utiliza o filtro de partículas (SMC) para analisar teoricamente e empiricamente o compromisso entre custo e precisão em métodos de inferência de linguagem que agregam múltiplas amostras, identificando critérios de garantia, melhorias algorítmicas e limites fundamentais, embora os resultados empíricos sugiram que a precisão final dependa de fatores além do erro de amostragem.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

Este trabalho apresenta o VLM-SubtleBench, um novo benchmark que avalia a capacidade de raciocínio comparativo sutil de modelos de visão e linguagem (VLMs) em dez tipos de diferenças e diversos domínios, revelando lacunas significativas entre o desempenho desses modelos e o humano.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Este artigo apresenta um sistema de previsão de monções baseado em inteligência artificial e inferência bayesiana, desenvolvido sob uma estrutura de teoria da decisão para atender às necessidades heterogêneas dos agricultores, o que resultou na entrega operacional de previsões personalizadas a 38 milhões de agricultores na Índia em 2025.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

O artigo apresenta a SMGI, uma teoria estrutural de inteligência artificial geral que redefine o aprendizado como a evolução controlada da interface de aprendizagem, formalizando um modelo meta-estrutural dinâmico e provando que abordagens clássicas e modernas são instâncias restritas desse quadro unificado.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

O artigo apresenta o LeJOT-AutoML, um framework impulsionado por agentes de IA que automatiza a engenharia de características para prever o tempo de execução de jobs no Databricks, reduzindo o ciclo de desenvolvimento de semanas para minutos e gerando economias de custos de 19,01% através de uma orquestração mais eficiente.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

O artigo propõe o E²OAL, um quadro unificado e sem detectores para aprendizado ativo em conjunto aberto que elimina a sobrecarga de treinamento ao explorar rótulos de classes desconhecidas para melhorar a discriminação de classes conhecidas e a calibração, superando consistentemente os métodos mais avançados em precisão e eficiência.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Este artigo propõe um Transformer Bayesiano inovador que integra múltiplos mecanismos de incerteza em uma arquitetura PatchTST para realizar previsões de carga probabilísticas altamente calibradas e robustas em redes inteligentes, superando significativamente os modelos existentes em precisão e confiabilidade durante eventos climáticos extremos.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

O artigo apresenta o NaviDriveVLM, um framework decoplado que separa o raciocínio de alto nível de um grande modelo "Navigator" da geração de ações de um "Driver" leve, superando os modelos VLM existentes em planejamento de movimento para direção autônoma no benchmark nuScenes ao equilibrar eficiência de treinamento e capacidade de interpretação.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

O artigo apresenta o DyQ-VLA, um framework de quantização dinâmica para modelos de Visão-Linguagem-Ação que, ao utilizar proxies cinemáticos em tempo real para ajustar dinamicamente a precisão dos bits, reduz significativamente a pegada de memória e acelera a inferência sem comprometer o desempenho.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

O artigo apresenta o Rel-MOSS, um novo método de aprendizado profundo relacional que utiliza um controlador de portas por tipo de relação e um sintetizador guiado por relações para realizar sobreamostragem de entidades minoritárias, resolvendo eficazmente o problema de desequilíbrio de classes em bancos de dados relacionais e superando os métodos atuais em precisão balanceada e média geométrica.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

Este artigo propõe um framework de aprendizado por transferência robusto que utiliza informações auxiliares para construir conjuntos de incerteza centrados na estimativa, permitindo políticas otimizadas para o pior caso em ambientes com grandes deslocamentos que são menos conservadoras e mais eficientes em termos de amostragem do que os métodos tradicionais.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Este artigo propõe um framework de IA modular que utiliza análise semântica e sintética de consultas SQL para atribuir pontuações de risco a métricas agregadas em instituições de saúde, permitindo a governança de dados proativa e a prevenção de violações de privacidade antes da execução das consultas.

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

O artigo apresenta o ELLMob, um framework baseado em LLM que gera trajetórias humanas realistas durante grandes eventos sociais, superando as limitações de métodos anteriores ao utilizar a Teoria do Rastro Difuso para alinhar padrões habituais com restrições impostas por eventos, apoiado pelo primeiro conjunto de dados anotados com eventos.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

Os autores desenvolveram um pipeline de aprendizado por reforço para simplificar diagramas de nós, que foi testado com sucesso em nós triviais difíceis e na soma de nós $4_1\#9_{10}$, onde recuperou o limite superior surpreendente de três para o número de desenovelamento.

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

O artigo apresenta o PSTNet, uma rede neural leve e estruturada fisicamente que integra princípios da teoria atmosférica para estimar a intensidade da turbulência em tempo real com alta precisão e eficiência computacional, sendo ideal para sistemas de navegação aérea em veículos hipersônicos e ambientes com recursos limitados.

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

O artigo propõe a Otimização Bayesiana Local Constrained (LCBO), um novo framework que supera os desafios de otimização em alta dimensão com restrições complexas ao alternar entre descida local e exploração guiada pela incerteza, garantindo taxas de convergência polinomiais e superando os métodos atuais em benchmarks de até 100 dimensões.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Este artigo apresenta o desenvolvimento e análise de arquiteturas de Mistura de Especialistas (MoE) e Mistura de Especialistas Lineares (MoLE) para Potenciais Interatômicos Baseados em Aprendizado de Máquina (MLIPs), demonstrando que o uso de ativação esparsa com especialistas compartilhados e roteamento elemento a elemento resulta em um modelo com precisão de última geração e especialização química interpretável.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

O artigo apresenta o \$OneMillion-Bench, um novo benchmark composto por 400 tarefas curadas por especialistas em áreas como Direito, Finanças e Saúde, projetado para avaliar a confiabilidade e a profundidade profissional de agentes de linguagem em cenários complexos do mundo real que exigem raciocínio de longo prazo e uso de ferramentas, superando as limitações dos testes existentes.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG

← Anterior Próximo →