cs.LG artigos | Gist.Science

How Reliable is Language Model Micro-Benchmarking?

O artigo conclui que o micro-benchmarking de linguagem frequentemente falha em classificar modelos de forma consistente em comparação com benchmarks completos ou até mesmo amostras aleatórias, exigindo tamanhos de amostra tão grandes que comprometem sua eficiência e utilidade prática.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

O artigo apresenta o CanvasMAR, um modelo autoregressivo inovador para previsão de vídeo que utiliza uma "tela" global desfocada e um currículo de amostragem do fácil ao difícil para gerar vídeos de alta fidelidade com menos etapas de amostragem, superando métodos anteriores e rivalizando com abordagens baseadas em difusão.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Este artigo demonstra que a injeção de informações por meio de um verificador de dados sintéticos externo pode evitar o colapso de modelos durante o re-treinamento iterativo, proporcionando melhorias de curto prazo, embora a convergência de longo prazo seja limitada ao "centro de conhecimento" do próprio verificador.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Este artigo propõe um novo método de análise de alcançabilidade baseado em intervalos para Redes Neurais de Equações Diferenciais Ordinárias (Neural ODEs), que utiliza técnicas de monotonicidade mista para oferecer aproximações superiores computacionalmente eficientes e adequadas a aplicações de alta dimensão e tempo real, priorizando a eficiência em detrimento da precisão máxima.

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

Este artigo apresenta um framework online que utiliza a decomposição de modo dinâmico de Hankel (Hankel-DMD) com projeção de Cadzow e thresholding de valor singular para aprender em tempo real modelos preditivos não lineares de obstáculos dinâmicos, permitindo a remoção de ruído e a previsão de trajetórias para planejamento de movimento robótico seguro.

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

O artigo apresenta o KLASS, um método de amostragem adaptativa que acelera significativamente a inferência em modelos de difusão mascarada ao identificar e desmascarar múltiplos tokens estáveis em cada iteração, alcançando ganhos de velocidade de até 2,78 vezes e melhor desempenho sem necessidade de treinamento adicional.

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

O artigo propõe o CADM, uma métrica de distância adaptativa e personalizada por cluster para agrupamento de dados categóricos e mistos, que considera as diferentes distribuições de atributos em cada cluster para superar limitações de medições tradicionais, demonstrando alto desempenho em experimentos com quatorze conjuntos de dados.

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

O artigo apresenta o FireScope, um novo framework baseado em modelos de linguagem visual que utiliza raciocínio passo a passo para prever mapas de risco de incêndio com alta generalização entre continentes, apoiado pelo conjunto de dados e benchmark FireScope-Bench.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

O artigo apresenta o EgoCogNav, um framework de navegação egocêntrica multimodal que prevê incerteza percebida como estado latente para antecipar trajetórias e movimentos da cabeça, apoiado pelo novo conjunto de dados CEN que captura comportamentos de navegação em cenários reais.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

O artigo apresenta o SPINE, um framework de aprendizado por reforço em tempo de teste que seleciona tokens decisivos para atualizações e aplica regularização por banda de entropia, melhorando a estabilidade e o desempenho de modelos de linguagem sem necessidade de rótulos ou modelos de recompensa.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

O artigo apresenta o DAISI, um algoritmo de assimilação de dados escalável baseado em modelos generativos de fluxo que supera as limitações das aproximações gaussianas tradicionais ao utilizar uma amostragem inversa inovadora para integrar previsões de modelos dinâmicos complexos com observações esparsas e ruidosas.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

O artigo apresenta o SQDF, um novo método de ajuste fino para modelos de difusão que utiliza um gradiente de política reparametrizado baseado na função Soft Q para mitigar a superotimização de recompensas, preservando a diversidade e a naturalidade das amostras geradas.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Este trabalho propõe um método que utiliza a família de divergências $\alpha$ para aproximar uma distribuição-alvo filtrada, permitindo controlar o compromisso entre precisão e diversidade em modelos de linguagem e alcançando desempenho superior em provas de teoremas ao superar as limitações de perda de diversidade típicas do Aprendizado por Reforço.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

O artigo apresenta o A-3PO, uma abordagem que acelera o treinamento assíncrono de modelos de linguagem grandes ao aproximar a política proximal necessária no PPO desacoplado via interpolação simples, eliminando a sobrecarga computacional de uma passagem extra e alcançando um aumento de velocidade de 1,8x sem comprometer o desempenho.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

O artigo apresenta o DFIR-DETR, um detector baseado em transformers que melhora a detecção de objetos pequenos em cenas complexas através da Aggregação Dinâmica de Conteúdo-Recursos (DCFA), da Pirâmide de Recursos Dinâmica (DFPN) e do Refinamento Iterativo no Domínio da Frequência (FIRC3), alcançando desempenho superior com eficiência computacional reduzida.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Two-dimensional RMSD projections for reaction path visualization and validation

Este artigo apresenta um método de visualização e validação de caminhos de reação que mapeia trajetórias em projeções bidimensionais baseadas em RMSD corrigido por permutação, utilizando superfícies de energia coloridas geradas por processos gaussianos para superar as limitações das análises unidimensionais tradicionais e permitir a comparação estrutural de diferentes métodos de otimização.

Rohit Goswami2026-03-09🔬 cond-mat.mtrl-sci

Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

Este artigo apresenta um novo framework que combina seleção de subconjuntos submodulares com estimativa de incerteza baseada em gradientes para melhorar a robustez e a fidelidade da explicabilidade visual sob mudanças de distribuição, superando as limitações dos métodos existentes em cenários fora da distribuição (OOD) e também em cenários dentro da distribuição (ID).

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Este artigo propõe uma nova métrica de sensibilidade global baseada em Curvas de Expectativa Condicional Individual (ICE) para superar as limitações dos Gráficos de Dependência Parcial (PDP) na presença de interações fortes, demonstrando matematicamente sua superioridade e validando-a em casos de engenharia aeroespacial e eólica através de comparações com métodos como SHAP e índices de Sobol'.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

Este artigo apresenta uma abordagem inovadora de Análise Topológica de Dados (TDA) baseada em patches para imagens de tomografia computadorizada (CT), que supera os métodos tradicionais de complexo cúbico e características radiômicas em precisão, sensibilidade e eficiência computacional, sendo disponibilizada através do pacote Python Patch-TDA.

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

O artigo apresenta o Hyper++, um novo agente de aprendizado por reforço em geometria hiperbólica que supera desafios de otimização através de regularização de características, perda categórica de valor e camadas de rede reformuladas, garantindo treinamento estável e desempenho superior em benchmarks como ProcGen e Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

← Anterior Próximo →