Biased Generalization in Diffusion Models

Este artigo desafia a prática comum de interromper o treinamento de modelos de difusão no mínimo da perda de teste, identificando e quantificando uma fase de "generalização enviesada" em que o modelo continua a reduzir o erro enquanto gera amostras excessivamente próximas aos dados de treinamento devido à natureza sequencial da aprendizagem de características, o que representa um risco crítico para aplicações que exigem privacidade.

Jerome Garnier-Brun, Luca Biggio, Davide Beltrame + 2 more2026-03-05🤖 cs.LG

When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning

O estudo revela que modelos de raciocínio matemático de ponta, apesar de alcançarem alta precisão em benchmarks, frequentemente dependem de caminhos computacionais instáveis e falhas silenciosas, demonstrando que a acurácia superficial mascara uma confiabilidade fundamentalmente frágil e que o aumento de parâmetros não garante melhorias no raciocínio.

Subramanyam Sahoo, Aman Chadha, Vinija Jain + 1 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

O artigo apresenta o MasCOR, um quadro de co-otimização assistido por aprendizado de máquina que supera as limitações da programação matemática ao integrar design e operação em tempo real de sistemas de e-combustíveis sob incerteza renovável, demonstrando sua eficácia na identificação de estratégias específicas para locais na produção de e-metanol na Europa.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators

Este trabalho aborda os desafios de confiabilidade em aceleradores neurais de computação em memória, demonstrando como pequenas variações de dispositivos podem causar falhas críticas e propondo soluções de co-design entre hardware e algoritmos, como o mecanismo SWIM e técnicas de treinamento robusto, para garantir inferência segura e eficiente.

Yifan Qin, Jiahao Zheng, Zheyu Yan + 3 more2026-03-05🤖 cs.LG

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Este artigo apresenta um quadro diagnóstico sistemático para quantificar a instabilidade das classificações de métodos de inferência de redes reguladoras gênicas sob diferentes protocolos de avaliação, revelando que as reversões de ranking são impulsionadas por mudanças na capacidade discriminativa relativa dos métodos e não por efeitos de taxa base, o que desafia suposições comuns na área.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Este estudo apresenta uma nova abordagem baseada em um Transformer Bayesiano de Alta Resolução com aprendizado supervisionado fraco geograficamente ponderado, que funde dados de Sentinel-1, RCM e AMSR2 para gerar mapas de concentração de gelo marinho no Ártico com resolução de 200 metros e estimativas de incerteza confiáveis, superando desafios como características sutis do gelo e rótulos imperfeitos.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Este trabalho apresenta o OrbEvo, um modelo baseado em transformadores gráficos equivariantes que aprende a evolução temporal das funções de onda em DFT dependente do tempo, permitindo previsões eficientes e precisas de propriedades físicas como espectros de absorção óptica e momentos de dipolo sob excitação externa.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Este estudo propõe um framework de quantificação de incerteza no nível de logits para analisar imagens de histopatologia usando Modelos Visão-Linguagem, demonstrando que, apesar da alta sensibilidade estocástica e da baixa influência da temperatura, essa abordagem é essencial para avaliar a confiabilidade desses modelos em aplicações médicas.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

O artigo demonstra que a variância direcional CDNV, uma quantidade geométrica que mede a variabilidade ao longo das direções de separação de classes, é o fator central que explica tanto a forte transferência em cenários de poucos exemplos quanto a baixa interferência entre múltiplas tarefas no aprendizado auto-supervisionado, ao garantir que os eixos de decisão permaneçam quase ortogonais.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed 🤖 cs.AI

Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs

Este artigo propõe um framework de aprendizado online para verificadores de raciocínio passo a passo que caracteriza os limites de erro através de extensões da dimensão Littlestone, otimiza o compromisso entre completude e correção para reduzir erros, e demonstra como esses verificadores podem aprimorar a precisão de provadores fracos, permitindo a geração de provas além de sua distribuição de treinamento.

Maria-Florina Balcan, Avrim Blum, Kiriaki Fragkia + 2 more2026-03-05🤖 cs.LG

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Este artigo propõe uma arquitetura de integração GNSS/IMU em tempo real baseada em Otimização de Grafos de Fatores (FGO) para ambientes urbanos desafiadores, demonstrando que, embora haja uma redução na precisão de posicionamento em comparação com métodos de processamento em lote, a abordagem oferece maior disponibilidade de serviço e eficiência computacional, estabelecendo um equilíbrio crítico entre precisão, disponibilidade e desempenho em tempo real.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG