cs.LG artigos | Gist.Science

Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning

Este artigo propõe um algoritmo minimax ótimo para aprendizado por reforço com observações de estado atrasadas, combinando métodos de augmentação e limites superiores de confiança para alcançar um limite de arrependimento que coincide com o limite inferior teórico.

Harin Lee, Kevin Jamieson2026-03-05🤖 cs.LG

Beyond Pixel Histories: World Models with Persistent 3D State

O artigo apresenta o PERSIST, um novo paradigma de modelo de mundo que simula a evolução de uma cena 3D latente para superar as limitações de consistência e memória espacial dos modelos atuais, permitindo a geração de vídeos interativos com memória espacial persistente, geometria coerente e controle direto no espaço 3D.

Samuel Garcin, Thomas Walker, Steven McDonagh + 5 more2026-03-05🤖 cs.AI

Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation

O artigo apresenta o MasCOR, um quadro de co-otimização assistido por aprendizado de máquina que supera as limitações da programação matemática ao integrar design e operação em tempo real de sistemas de e-combustíveis sob incerteza renovável, demonstrando sua eficácia na identificação de estratégias específicas para locais na produção de e-metanol na Europa.

Jeongdong Kim, Minsu Kim, Jonggeol Na + 1 more2026-03-05🤖 cs.AI

When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators

Este trabalho aborda os desafios de confiabilidade em aceleradores neurais de computação em memória, demonstrando como pequenas variações de dispositivos podem causar falhas críticas e propondo soluções de co-design entre hardware e algoritmos, como o mecanismo SWIM e técnicas de treinamento robusto, para garantir inferência segura e eficiente.

Yifan Qin, Jiahao Zheng, Zheyu Yan + 3 more2026-03-05🤖 cs.LG

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Este artigo apresenta um quadro diagnóstico sistemático para quantificar a instabilidade das classificações de métodos de inferência de redes reguladoras gênicas sob diferentes protocolos de avaliação, revelando que as reversões de ranking são impulsionadas por mudanças na capacidade discriminativa relativa dos métodos e não por efeitos de taxa base, o que desafia suposições comuns na área.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Este estudo apresenta uma nova abordagem baseada em um Transformer Bayesiano de Alta Resolução com aprendizado supervisionado fraco geograficamente ponderado, que funde dados de Sentinel-1, RCM e AMSR2 para gerar mapas de concentração de gelo marinho no Ártico com resolução de 200 metros e estimativas de incerteza confiáveis, superando desafios como características sutis do gelo e rótulos imperfeitos.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

O artigo demonstra que a existência de exemplos adversariais e a falta de robustez em redes neurais decorrem de um desalinhamento exponencial entre as dimensões das variedades perceptivas das máquinas e as dos conceitos humanos, sugerindo que a verdadeira robustez só é alcançável quando essas dimensões são alinhadas.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Este trabalho apresenta o OrbEvo, um modelo baseado em transformadores gráficos equivariantes que aprende a evolução temporal das funções de onda em DFT dependente do tempo, permitindo previsões eficientes e precisas de propriedades físicas como espectros de absorção óptica e momentos de dipolo sob excitação externa.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery

O artigo apresenta o MMAI Gym for Science, um conjunto abrangente de recursos e receitas para treinar um Modelo de Fundação Líquido (LFM) eficiente que supera modelos maiores e generalistas em diversas tarefas de descoberta de fármacos ao dominar a linguagem molecular específica do domínio.

Maksim Kuznetsov, Zulfat Miftahutdinov, Rim Shayakhmetov + 17 more2026-03-05🤖 cs.AI

Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence

Este artigo propõe o Q-Measure-Learning, um método eficiente para aprendizado por reforço em espaços de estado contínuos que utiliza uma medida empírica assinada e integração por kernel para alcançar convergência quase certa e reduzir a complexidade computacional, sendo validado em um cenário de controle de inventário.

Shengbo Wang2026-03-05🤖 cs.LG

Test-Time Meta-Adaptation with Self-Synthesis

O artigo apresenta o MASS, um framework de meta-aprendizado que permite que grandes modelos de linguagem se adaptem no momento do teste gerando dados sintéticos específicos para cada problema e realizando atualizações direcionadas, otimizando o desempenho em tarefas de raciocínio matemático por meio de um processo de otimização em dois níveis.

Zeyneb N. Kaya, Nick Rui2026-03-05🤖 cs.AI

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Este estudo propõe um framework de quantificação de incerteza no nível de logits para analisar imagens de histopatologia usando Modelos Visão-Linguagem, demonstrando que, apesar da alta sensibilidade estocástica e da baixa influência da temperatura, essa abordagem é essencial para avaliar a confiabilidade desses modelos em aplicações médicas.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

O artigo apresenta o mlx-snn, a primeira biblioteca nativa de redes neurais de pulsos (SNN) para Apple Silicon baseada no framework MLX, que oferece modelos de neurônios, métodos de codificação e treinamento eficientes, superando o snnTorch em velocidade e uso de memória em hardware M3 Max.

Jiahao Qin2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

O artigo demonstra que a variância direcional CDNV, uma quantidade geométrica que mede a variabilidade ao longo das direções de separação de classes, é o fator central que explica tanto a forte transferência em cenários de poucos exemplos quanto a baixa interferência entre múltiplas tarefas no aprendizado auto-supervisionado, ao garantir que os eixos de decisão permaneçam quase ortogonais.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Este artigo propõe o RACI, um quadro de aprendizado informado por processos que melhora a previsão de fluxos de carbono em ecossistemas ao tratar a inferência como condicional, separando explicitamente as condições de regime de longo prazo dos drivers dinâmicos de curto prazo para superar a heterogeneidade espaço-temporal.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts

Este artigo avalia empiricamente os trade-offs entre ensembling, merging e routing de modelos de linguagem com parâmetros eficientes, concluindo que o routing oferece os maiores ganhos de desempenho e que técnicas de seleção de especialistas podem mitigar seu custo computacional.

Sanae Lotfi, Lucas Caccia, Alessandro Sordoni + 2 more2026-03-05🤖 cs.LG

Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs

Este artigo propõe um framework de aprendizado online para verificadores de raciocínio passo a passo que caracteriza os limites de erro através de extensões da dimensão Littlestone, otimiza o compromisso entre completude e correção para reduzir erros, e demonstra como esses verificadores podem aprimorar a precisão de provadores fracos, permitindo a geração de provas além de sua distribuição de treinamento.

Maria-Florina Balcan, Avrim Blum, Kiriaki Fragkia + 2 more2026-03-05🤖 cs.LG

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Este artigo propõe uma arquitetura de integração GNSS/IMU em tempo real baseada em Otimização de Grafos de Fatores (FGO) para ambientes urbanos desafiadores, demonstrando que, embora haja uma redução na precisão de posicionamento em comparação com métodos de processamento em lote, a abordagem oferece maior disponibilidade de serviço e eficiência computacional, estabelecendo um equilíbrio crítico entre precisão, disponibilidade e desempenho em tempo real.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Este trabalho apresenta um método de otimização de grafos de fatores (FGO) para integração GNSS-IMU em tempo real e acoplamento rigoroso, que utiliza marginalização com atraso fixo para permitir estimativa causal de estados e demonstrar alta robustez em ambientes urbanos degradados.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Este artigo apresenta um blueprint prático para avaliar e otimizar assistentes de compras conversacionais em produção, introduzindo uma rubrica de avaliação multidimensional e duas estratégias de otimização de prompts baseadas no GEPA — Sub-agent GEPA e MAMuT GEPA — para aprimorar sistemas multi-agente complexos.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

← Anterior Próximo →