Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

O artigo apresenta o VIP, uma estratégia de alocação de rolagens adaptativa que utiliza um modelo de processo gaussiano para prever probabilidades de sucesso e otimizar a distribuição do orçamento computacional, minimizando a variância do gradiente e melhorando a eficiência de amostragem no aprendizado por reforço com recompensas verificáveis.

Hieu Trung Nguyen, Bao Nguyen, Wenao Ma + 3 more2026-03-06💻 cs

LatentChem: From Textual CoT to Latent Thinking in Chemical Reasoning

O artigo apresenta o LatentChem, uma interface de raciocínio latente que desacopla o cálculo químico da geração textual, permitindo que modelos realizem inferências complexas diretamente no espaço contínuo, o que resulta em uma precisão superior e um aumento de 10,84 vezes na velocidade de inferência em comparação com métodos tradicionais de Cadeia de Pensamento explícita.

Xinwu Ye, Yicheng Mao, Jia Zhang + 16 more2026-03-06🔬 physics

Beyond the Unit Hypersphere: Embedding Magnitude in Contrastive Learning

O artigo demonstra que, ao contrário da similaridade de cosseno tradicional que trata a magnitude dos embeddings como ruído, aprender e controlar seletivamente a magnitude de consultas e documentos melhora significativamente a recuperação e a geração aumentada por recuperação (RAG), especialmente em cenários de generalização fora de domínio, ao identificar que normalizar apenas um lado é mais eficaz e que a magnitude da consulta modula os gradientes enquanto a do documento escala as pontuações de inferência.

Xincan Feng, Taro Watanabe2026-03-06💻 cs

Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

Este artigo propõe o TAPINN, uma arquitetura de Redes Neurais Informadas pela Física que utiliza Regularização Métrica Supervisionada e Otimização Alternada para mitigar o viés espectral e o colapso de modos em sistemas dinâmicos com transições de regime abruptas, alcançando uma convergência estável e maior precisão física com menos parâmetros do que os métodos existentes.

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

Este estudo empírico demonstra que, embora as Redes Kolmogorov-Arnold (KANs) sejam competitivas em resíduos polinomiais univariados, elas apresentam fragilidade hiperparamétrica e instabilidade em configurações profundas, falhando consistentemente na recuperação de termos multiplicativos em sistemas oscilatórios e sendo superadas por MLPs padrão.

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich2026-03-06🔬 physics

Curriculum Learning for Efficient Chain-of-Thought Distillation via Structure-Aware Masking and GRPO

Este artigo apresenta um framework de aprendizado curricular em três etapas que utiliza mascaramento estrutural e otimização de política relativa em grupo (GRPO) para distilar raciocínio de cadeia de pensamento de modelos grandes em modelos menores, resultando em ganhos significativos de precisão e redução no comprimento das respostas.

Bowen Yu, Maolin Wang, Sheng Zhang + 7 more2026-03-06💻 cs

CityGuard: Graph-Aware Private Descriptors for Bias-Resilient Identity Search Across Urban Cameras

O CityGuard é um framework baseado em transformadores que utiliza aprendizado de métricas adaptativo, atenção condicional espacial e mapas de incorporação com privacidade diferencial para permitir a busca de identidade privada e resiliente a vieses em câmeras urbanas distribuídas, garantindo precisão na reidentificação sem compartilhar imagens brutas.

Rong Fu, Yibo Meng, Jia Yee Tan + 5 more2026-03-06💻 cs

Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials

O artigo apresenta o Zatom-1, o primeiro modelo fundamental de código aberto e ponta a ponta que unifica a aprendizagem generativa e preditiva de moléculas e materiais 3D, utilizando um objetivo de correspondência de fluxo multimodal para superar as limitações de abordagens anteriores, acelerar a inferência e permitir transferência positiva de conhecimento entre domínios químicos.

Alex Morehead, Miruna Cretu, Antonia Panescu + 14 more2026-03-06🔬 cond-mat.mtrl-sci