Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artigo apresenta um framework hierárquico de dupla estratégia para o esquecimento seletivo em modelos de linguagem grandes aplicados à saúde, que remove conhecimento especializado sensível preservando competências médicas fundamentais com alta eficiência e garantias de privacidade.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

O artigo apresenta o CostNav, um novo benchmark que avalia agentes de IA física com base em análises econômicas realistas e dados industriais, revelando que os métodos atuais de navegação, embora focados no sucesso da tarefa, não são economicamente viáveis para aplicações comerciais no mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artigo introduz o framework PI-MDP e algoritmos de aprendizado por reforço parcialmente equivariantes (PE-DQN e PE-SAC) que mitigam erros de generalização em ambientes com quebra de simetria ao aplicar seletivamente backups de Bellman invariantes ou padrão, resultando em maior eficiência de amostragem e robustez em comparação com métodos existentes.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

O artigo apresenta o AlphaQubit 2, um decodificador neural escalável e em tempo real que atinge taxas de erro lógico próximas ao ótimo para códigos de superfície e de cor, superando a velocidade e a precisão de decodificadores existentes e viabilizando a correção de erros quânticos em escala para computação tolerante a falhas.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

O artigo apresenta o Trio, um framework de geração molecular que integra modelagem de linguagem baseada em fragmentos, aprendizado por reforço e busca em árvore Monte Carlo para criar um paradigma de descoberta de fármacos em ciclo fechado, superando métodos existentes ao gerar ligantes com maior afinidade de ligação, propriedades farmacológicas aprimoradas e acessibilidade sintética, além de expandir significativamente a diversidade química.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

O artigo apresenta o PvP, um framework de aprendizado contrastivo que utiliza representações latentes de estados proprioceptivos e privilegiados para melhorar a eficiência de amostragem e o desempenho no controle corporal completo de robôs humanoides, além de introduzir o SRL4Humanoid, uma estrutura unificada para avaliação sistemática de métodos de aprendizado de representação de estado.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

Este artigo apresenta um quadro teórico unificado que explica o viés de simplicidade em redes neurais diversas, demonstrando que a dinâmica de aprendizagem de sela-a-sela faz com que os modelos aprendam progressivamente soluções de complexidade crescente, como maior rank, número de dobras, kernels ou cabeças de atenção, dependendo da arquitetura e das condições de inicialização e dados.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

O artigo "The Bayesian Geometry of Transformer Attention" demonstra que, em ambientes controlados chamados "túneis de vento bayesianos", os transformadores realizam inferência bayesiana com alta precisão através de um mecanismo geométrico específico envolvendo o alinhamento progressivo de chaves e consultas e uma variedade de valores de baixa dimensão, estabelecendo uma separação arquitetônica clara em relação a MLPs e oferecendo uma base para conectar sistemas pequenos verificáveis a fenômenos de raciocínio em grandes modelos de linguagem.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Este artigo estabelece que o treinamento por entropia cruzada em transformadores induz uma dinâmica de roteamento baseada em vantagens e atualizações de valores ponderadas por responsabilidade, que atuam como um procedimento EM de duas escalas temporais para esculpir geometrias bayesianas de baixa dimensão que sustentam o raciocínio probabilístico em contexto.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

O artigo apresenta o PanSubNet, um modelo de aprendizado profundo interpretável que classifica subtipos moleculares clinicamente relevantes do câncer de pâncreas diretamente a partir de lâminas histológicas rotineiras (H&E), oferecendo uma alternativa rápida, econômica e generalizável aos métodos baseados em sequenciamento de RNA para estratificação prognóstica e preditiva.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Este artigo investiga o problema do "excesso de busca" em modelos de linguagem aumentados por busca, propondo a métrica Tokens Per Correctness (TPC) para avaliar o equilíbrio entre desempenho e custo, identificando fatores que agravam o fenômeno e apresentando estratégias de mitigação e um novo conjunto de dados (OverSearchQA) para pesquisas futuras.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artigo propõe um método inovador para amostragem de distribuições de Boltzmann não normalizadas, utilizando uma sequência de amostradores de Langevin para simular eficientemente um fluxo de equação diferencial ordinária (ODE) derivado de interpolantes estocásticos lineares, oferecendo garantias teóricas de convergência e demonstrando eficácia em distribuições multimodais e tarefas de inferência bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat