cs.LG artigos | Gist.Science

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artigo apresenta um framework hierárquico de dupla estratégia para o esquecimento seletivo em modelos de linguagem grandes aplicados à saúde, que remove conhecimento especializado sensível preservando competências médicas fundamentais com alta eficiência e garantias de privacidade.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

O artigo apresenta o CostNav, um novo benchmark que avalia agentes de IA física com base em análises econômicas realistas e dados industriais, revelando que os métodos atuais de navegação, embora focados no sucesso da tarefa, não são economicamente viáveis para aplicações comerciais no mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artigo introduz o framework PI-MDP e algoritmos de aprendizado por reforço parcialmente equivariantes (PE-DQN e PE-SAC) que mitigam erros de generalização em ambientes com quebra de simetria ao aplicar seletivamente backups de Bellman invariantes ou padrão, resultando em maior eficiência de amostragem e robustez em comparação com métodos existentes.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

Cross-embodied Co-design for Dexterous Hands

Este artigo apresenta um framework de co-design que aprende simultaneamente a morfologia da mão robótica e políticas de controle complementares para tarefas específicas, permitindo o projeto, treinamento, fabricação e implantação de novas mãos dexterosas em menos de 24 horas.

Kehlani Fay, Darin Anthony Djapri, Anya Zorin, James Clinton, Ali El Lahib, Hao Su, Michael T. Tolley, Sha Yi, Xiaolong Wang2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

O artigo apresenta o AlphaQubit 2, um decodificador neural escalável e em tempo real que atinge taxas de erro lógico próximas ao ótimo para códigos de superfície e de cor, superando a velocidade e a precisão de decodificadores existentes e viabilizando a correção de erros quânticos em escala para computação tolerante a falhas.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

O artigo apresenta o Trio, um framework de geração molecular que integra modelagem de linguagem baseada em fragmentos, aprendizado por reforço e busca em árvore Monte Carlo para criar um paradigma de descoberta de fármacos em ciclo fechado, superando métodos existentes ao gerar ligantes com maior afinidade de ligação, propriedades farmacológicas aprimoradas e acessibilidade sintética, além de expandir significativamente a diversidade química.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Maximum Risk Minimization with Random Forests

Este trabalho introduz variantes de florestas aleatórias baseadas no princípio de Minimização do Risco Máximo (MaxRM) para melhorar a generalização fora da distribuição, oferecendo algoritmos computacionalmente eficientes, garantias de consistência estatística e novos limites teóricos para distribuições de teste não vistas.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas Peters2026-03-12📊 stat

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

O artigo apresenta o PvP, um framework de aprendizado contrastivo que utiliza representações latentes de estados proprioceptivos e privilegiados para melhorar a eficiência de amostragem e o desempenho no controle corporal completo de robôs humanoides, além de introduzir o SRL4Humanoid, uma estrutura unificada para avaliação sistemática de métodos de aprendizado de representação de estado.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Este artigo apresenta o PBT (Pretrained Battery Transformer), o primeiro modelo fundamental para previsão universal da vida útil de baterias, que supera os métodos existentes ao integrar dados heterogêneos de múltiplos tipos de baterias por meio de camadas de especialistas codificadas com conhecimento específico.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra

O artigo apresenta o NMIRacle, um novo framework generativo de duas etapas que combina representações de fragmentos moleculares com codificadores espectrais para realizar a elucidação precisa de estruturas moleculares diretamente a partir de espectros de IR e RMN, superando os métodos existentes em precisão e robustez.

Federico Ottomano, Yingzhen Li, Alex M. Ganose2026-03-12🔬 physics

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

Este artigo apresenta um quadro teórico unificado que explica o viés de simplicidade em redes neurais diversas, demonstrando que a dinâmica de aprendizagem de sela-a-sela faz com que os modelos aprendam progressivamente soluções de complexidade crescente, como maior rank, número de dobras, kernels ou cabeças de atenção, dependendo da arquitetura e das condições de inicialização e dados.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

Data relativistic uncertainty framework for low-illumination anime scenery image enhancement

Este artigo apresenta o framework de Incerteza Relativística de Dados (DRU), uma abordagem inovadora que utiliza informações de incerteza para aprimorar a qualidade de imagens de paisagens anime em baixa luminosidade, superando os métodos atuais ao preencher a lacuna de domínio e mitigar a escassez de dados.

Yiquan Gao, John See2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

O artigo "The Bayesian Geometry of Transformer Attention" demonstra que, em ambientes controlados chamados "túneis de vento bayesianos", os transformadores realizam inferência bayesiana com alta precisão através de um mecanismo geométrico específico envolvendo o alinhamento progressivo de chaves e consultas e uma variedade de valores de baixa dimensão, estabelecendo uma separação arquitetônica clara em relação a MLPs e oferecendo uma base para conectar sistemas pequenos verificáveis a fenômenos de raciocínio em grandes modelos de linguagem.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Este artigo estabelece que o treinamento por entropia cruzada em transformadores induz uma dinâmica de roteamento baseada em vantagens e atualizações de valores ponderadas por responsabilidade, que atuam como um procedimento EM de duas escalas temporais para esculpir geometrias bayesianas de baixa dimensão que sustentam o raciocínio probabilístico em contexto.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Geometric Scaling of Bayesian Inference in LLMs

Este estudo demonstra que modelos de linguagem modernos preservam uma estrutura geométrica subjacente que organiza suas atualizações bayesianas aproximadas, embora essa geometria atue mais como uma leitura privilegiada da incerteza do que como um gargalo computacional singular.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

O artigo apresenta o PanSubNet, um modelo de aprendizado profundo interpretável que classifica subtipos moleculares clinicamente relevantes do câncer de pâncreas diretamente a partir de lâminas histológicas rotineiras (H&E), oferecendo uma alternativa rápida, econômica e generalizável aos métodos baseados em sequenciamento de RNA para estratificação prognóstica e preditiva.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Este artigo investiga o problema do "excesso de busca" em modelos de linguagem aumentados por busca, propondo a métrica Tokens Per Correctness (TPC) para avaliar o equilíbrio entre desempenho e custo, identificando fatores que agravam o fenômeno e apresentando estratégias de mitigação e um novo conjunto de dados (OverSearchQA) para pesquisas futuras.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artigo propõe um método inovador para amostragem de distribuições de Boltzmann não normalizadas, utilizando uma sequência de amostradores de Langevin para simular eficientemente um fluxo de equação diferencial ordinária (ODE) derivado de interpolantes estocásticos lineares, oferecendo garantias teóricas de convergência e demonstrando eficácia em distribuições multimodais e tarefas de inferência bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat

Error Analysis of Bayesian Inverse Problems with Generative Priors

Este artigo apresenta uma análise teórica que estabelece limites quantitativos de erro para problemas inversos bayesianos utilizando priores generativos treinados, demonstrando que o erro no posterior herda a taxa de convergência do prior na distância de Wasserstein, com validação através de experimentos numéricos e um problema inverso de EDP elíptica.

Bamdad Hosseini, Ziqi Huang2026-03-12📊 stat

Time series forecasting with Hahn Kolmogorov-Arnold networks

O artigo apresenta o HaKAN, um modelo inovador para previsão de séries temporais multivariadas que utiliza redes Kolmogorov-Arnold com funções de ativação baseadas em polinômios de Hahn para oferecer uma alternativa leve, interpretável e de alto desempenho, superando métodos recentes como Transformers e MLPs.

Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila2026-03-12📊 stat

← Anterior Próximo →