cs.LG artigos | Gist.Science

Towards Autonomous Mathematics Research

O artigo apresenta o Aletheia, um agente de pesquisa matemática autônomo que, combinando raciocínio avançado, escalabilidade na inferência e uso intensivo de ferramentas, gera e revisa soluções em linguagem natural para problemas que vão desde olimpíadas até contribuições originais em pesquisa acadêmica, como a descoberta de constantes estruturais e a resolução de questões abertas, ao mesmo tempo que propõe novos padrões para medir autonomia e transparência na colaboração humano-IA.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

Este artigo investiga o viés de "diagonal sink" em mecanismos de atenção temporal, demonstrando teoricamente como as pontuações de atenção fora da diagonal dependem do comprimento da sequência e propondo métodos de regularização para mitigar a degeneração de informações.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

O artigo apresenta o SWE-MiniSandbox, uma abordagem leve e sem containers que utiliza mecanismos isolados no nível do kernel e técnicas de pré-armazenamento para reduzir drasticamente a sobrecarga de disco e o tempo de configuração no treinamento de agentes de engenharia de software por aprendizado por reforço, mantendo desempenho comparável ao dos pipelines baseados em containers.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

O artigo apresenta o MiDAS, um sistema de código aberto e agnóstico à plataforma que permite a aquisição não invasiva e sincronizada de dados multimodais para cirurgia robótica minimamente invasiva, validado em robôs Raven-II e da Vinci Xi e acompanhado de um novo conjunto de dados anotados que inclui tarefas de sutura de reparo de hérnia.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Este estudo propõe o AHSIV, um framework adaptativo de seleção de modelos para previsão de demanda que integra métricas de erro ajustadas ao horizonte de previsão e classificação estrutural da demanda para resolver a instabilidade de rankings em ambientes heterogêneos, oferecendo uma solução operacionalmente coerente para decisões multi-SKU.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

O artigo apresenta o GaiaFlow, um framework inovador que utiliza ajuste de difusão guiado semanticamente e protocolos de saída adaptativa para otimizar a busca neural, reduzindo significativamente a pegada de carbono enquanto mantém alta precisão em diversas infraestruturas computacionais.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

MolCrystalFlow: Molecular Crystal Structure Prediction via Flow Matching

O artigo apresenta o MolCrystalFlow, um modelo generativo baseado em fluxo que prevê estruturas de cristais moleculares ao desacoplar a complexidade intramolecular do empacotamento intermolecular, representando centros e orientações em variedades Riemannianas para respeitar simetrias geométricas e acelerar a descoberta de materiais.

Cheng Zeng, Harry W. Sullivan, Thomas Egg, Maya M. Martirossyan, Philipp Höllmer, Jirui Jin, Richard G. Hennig, Adrian Roitberg, Stefano Martiniani, Ellad B. Tadmor, Mingjie Liu2026-03-09🔬 cond-mat.mtrl-sci

The Limits of Long-Context Reasoning in Automated Bug Fixing

Este estudo demonstra que, apesar do desempenho promissor de modelos de linguagem em fluxos de trabalho agênicos para correção de bugs, a capacidade de raciocínio em contextos longos é limitada, pois o sucesso depende da decomposição de tarefas em etapas de contexto curto, enquanto a geração de patches em contextos genuinamente longos (64k tokens) resulta em degradação severa de desempenho devido a falhas sistemáticas.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish Thakker2026-03-09🤖 cs.LG

FLoRG: Federated Fine-tuning with Low-rank Gram Matrices and Procrustes Alignment

O artigo apresenta o FLoRG, um framework de ajuste fino federado que utiliza agregação de matrizes de Gram de baixa ordem e alinhamento de Procrustes para eliminar erros de agregação, reduzir a deriva de decomposição e diminuir significativamente a sobrecarga de comunicação, superando os métodos existentes em precisão e eficiência.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-09🤖 cs.AI

Conditionally Site-Independent Neural Evolution of Antibody Sequences

O artigo apresenta o CoSiNE, um modelo que combina cadeias de Markov contínuas com redes neurais para capturar a dinâmica evolutiva e as interações epistáticas em anticorpos, superando os métodos atuais na previsão de efeitos de variantes e permitindo a otimização direcionada da afinidade de ligação.

Stephen Zhewen Lu, Aakarsh Vermani, Kohei Sanno, Jiarui Lu, Frederick A Matsen, Milind Jagota, Yun S. Song2026-03-09🤖 cs.LG

What Topological and Geometric Structure Do Biological Foundation Models Learn? Evidence from 141 Hypotheses

Este estudo utiliza um ciclo autônomo de geração e teste de hipóteses para demonstrar que modelos de base biológica aprendem estruturas geométricas e topológicas genuínas e compartilhadas, embora essas descobertas sejam mais robustas em tecidos imunes do que em outros contextos.

Ihor Kendiukhov2026-03-09🤖 cs.LG

Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization

O artigo apresenta o EMPO $^2$ , um framework híbrido de aprendizado por reforço que integra memória para aprimorar a exploração e combina atualizações on- e off-policy, resultando em agentes de LLM significativamente mais adaptáveis e com melhor desempenho em tarefas novas e ambientes complexos.

Zeyuan Liu, Jeonghye Kim, Xufang Luo, Dongsheng Li, Yuqing Yang2026-03-09🤖 cs.AI

Modality Collapse as Mismatched Decoding: Information-Theoretic Limits of Multimodal LLMs

Este artigo demonstra que o colapso de modalidades em LLMs multimodais é causado por um problema de decodificação incompatível, onde a perda de informação é limitada pelo desajuste distribucional e pela regra de pontuação do decodificador, e não pela arquitetura do modelo, provando que o objetivo de treinamento determina quais informações multimodais permanecem acessíveis.

Jayadev Billa2026-03-09🤖 cs.AI

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

Este artigo propõe um pipeline iterativo "Web-Knowledge-Web" que utiliza grafos de conhecimento e estimativas de cobertura inspiradas na ecologia para descobrir e mapear com maior precisão e eficiência pequenas e médias empresas em setores industriais específicos, superando as lacunas de cobertura das bases de dados comerciais existentes.

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

Este artigo estabelece uma equivalência de primeira ordem entre intervenções no espaço de ativação e atualizações de pesos, propondo um framework principiado que identifica a saída pós-bloco como o local ideal para "steering" e introduz uma abordagem de adaptação conjunta que supera os métodos existentes em eficiência e desempenho.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Este trabalho propõe uma decomposição funcional de Anel Tensorial reparametrizada, que utiliza Representações Neurais Implícitas e uma estrutura de base fixa para superar as limitações de dados em malhas e melhorar a recuperação de detalhes de alta frequência em tarefas de reconstrução de dados multidimensionais.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Este artigo propõe um framework acústico compacto que combina um codificador CNN multirramo com uma Unidade de Memória Legendre (LMU) aprimorada e uma fusão de ensemble de posterior calibrada para melhorar a generalização entre domínios na classificação de choro de bebês, superando desafios como sinais não estacionários, anotações limitadas e deslocamentos de domínio.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

O artigo apresenta o Whisper-RIR-Mega, um novo conjunto de dados de benchmark que emparelha falas limpas do LibriSpeech com suas versões reverberadas usando respostas ao impulso reais, visando avaliar e melhorar a robustez de modelos de reconhecimento automático de fala (ASR) às variações acústicas de ambientes.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

O artigo apresenta o RigidSSL, um framework de pré-treinamento auto-supervisionado que integra aprendizado geométrico baseado em rigidez e dinâmica molecular para superar limitações atuais na geração de proteínas, melhorando significativamente a projetabilidade, a diversidade e a precisão na modelagem de ensembles conformacionais.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

O artigo apresenta o mlx-vis, uma biblioteca Python de código aberto que implementa métodos de redução de dimensionalidade e renderização de visualizações acelerados por GPU no Apple Silicon, utilizando o framework MLX para oferecer um pipeline completo de processamento de dados e geração de vídeos com alto desempenho.

Han Xiao2026-03-09🤖 cs.LG

← Anterior Próximo →