cs.LG artigos | Gist.Science

Sparsity and Out-of-Distribution Generalization

Este artigo propõe uma explicação fundamentada para a generalização fora de distribuição (OOD) baseada na esparsidade de hipóteses em relação a características distinguíveis, formalizando essa intuição em um teorema que estende os limites clássicos de complexidade de amostra ao contexto OOD e generaliza classificadores esparsos para "juntas" em subespaços.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Este artigo apresenta o MARIGOLD, um novo framework unificado que resolve problemas de aprendizado multi-tarefa de forma eficiente ao modelar o equilíbrio de gradientes como um problema de otimização bi-nível e aplicando métodos de ordem zero para superar as limitações computacionais de abordagens anteriores.

Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng2026-03-10🤖 cs.LG

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

O artigo propõe um sistema de triagem jurídica determinístico e reprodutível, baseado em codificadores duplos e faixas de fuzzy calibradas, que equilibra a precisão de modelos de aprendizado de máquina com a transparência necessária para conformidade legal e auditoria em tarefas de classificação e recuperação de evidências.

Rian Atri2026-03-10🤖 cs.LG

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Este trabalho generaliza o objetivo do Autoencoder Linear com Foco em Desruído (EDLAE) para uma Perda Quadrática Esperada Desacoplada (DEQL), permitindo soluções eficientes para parâmetros $b > 0$ que superam o desempenho do modelo original com $b = 0$ em sistemas de recomendação.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este artigo propõe um novo quadro teórico baseado na "Capacidade do Canal de Contexto" para explicar e prever o esquecimento catastrófico na aprendizagem contínua, demonstrando que arquiteturas que garantem um caminho de contexto estruturalmente obrigatório (como HyperNetworks) superam as limitações teóricas de métodos baseados em algoritmos e alcançam a retenção perfeita de tarefas.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

O artigo apresenta o DualSpec, um framework de especulação heterogênea que acelera agentes de pesquisa profunda ao distinguir e otimizar separadamente as ações de busca e visita, alcançando até 3,28 vezes mais velocidade sem comprometer a precisão.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

O artigo apresenta o OrthoFormer, uma nova arquitetura baseada em Transformers que integra estimação de variáveis instrumentais via funções de controle neural para separar causalidade de correlações espúrias, garantindo maior robustez e generalização em cenários fora da distribuição.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

Este trabalho apresenta o benchmark AndroidWorld-Generalization e um sistema de treinamento de aprendizado por reforço baseado em GRPO para avaliar e melhorar a generalização zero-shot de agentes móveis baseados em modelos de linguagem e visão, demonstrando ganhos significativos em instâncias não vistas, mas desafios persistentes na generalização para novos aplicativos e templates.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

O artigo apresenta o "Data Agent", um quadro de seleção de dados dinâmico e de ponta a ponta que formula a seleção como um problema de decisão sequencial orientada pelo treinamento, aprendendo uma política de amostragem que evolui junto com a otimização do modelo para acelerar o treinamento e reduzir custos em mais de 50% sem perda de desempenho em diversas tarefas e arquiteturas.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este artigo apresenta garantias de amostragem finita para o aprendizado de representações de estado orientado a custos no controle Linear Quadrático Gaussiano (LQG) de horizonte infinito, explorando duas abordagens distintas — uma com dinâmica latente explícita e outra implícita, semelhante ao MuZero — e estabelecendo uma contribuição técnica fundamental sobre a persistência de excitação em um novo processo estocástico.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

O artigo apresenta o framework PACT, que preserva o alinhamento de segurança durante o ajuste fino de modelos de linguagem ao restringir especificamente a confiança em tokens relacionados à segurança, evitando assim o desvio de alinhamento sem comprometer a utilidade do modelo em tarefas downstream.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

O artigo demonstra que uma tokenização discreta simples, combinada com suavização gaussiana adaptativa, permite que os Transformers superem o XGBoost em previsões tabulares, oferecendo distribuições de probabilidade calibradas e maior eficiência computacional.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

O artigo apresenta o Dial, um sistema de NL2SQL baseado em conhecimento que supera as limitações dos métodos existentes ao gerar consultas SQL semanticamente corretas e executáveis em diversos dialetos de banco de dados, utilizando planejamento lógico consciente de dialeto, uma base de conhecimento hierárquica e um ciclo de depuração orientado à execução.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

O artigo apresenta o SLNet, uma rede neural superleve e adaptativa para reconhecimento de nuvens de pontos 3D que, ao utilizar componentes inovadores como NAPE e GMU, alcança desempenho competitivo em diversas tarefas com uma fração significativa dos parâmetros e custo computacional de modelos existentes.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

O artigo apresenta o Transformer de Duplo Fluxo, uma arquitetura que separa o fluxo residual em componentes de token e contexto para criar um trade-off ajustável entre interpretabilidade e desempenho, permitindo que modelos de linguagem mantenham robustez funcional e aprendam algoritmos discretos enquanto expõem sua estrutura interna por design.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

O artigo apresenta o AFTUNE, um framework que garante a integridade computacional de processos de ajuste fino e inferência de modelos proprietários na nuvem, permitindo auditorias verificáveis com sobrecarga computacional prática.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

Esta monografia oferece uma visão rigorosa dos aspectos teóricos e metodológicos da inferência probabilística e do aprendizado com o método de Stein, detalhando a construção de discrepâncias de Stein, suas propriedades e sua conexão com o descenso de gradiente variacional de Stein.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabalho propõe um framework leve para adaptação on-device de modelos de aprimoramento de fala em ambientes acústicos dinâmicos, que atualiza menos de 1% dos parâmetros do modelo base via adaptadores de baixo posto e treinamento auto-supervisionado, alcançando melhorias significativas na qualidade perceptiva com rápida convergência em cenários de ruído desafiadores.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Este estudo apresenta um framework condicional baseado em difusão e transformadores que gera um conjunto diversificado de conformações tridimensionais do genoma de *Escherichia coli*, guiado por mapas de contato Hi-C, superando a limitação de modelos determinísticos ao produzir estruturas heterogêneas consistentes com os dados experimentais.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

O artigo apresenta a Arquitetura de Fusão Tardia (LFA), que impõe a independência de fluxos arquitetônicos para separar a estrutura simbólica da semântica contextual, demonstrando que essa restrição estrutural garante interpretabilidade por design, modularidade funcional e maior estabilidade de aprendizado em comparação aos transformers tradicionais.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

← Anterior Próximo →