cs.LG artigos | Gist.Science

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Este trabalho generaliza o objetivo do Autoencoder Linear com Foco em Desruído (EDLAE) para uma Perda Quadrática Esperada Desacoplada (DEQL), permitindo soluções eficientes para parâmetros $b > 0$ que superam o desempenho do modelo original com $b = 0$ em sistemas de recomendação.

Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin2026-03-10🤖 cs.LG

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Este artigo propõe um novo quadro teórico baseado na "Capacidade do Canal de Contexto" para explicar e prever o esquecimento catastrófico na aprendizagem contínua, demonstrando que arquiteturas que garantem um caminho de contexto estruturalmente obrigatório (como HyperNetworks) superam as limitações teóricas de métodos baseados em algoritmos e alcançam a retenção perfeita de tarefas.

Ran Cheng2026-03-10🤖 cs.LG

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

O artigo apresenta o DualSpec, um framework de especulação heterogênea que acelera agentes de pesquisa profunda ao distinguir e otimizar separadamente as ações de busca e visita, alcançando até 3,28 vezes mais velocidade sem comprometer a precisão.

Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li2026-03-10🤖 cs.LG

OrthoFormer: Instrumental Variable Estimation in Transformer Hidden States via Neural Control Functions

O artigo apresenta o OrthoFormer, uma nova arquitetura baseada em Transformers que integra estimação de variáveis instrumentais via funções de controle neural para separar causalidade de correlações espúrias, garantindo maior robustez e generalização em cenários fora da distribuição.

Charles Luo2026-03-10🤖 cs.LG

Generalization in Online Reinforcement Learning for Mobile Agents

Este trabalho apresenta o benchmark AndroidWorld-Generalization e um sistema de treinamento de aprendizado por reforço baseado em GRPO para avaliar e melhorar a generalização zero-shot de agentes móveis baseados em modelos de linguagem e visão, demonstrando ganhos significativos em instâncias não vistas, mas desafios persistentes na generalização para novos aplicativos e templates.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

O artigo apresenta o "Data Agent", um quadro de seleção de dados dinâmico e de ponta a ponta que formula a seleção como um problema de decisão sequencial orientada pelo treinamento, aprendendo uma política de amostragem que evolui junto com a otimização do modelo para acelerar o treinamento e reduzir custos em mais de 50% sem perda de desempenho em diversas tarefas e arquiteturas.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este artigo apresenta garantias de amostragem finita para o aprendizado de representações de estado orientado a custos no controle Linear Quadrático Gaussiano (LQG) de horizonte infinito, explorando duas abordagens distintas — uma com dinâmica latente explícita e outra implícita, semelhante ao MuZero — e estabelecendo uma contribuição técnica fundamental sobre a persistência de excitação em um novo processo estocástico.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

O artigo apresenta o framework PACT, que preserva o alinhamento de segurança durante o ajuste fino de modelos de linguagem ao restringir especificamente a confiança em tokens relacionados à segurança, evitando assim o desvio de alinhamento sem comprometer a utilidade do modelo em tarefas downstream.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

O artigo demonstra que uma tokenização discreta simples, combinada com suavização gaussiana adaptativa, permite que os Transformers superem o XGBoost em previsões tabulares, oferecendo distribuições de probabilidade calibradas e maior eficiência computacional.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

O artigo apresenta o Dial, um sistema de NL2SQL baseado em conhecimento que supera as limitações dos métodos existentes ao gerar consultas SQL semanticamente corretas e executáveis em diversos dialetos de banco de dados, utilizando planejamento lógico consciente de dialeto, uma base de conhecimento hierárquica e um ciclo de depuração orientado à execução.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

O artigo apresenta o SLNet, uma rede neural superleve e adaptativa para reconhecimento de nuvens de pontos 3D que, ao utilizar componentes inovadores como NAPE e GMU, alcança desempenho competitivo em diversas tarefas com uma fração significativa dos parâmetros e custo computacional de modelos existentes.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

O artigo apresenta o Transformer de Duplo Fluxo, uma arquitetura que separa o fluxo residual em componentes de token e contexto para criar um trade-off ajustável entre interpretabilidade e desempenho, permitindo que modelos de linguagem mantenham robustez funcional e aprendam algoritmos discretos enquanto expõem sua estrutura interna por design.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

O artigo apresenta o AFTUNE, um framework que garante a integridade computacional de processos de ajuste fino e inferência de modelos proprietários na nuvem, permitindo auditorias verificáveis com sobrecarga computacional prática.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

Esta monografia oferece uma visão rigorosa dos aspectos teóricos e metodológicos da inferência probabilística e do aprendizado com o método de Stein, detalhando a construção de discrepâncias de Stein, suas propriedades e sua conexão com o descenso de gradiente variacional de Stein.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabalho propõe um framework leve para adaptação on-device de modelos de aprimoramento de fala em ambientes acústicos dinâmicos, que atualiza menos de 1% dos parâmetros do modelo base via adaptadores de baixo posto e treinamento auto-supervisionado, alcançando melhorias significativas na qualidade perceptiva com rápida convergência em cenários de ruído desafiadores.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Este estudo apresenta um framework condicional baseado em difusão e transformadores que gera um conjunto diversificado de conformações tridimensionais do genoma de *Escherichia coli*, guiado por mapas de contato Hi-C, superando a limitação de modelos determinísticos ao produzir estruturas heterogêneas consistentes com os dados experimentais.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

O artigo apresenta a Arquitetura de Fusão Tardia (LFA), que impõe a independência de fluxos arquitetônicos para separar a estrutura simbólica da semântica contextual, demonstrando que essa restrição estrutural garante interpretabilidade por design, modularidade funcional e maior estabilidade de aprendizado em comparação aos transformers tradicionais.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Pushing Bistatic Wireless Sensing toward High Accuracy at the Sub-Wavelength Scale

Este artigo apresenta um novo quadro robusto que utiliza a amplitude da resposta do canal para recuperar características ideais a partir de distorções causadas pela dessincronização de relógios em sensores sem fio bistáticos, permitindo medições de deslocamento com precisão na escala subcomprimento de onda e melhorando a acurácia em quase uma ordem de grandeza.

Wenwei Li, Jiarun Zhou, Qinxiao Quan, Fusang Zhang, Daqing Zhang2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

Este artigo propõe um framework aprimorado de Projeções Locais em Subespaço Aleatório (RSLP) que, ao integrar agregação ponderada, amostragem consciente de categorias e seleção adaptativa de tamanho, oferece estimativas robustas de respostas ao impulso e inferência confiável para séries temporais de alta dimensão, reduzindo significativamente a variabilidade do estimador e produzindo intervalos de confiança mais precisos em cenários com centenas de preditores correlacionados.

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

O artigo apresenta o BoT, um framework unificado e agnóstico a tamanhos que utiliza a Transformada Wavelet Discreta para tratar pesos de modelos como sinais contínuos, permitindo transferência bidirecional de conhecimento (de modelos pequenos para grandes e vice-versa) com economia significativa de FLOPs e desempenho de ponta.

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

← Anterior Próximo →