cs.LG artigos | Gist.Science

Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation

Este estudo utiliza técnicas de interpretabilidade mecânica para demonstrar que a destilação de conhecimento, embora preserve comportamentos funcionais amplos, provoca uma reestruturação interna significativa nos modelos, onde os estudantes reorganizam e comprimem os componentes dos professores, resultando em uma dependência mais forte de menos unidades individuais.

Reilly Haskins, Benjamin Adams2026-03-10🤖 cs.LG

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

O artigo "Ready2Unlearn" apresenta uma abordagem de otimização durante o treinamento que, baseada em princípios de meta-aprendizado, prepara proativamente modelos de aprendizado de máquina para futuros processos de esquecimento (unlearning), permitindo a remoção eficiente e principista de dados específicos sem a necessidade de reagir apenas após solicitações de exclusão.

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

O artigo apresenta o EgoDex, o maior e mais diverso conjunto de dados de manipulação destreza humana até hoje, composto por 829 horas de vídeos egocêntricos com rastreamento 3D de mãos coletados via Apple Vision Pro, visando superar a escassez de dados para o aprendizado por imitação em robótica e visão computacional.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

O artigo apresenta o FreeKV, um framework de co-otimização entre algoritmo e sistema que, ao utilizar recuperação especulativa e layouts híbridos de memória, melhora drasticamente a eficiência da inferência de LLMs em contextos longos sem sacrificar a precisão.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

Online Decision-Focused Learning

Este artigo propõe os primeiros algoritmos online com garantias teóricas de arrependimento para o Aprendizado Focado em Decisão (DFL) em ambientes dinâmicos, superando desafios como a ausência de gradientes e a não convexidade através de regularização e técnicas de perturbação.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain Durmus2026-03-10🤖 cs.LG

Vid2World: Crafting Video Diffusion Models to Interactive World Models

O artigo apresenta o Vid2World, uma abordagem geral que transforma modelos de difusão de vídeo pré-treinados em modelos de mundo interativos de alta fidelidade e controláveis, superando as limitações de métodos existentes através da causalização da arquitetura e de um mecanismo de orientação causal para ações.

Siqiao Huang, Jialong Wu, Qixing Zhou, Shangchen Miao, Mingsheng Long2026-03-10🤖 cs.LG

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

O artigo apresenta o MAS-ZERO, um framework inovador de auto-evolução que projeta, critica e refina dinamicamente sistemas multiagentes em tempo de inferência sem supervisão, superando abordagens manuais e automáticas existentes em tarefas de raciocínio, codificação e agentes autônomos.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

O artigo apresenta o HDLxGraph, um novo framework que integra características gráficas de Hardware Description Languages (HDLs), como Árvores de Sintaxe Abstrata e Grafos de Fluxo de Dados, a sistemas de Geração Aumentada por Recuperação (RAG) para superar limitações em tarefas de LLM, validado pelo novo benchmark HDLSearch e demonstrando melhorias significativas na precisão de busca, depuração e conclusão de código em comparação com métodos existentes.

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

O artigo apresenta o WikiDBGraph, uma nova suíte de benchmark de grande escala construída a partir de 100.000 bancos de dados relacionais reais interconectados, projetada para avaliar e revelar as limitações dos métodos atuais de aprendizado colaborativo ao lidar com silos de dados desalinhados e fragmentados no mundo real.

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Este artigo apresenta o AgarCL, uma plataforma de pesquisa baseada no jogo Agar.io para o aprendizado por reforço contínuo, que oferece um ambiente não episódico e dinâmico para avaliar algoritmos e métodos de aprendizado contínuo, revelando que os desafios do ambiente vão além do dilema estabilidade-plasticidade.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Este artigo apresenta o X-MethaneWet, o primeiro conjunto de dados de referência global multiescala para emissões de metano de zonas úmidas, que integra simulações físicas e observações reais para estabelecer bases de modelos de aprendizado profundo e explorar técnicas de aprendizado por transferência, visando aprimorar a modelagem de emissões de metano e impulsionar a descoberta científica com IA.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Este artigo desenvolve um quadro teórico geral para o controle ótimo de densidade de probabilidade em espaços de medida, estabelecendo um princípio do máximo e uma equação de Hamilton-Jacobi-Bellman para problemas de multiagentes em grande escala, e propõe um algoritmo numérico escalável baseado em redes neurais profundas para sua resolução eficiente.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

O artigo apresenta o VISTA, um framework inovador e sem necessidade de treinamento que utiliza Modelos Visão-Linguagem para prever preços de ações combinando representações textuais e gráficas, superando significativamente os métodos tradicionais e baseados apenas em texto.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Este artigo propõe uma nova abordagem de segurança para modelos de linguagem que injeta sinais de hierarquia de instruções nas representações intermediárias da rede, resultando em uma redução de 1,6 a 9,2 vezes na taxa de sucesso de ataques de injeção de prompt em comparação com métodos existentes, sem comprometer significativamente a utilidade do modelo.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

O artigo propõe o OCN (Ortogonal Common Neighbor), um método inovador para previsão de links que elimina redundância e atenua o super-suavizamento em vizinhos comuns de ordem superior, superando significativamente os métodos existentes em benchmarks populares.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

O artigo apresenta o ViTaPEs, uma arquitetura baseada em transformers que utiliza codificações de posição visotáteis em dois estágios para aprender representações multimodais robustas e generalizáveis, superando os métodos atuais em tarefas de reconhecimento e manipulação robótica sem depender de modelos pré-treinados de visão e linguagem.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

O artigo apresenta o LoFT, um método de adaptação de baixo rank que alinha as dinâmicas internas do otimizador com as atualizações de ajuste fino completo, superando o desempenho do LoRA padrão e eliminando a necessidade de hiperparâmetros adicionais sem aumentar o custo de inferência.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

O artigo propõe o "Progressive Neural Collapse" (ProNC), um novo framework para aprendizado contínuo que supera as limitações de abordagens anteriores ao expandir progressivamente e de forma principial o alvo de colapso neural (ETF) para novas tarefas, eliminando a necessidade de um ETF global fixo e mitigando eficazmente o esquecimento catastrófico.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Este trabalho propõe uma abordagem de correção adaptativa e plug-and-play que utiliza um operador leve aprendível para garantir a estrita conservação de leis físicas fundamentais em operadores neurais, superando as limitações de flexibilidade dos métodos existentes e demonstrando superioridade em precisão e estabilidade em diversos benchmarks de EDPs.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

O artigo apresenta o ActivePusher, um novo quadro que combina modelagem de física residual com aprendizado ativo baseado em incerteza para melhorar a eficiência de dados e a confiabilidade do planejamento em tarefas de manipulação não preênseis, tanto em simulação quanto no mundo real.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

← Anterior Próximo →