cs.LG artigos | Gist.Science

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

O artigo propõe o SeGP-CL, um método de aprendizado contínuo para modelos visão-linguagem que preserva a geometria semântica e evita o esquecimento catastrófico ao utilizar âncoras adversariais, destilação geométrica e regularização textual, alcançando desempenho superior em benchmarks sem necessidade de exemplares.

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Este artigo demonstra matematicamente e experimentalmente que redes de reações químicas sem camadas ocultas podem aprender tarefas de classificação com maior eficiência e precisão do que redes de neurônios pulsantes que exigem camadas ocultas, oferecendo uma explicação teórica para o potencial aprendizado mais eficiente em redes bioquímicas celulares.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Este artigo propõe um framework de redes neurais convolucionais temporais (TCNs) para a caracterização de ligação de fatores de transcrição como um problema de classificação multirrotulada, demonstrando que essa abordagem captura eficazmente as interações cooperativas entre múltiplos fatores e revela padrões biológicos significativos.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

O artigo propõe o método $Q$ Avatar, que utiliza consistência de Bellman cruzada e um crítico híbrido para superar os desafios de mapeamento entre domínios e transferência negativa no aprendizado por reforço cruzado, demonstrando eficiência em tarefas de locomoção e manipulação robótica.

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Este artigo propõe um pipeline de busca de arquitetura neural (NAS) eficiente em recursos que utiliza modelos de linguagem grandes (LLMs) em um ciclo fechado com memória de feedback histórica para iterativamente gerar e refinar arquiteturas de redes neurais convolucionais para classificação de imagens em uma única GPU de consumo, alcançando melhorias significativas de precisão sem necessidade de fine-tuning ou infraestrutura em nuvem.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

Este artigo propõe uma nova abordagem para o desenho ótimo de experimentos bayesianos em lote, baseada em fluxos de gradiente de Wasserstein e uma formulação probabilística que permite explorar paisagens de otimização complexas e obter lotes de alta utilidade através de algoritmos de partículas escaláveis.

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Este artigo propõe o MMDDPG, um framework de aprendizado por reforço que utiliza otimização minimax com um objetivo fracionário para estabilizar o treinamento e gerar políticas robustas contra perturbações externas e incertezas de modelo em tarefas de controle contínuo.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

O artigo apresenta o Cornserve, um sistema de serviço distribuído de código aberto baseado em Kubernetes para modelos multimodais "qualquer-para-qualquer", que utiliza abstração de tarefas flexível, desagregação de componentes e um modelo de execução eficiente para alcançar até 3,81 vezes maior vazão e 5,79 vezes menor latência em comparação com abordagens existentes.

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

O artigo apresenta o Hoi3DGen, um novo framework que gera malhas 3D texturizadas de alta qualidade e fielmente alinhadas a descrições textuais de interações entre humanos e objetos, superando métodos existentes ao utilizar dados curados por modelos de linguagem multimodal para resolver problemas de consistência e qualidade.

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

Automatic Generation of High-Performance RL Environments

Este artigo apresenta um método reutilizável de baixo custo que utiliza prompts genéricos, verificação hierárquica e reparo iterativo assistido por agentes para traduzir automaticamente ambientes complexos de Aprendizado por Reforço em implementações de alto desempenho semanticamente equivalentes, alcançando ganhos de velocidade de até 22.320 vezes em relação a referências existentes.

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

O artigo apresenta o FlashMotion, um novo framework de treinamento que combina adaptação de trajetória, destilação para poucos passos e um ajuste fino híbrido para gerar vídeos de alta qualidade e precisos em poucos passos, superando os métodos existentes e introduzindo o benchmark FlashBench para avaliação.

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Este artigo estabelece regras prescritivas para a alocação ótima de recursos computacionais no pós-treinamento por reforço de LLMs, demonstrando que o número ideal de rolagens paralelas por problema aumenta e depois satura conforme o orçamento de computação, com mecanismos distintos para problemas fáceis e difíceis, enquanto o tamanho do lote de problemas pode ser ajustado em uma ampla faixa sem comprometer a estabilidade.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

A Quantitative Characterization of Forgetting in Post-Training

Este artigo estabelece uma caracterização quantitativa do esquecimento no pós-treinamento contínuo de modelos generativos, demonstrando teoricamente como a direção da divergência de KL (forward vs. reverse), a sobreposição geométrica das distribuições e o uso de replay determinam se ocorre colapso de massa ou deriva de componentes, fornecendo condições explícitas para mitigar esses efeitos em métodos recentes.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

O artigo apresenta o conceito de "Materiais com Prova de Carga" (Proof-Carrying Materials), um protocolo que combina falsificação adversária, refinamento estatístico e certificação formal no Lean 4 para garantir a segurança de potenciais interatômicos aprendidos por máquina, demonstrando que essa abordagem supera drasticamente os filtros de MLIPs únicos ao recuperar 93% dos materiais estáveis que seriam erroneamente descartados.

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

O artigo apresenta o IndexCache, uma técnica que acelera a atenção esparsa em modelos de linguagem de grande escala ao reutilizar índices de camadas anteriores, reduzindo em até 75% os cálculos do indexador e aumentando a velocidade de inferência sem comprometer significativamente a qualidade do modelo.

Yushi Bai, Qian Dong, Ting Jiang, Xin Lv, Zhengxiao Du, Aohan Zeng, Jie Tang, Juanzi Li2026-03-13💬 cs.CL

HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

O artigo apresenta o HiAP, um framework de auto-podagem estocástica multi-granular que otimiza Vision Transformers em uma única fase de treinamento, utilizando portas Gumbel-Sigmoid hierárquicas para descobrir sub-redes eficientes que equilibram precisão e recursos computacionais sem a necessidade de heurísticas manuais ou pipelines complexos.

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis2026-03-13🤖 cs.LG

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

Este trabalho propõe um sistema de classificação baseado em regras fuzzy para mapear características de texto livre para o espaço vetorial do modelo CLIP, visando melhorar a interpretabilidade e o desempenho em domínios específicos como relatórios clínicos e críticas de filmes.

Javier Fumanal-Idocin, Mohammadreza Jamalifard, Javier Andreu-Perez2026-03-13🤖 cs.LG

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

O artigo propõe que, em modelos grandes e bem pré-treinados, uma densa "floresta" de especialistas para diversas tarefas já existe ao redor dos pesos originais, permitindo que um método de pós-treinamento simples e totalmente paralelo, baseado em amostragem aleatória e votação majoritária, seja competitivo com técnicas de otimização estruturada como PPO e GRPO.

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Security Considerations for Artificial Intelligence Agents

Este artigo, baseado na experiência da Perplexity com sistemas agênicos, detalha as novas ameaças de segurança introduzidas por agentes de IA, mapeia suas superfícies de ataque e propõe uma defesa em camadas e diretrizes para preencher lacunas de pesquisa alinhadas aos princípios de gerenciamento de riscos do NIST.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Temporal Straightening for Latent Planning

O artigo apresenta a "retificação temporal", uma técnica que utiliza um regularizador de curvatura para aprender representações latentes mais adequadas ao planejamento, tornando as trajetórias no espaço latente mais lineares e melhorando a estabilidade e o sucesso de algoritmos de planejamento baseados em gradiente em tarefas de alcance de objetivos.

Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren2026-03-13🤖 cs.LG

← Anterior Próximo →