cs.LG artigos | Gist.Science

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

O artigo apresenta o SAHOO, um framework prático que utiliza três mecanismos de segurança para monitorar e controlar a deriva de alinhamento durante a autoaperfeiçoamento recursivo de sistemas de IA, resultando em ganhos significativos de qualidade em tarefas de código e raciocínio sem comprometer a segurança ou a veracidade.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

O artigo apresenta o AIRT, um framework de aprendizado profundo de ponta a ponta capaz de gerar planos de radioterapia VMAT para próstata em menos de um segundo, demonstrando qualidade não inferior aos planos convencionais do RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

O MoEless é o primeiro framework de serviço serverless para Modelos de Linguagem de Grande Escala (LLMs) com Mistura de Especialistas (MoE) que mitiga o desequilíbrio de carga entre especialistas e reduz a latência e os custos de inferência através de previsões de carga, escalabilidade dinâmica e estratégias otimizadas de alocação em GPUs.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

O artigo apresenta o DC-DiT, um modelo de difusão que utiliza um mecanismo de "chunking" dinâmico e aprendido para adaptar a quantidade de tokens processados conforme a complexidade visual da imagem e o estágio da difusão, melhorando a eficiência computacional e a qualidade da geração sem necessidade de supervisão explícita.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Este trabalho apresenta a Frequency-Separable Hamiltonian Neural Network (FS-HNN), uma arquitetura que supera as limitações de redes neurais hamiltonianas convencionais na captura de dinâmicas multiescala ao parametrizar o Hamiltoniano através de múltiplas redes treinadas em diferentes escalas de tempo, resultando em melhorias significativas na extrapolação de longo prazo e na generalização para sistemas de equações diferenciais ordinárias e parciais.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Tiny, Hardware-Independent, Compression-based Classification

Este trabalho apresenta um modelo de classificação baseado em distância de compressão normalizada que, apesar de não ser uma métrica formal, oferece alta precisão com poucos dados e baixo custo computacional, permitindo a execução eficiente de aprendizado de máquina diretamente em dispositivos de usuário para preservar a privacidade.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

O artigo apresenta o CLAIRE, um framework de aprendizado profundo híbrido que combina autoencoders para extração de características latentes e técnicas de IA explicável para melhorar a detecção precisa e interpretável de falhas em ambientes industriais de alta dimensão.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Este artigo apresenta o ALFCG, o primeiro framework adaptativo e livre de projeção para minimização estocástica não convexa que dispensa constantes de suavidade globais e busca linear, utilizando um acumulador auto-normalizado para estimar a suavidade local e alcançar complexidades de iteração ótimas próximas de $\mathcal{O}(\epsilon^{-2})$ em cenários de baixo ruído.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Este artigo estende a regularização baseada em cinética (KBR) para aprender derivadas espaciais com precisão de segunda ordem em dados ruidosos, propondo esquemas explícitos e implícitos que, ao serem acoplados a solvers conservadores, permitem a captura estável de choques em EDPs hiperbólicas e abrem caminho para a resolução de equações em nuvens de pontos irregulares.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

O artigo propõe uma arquitetura de orquestração com "portões de esquema" que separa a flexibilidade conversacional da execução determinística, permitindo que modelos de linguagem traduzam objetivos naturais em fluxos de trabalho científicos reprodutíveis e governados sem comprometer a precisão.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

Efficient, Property-Aligned Fan-Out Retrieval via RL-Compiled Diffusion

O artigo apresenta o R4T, um método que utiliza aprendizado por reforço para sintetizar dados de treinamento e treinar um recuperador baseado em difusão leve, permitindo a recuperação eficiente de conjuntos de itens otimizados para propriedades de alto nível com latência drasticamente reduzida em comparação às abordagens tradicionais.

Pengcheng Jiang, Judith Yue Li, Moonkyung Ryu, R. Lily Hu, Kun Su, Zhong Yi Wan, Liam Hebert, Hao Peng, Jiawei Han, Dima Kuzmin, Craig Boutilier2026-03-09🤖 cs.LG

U6G XL-MIMO Radiomap Prediction: Multi-Config Dataset and Beam Map Approach

Este artigo aborda a previsão de radiomapas para sistemas XL-MIMO na faixa de 6 GHz superior, apresentando o primeiro grande conjunto de dados multiconfiguração, um novo framework de benchmark e a proposta do "beam map", uma característica física que permite generalizar para configurações e ambientes não vistos com redução significativa de erro, superando as limitações de dados e extrapolação dos métodos atuais.

Xiaojie Li, Yu Han, Zhizheng Lu, Shi Jin, Chao-Kai Wen2026-03-09🤖 cs.LG

Adapter-Augmented Bandits for Online Multi-Constrained Multi-Modal Inference Scheduling

O artigo propõe o M-CMAB, um framework de agendamento de inferência para modelos de linguagem multimodal que utiliza bandits contextuais multi-adapter e um construtor primal-dual para otimizar decisões online sob restrições orçamentárias multidimensionais e heterogêneas, superando os métodos atuais em qualidade de resposta e eficiência.

Xianzhi Zhang, Yue Xu, Yinlin Zhu, Di Wu, Yipeng Zhou, Miao Hu, Guocong Quan2026-03-09🤖 cs.LG

A Reference Architecture of Reinforcement Learning Frameworks

Este artigo propõe uma arquitetura de referência para frameworks de aprendizado por reforço, identificando componentes e padrões recorrentes através da análise de 18 sistemas de ponta, a fim de estabelecer uma base comum para comparação, avaliação e integração.

Xiaoran Liu, Istvan David2026-03-09🤖 cs.AI

CLoPA: Continual Low Parameter Adaptation of Interactive Segmentation for Medical Image Annotation

O artigo apresenta o CLoPA, uma estratégia de adaptação contínua que ajusta uma pequena fração dos parâmetros do modelo nnInteractive durante o fluxo de trabalho de anotação, elevando rapidamente o desempenho da segmentação interativa em diversas tarefas médicas para níveis de especialista sem exigir novos parâmetros ou alterações no pipeline de inferência.

Parhom Esmaeili, Chayanin Tangwiriyasakul, Eli Gibson, Sebastien Ourselin, M. Jorge Cardoso2026-03-09🤖 cs.AI

Certified and accurate computation of function space norms of deep neural networks

Este artigo apresenta uma estrutura para o cálculo certificado e preciso de normas em espaços de funções (como Lebesgue e Sobolev) de redes neurais profundas, combinando aritmética intervalar, refinamento adaptativo e quadratura para fornecer limites determinísticos e garantidos de erros em normas de funções, superando as limitações das avaliações pontuais tradicionais.

Johannes Gründler, Moritz Maibaum, Philipp Petersen2026-03-09🤖 cs.LG

Toward Generative Quantum Utility via Correlation-Complexity Map

Este artigo propõe um Mapa de Correlação-Complexidade como ferramenta diagnóstica para identificar distribuições de dados alinhadas com modelos generativos quânticos do tipo IQP, demonstrando que dados de turbulência clássica, caracterizados por alta complexidade e compatibilidade quântica, podem ser gerados eficientemente por circuitos quânticos compactos com menos amostras de treinamento do que modelos clássicos.

Chen-Yu Liu, Leonardo Placidi, Eric Brunner, Enrico Rinaldi2026-03-09⚛️ quant-ph

Quantum Diffusion Models: Score Reversal Is Not Free in Gaussian Dynamics

O artigo demonstra que, para dinâmicas gaussianas quânticas, a reversão do ruído baseada apenas no escore de Bayes viola a positividade completa quando há emaranhamento ou ruído térmico suficiente, exigindo a injeção de difusão adicional para garantir a validade física do modelo.

Ammar Fayad2026-03-09⚛️ quant-ph

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

O artigo apresenta o NOBLE, uma arquitetura que adiciona ramificações de baixo rank não lineares permanentes às camadas lineares dos transformers para acelerar o pré-treinamento do zero, alcançando ganhos significativos de eficiência e velocidade de convergência com sobrecarga mínima de parâmetros e tempo.

Ethan Smith (Canva Research)2026-03-09🤖 cs.AI

COLD-Steer: Steering Large Language Models via In-Context One-step Learning Dynamics

O artigo apresenta o COLD-Steer, um framework livre de treinamento que controla o comportamento de Grandes Modelos de Linguagem (LLMs) em tempo de inferência ao aproximar as mudanças de representação resultantes do aprendizado em contexto, alcançando alta eficácia de direcionamento com até 50 vezes menos exemplos do que os métodos existentes.

Kartik Sharma, Rakshit S. Trivedi2026-03-09🤖 cs.AI

← Anterior Próximo →