cs.LG artigos | Gist.Science

Synthetic Monitoring Environments for Reinforcement Learning

Este artigo apresenta as Synthetic Monitoring Environments (SMEs), uma suite infinita de tarefas de controle contínuo com políticas ótimas conhecidas e métricas de desempenho exatas, projetada para permitir diagnósticos precisos e análises científicas rigorosas do comportamento de agentes de Aprendizado por Reforço, superando as limitações de benchmarks atuais.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artigo propõe o modelo BAEN-SVM, que utiliza uma nova função de perda elástica assimétrica limitada para criar uma máquina de vetores de suporte robusta a ruídos, geometricamente bem definida e com garantia de consistência, resolvendo o problema de otimização não convexo por meio de um algoritmo eficiente e demonstrando superioridade em experimentos com dados ruidosos.

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

O artigo propõe o DeCoST, uma abordagem de aprendizado baseada em duas etapas que desacopla variáveis discretas e contínuas para resolver o Problema de Orientação com Janelas de Tempo e Lucros Variáveis (OPTWVP), superando os métodos existentes em qualidade da solução e eficiência computacional.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Este estudo demonstra que pipelines de raciocínio agênico com recuperação aumentada melhoram a robustez e o consenso entre modelos de linguagem variados em perguntas de radiologia, embora a concordância elevada não garanta necessariamente a correção e muitos erros permaneçam clinicamente graves.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Looking Through Glass Box

Este artigo apresenta uma implementação neural de mapas cognitivos difusos (FHM) que utiliza dinâmica de Langevin para aprender padrões de causalidade, evitar overfitting e fornecer critérios de modificação para inversão de valores de saída, com sua eficácia validada em diversos conjuntos de dados.

Alexis Kafantaris2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

O artigo apresenta o Stem, um módulo de esparsidade plug-and-play que otimiza o fluxo de informação em mecanismos de atenção causal ao empregar uma seleção top-k dependente da posição e uma métrica consciente da saída, superando o gargalo computacional de modelos de linguagem grandes em contextos longos com maior precisão e menor latência.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

O artigo apresenta o GMM-PIELM, um framework probabilístico que aprimora as Máquinas de Aprendizado Extremo Informadas pela Física (PIELMs) ao utilizar um algoritmo de Expectativa-Maximização ponderado para adaptar automaticamente a amostragem de funções de base radial às regiões de alta complexidade física, resolvendo com precisão equações diferenciais parciais rígidas com erros significativamente menores e mantendo a velocidade de treinamento superior das PIELMs.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Este artigo propõe um método inovador de remoção de artefatos em imagens 3D de CBCT dentário, utilizando modelos de difusão baseados em pontuação perpendicular que operam no domínio das projeções para preservar as correlações espaciais e gerar reconstruções de alta qualidade.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Este artigo apresenta o PolaDCA, um novo framework de aprendizado relacional baseado em atenção cruzada direta polarizada que supera as limitações das redes neurais gráficas convencionais na diagnóstico de falhas em máquinas rotativas, oferecendo maior robustez ao ruído e precisão através da construção de grafos adaptativos orientada por dados.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

O artigo propõe um pipeline de três etapas para pós-treinar Modelos de Linguagem Grandes (LLMs) a inferir estimativas de incerteza calibradas e interpretáveis de forma eficiente, combinando pontuações de entropia, calibração via Platt scaling e aprendizado por reforço para superar as limitações computacionais e de precisão dos métodos pós-hoc existentes.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

O artigo apresenta o SAHOO, um framework prático que utiliza três mecanismos de segurança para monitorar e controlar a deriva de alinhamento durante a autoaperfeiçoamento recursivo de sistemas de IA, resultando em ganhos significativos de qualidade em tarefas de código e raciocínio sem comprometer a segurança ou a veracidade.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

O artigo apresenta o AIRT, um framework de aprendizado profundo de ponta a ponta capaz de gerar planos de radioterapia VMAT para próstata em menos de um segundo, demonstrando qualidade não inferior aos planos convencionais do RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

O MoEless é o primeiro framework de serviço serverless para Modelos de Linguagem de Grande Escala (LLMs) com Mistura de Especialistas (MoE) que mitiga o desequilíbrio de carga entre especialistas e reduz a latência e os custos de inferência através de previsões de carga, escalabilidade dinâmica e estratégias otimizadas de alocação em GPUs.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

O artigo apresenta o DC-DiT, um modelo de difusão que utiliza um mecanismo de "chunking" dinâmico e aprendido para adaptar a quantidade de tokens processados conforme a complexidade visual da imagem e o estágio da difusão, melhorando a eficiência computacional e a qualidade da geração sem necessidade de supervisão explícita.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Este trabalho apresenta a Frequency-Separable Hamiltonian Neural Network (FS-HNN), uma arquitetura que supera as limitações de redes neurais hamiltonianas convencionais na captura de dinâmicas multiescala ao parametrizar o Hamiltoniano através de múltiplas redes treinadas em diferentes escalas de tempo, resultando em melhorias significativas na extrapolação de longo prazo e na generalização para sistemas de equações diferenciais ordinárias e parciais.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Tiny, Hardware-Independent, Compression-based Classification

Este trabalho apresenta um modelo de classificação baseado em distância de compressão normalizada que, apesar de não ser uma métrica formal, oferece alta precisão com poucos dados e baixo custo computacional, permitindo a execução eficiente de aprendizado de máquina diretamente em dispositivos de usuário para preservar a privacidade.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

O artigo apresenta o CLAIRE, um framework de aprendizado profundo híbrido que combina autoencoders para extração de características latentes e técnicas de IA explicável para melhorar a detecção precisa e interpretável de falhas em ambientes industriais de alta dimensão.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Este artigo apresenta o ALFCG, o primeiro framework adaptativo e livre de projeção para minimização estocástica não convexa que dispensa constantes de suavidade globais e busca linear, utilizando um acumulador auto-normalizado para estimar a suavidade local e alcançar complexidades de iteração ótimas próximas de $\mathcal{O}(\epsilon^{-2})$ em cenários de baixo ruído.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Este artigo estende a regularização baseada em cinética (KBR) para aprender derivadas espaciais com precisão de segunda ordem em dados ruidosos, propondo esquemas explícitos e implícitos que, ao serem acoplados a solvers conservadores, permitem a captura estável de choques em EDPs hiperbólicas e abrem caminho para a resolução de equações em nuvens de pontos irregulares.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

O artigo propõe uma arquitetura de orquestração com "portões de esquema" que separa a flexibilidade conversacional da execução determinística, permitindo que modelos de linguagem traduzam objetivos naturais em fluxos de trabalho científicos reprodutíveis e governados sem comprometer a precisão.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

← Anterior Próximo →