Synthetic Monitoring Environments for Reinforcement Learning

Este artigo apresenta as Synthetic Monitoring Environments (SMEs), uma suite infinita de tarefas de controle contínuo com políticas ótimas conhecidas e métricas de desempenho exatas, projetada para permitir diagnósticos precisos e análises científicas rigorosas do comportamento de agentes de Aprendizado por Reforço, superando as limitações de benchmarks atuais.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artigo propõe o modelo BAEN-SVM, que utiliza uma nova função de perda elástica assimétrica limitada para criar uma máquina de vetores de suporte robusta a ruídos, geometricamente bem definida e com garantia de consistência, resolvendo o problema de otimização não convexo por meio de um algoritmo eficiente e demonstrando superioridade em experimentos com dados ruidosos.

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Este estudo demonstra que pipelines de raciocínio agênico com recuperação aumentada melhoram a robustez e o consenso entre modelos de linguagem variados em perguntas de radiologia, embora a concordância elevada não garanta necessariamente a correção e muitos erros permaneçam clinicamente graves.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

O artigo apresenta o Stem, um módulo de esparsidade plug-and-play que otimiza o fluxo de informação em mecanismos de atenção causal ao empregar uma seleção top-k dependente da posição e uma métrica consciente da saída, superando o gargalo computacional de modelos de linguagem grandes em contextos longos com maior precisão e menor latência.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

O artigo apresenta o GMM-PIELM, um framework probabilístico que aprimora as Máquinas de Aprendizado Extremo Informadas pela Física (PIELMs) ao utilizar um algoritmo de Expectativa-Maximização ponderado para adaptar automaticamente a amostragem de funções de base radial às regiões de alta complexidade física, resolvendo com precisão equações diferenciais parciais rígidas com erros significativamente menores e mantendo a velocidade de treinamento superior das PIELMs.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Este artigo propõe um método inovador de remoção de artefatos em imagens 3D de CBCT dentário, utilizando modelos de difusão baseados em pontuação perpendicular que operam no domínio das projeções para preservar as correlações espaciais e gerar reconstruções de alta qualidade.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Este artigo apresenta o PolaDCA, um novo framework de aprendizado relacional baseado em atenção cruzada direta polarizada que supera as limitações das redes neurais gráficas convencionais na diagnóstico de falhas em máquinas rotativas, oferecendo maior robustez ao ruído e precisão através da construção de grafos adaptativos orientada por dados.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

O artigo propõe um pipeline de três etapas para pós-treinar Modelos de Linguagem Grandes (LLMs) a inferir estimativas de incerteza calibradas e interpretáveis de forma eficiente, combinando pontuações de entropia, calibração via Platt scaling e aprendizado por reforço para superar as limitações computacionais e de precisão dos métodos pós-hoc existentes.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

O artigo apresenta o SAHOO, um framework prático que utiliza três mecanismos de segurança para monitorar e controlar a deriva de alinhamento durante a autoaperfeiçoamento recursivo de sistemas de IA, resultando em ganhos significativos de qualidade em tarefas de código e raciocínio sem comprometer a segurança ou a veracidade.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

O artigo apresenta o AIRT, um framework de aprendizado profundo de ponta a ponta capaz de gerar planos de radioterapia VMAT para próstata em menos de um segundo, demonstrando qualidade não inferior aos planos convencionais do RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Este trabalho apresenta a Frequency-Separable Hamiltonian Neural Network (FS-HNN), uma arquitetura que supera as limitações de redes neurais hamiltonianas convencionais na captura de dinâmicas multiescala ao parametrizar o Hamiltoniano através de múltiplas redes treinadas em diferentes escalas de tempo, resultando em melhorias significativas na extrapolação de longo prazo e na generalização para sistemas de equações diferenciais ordinárias e parciais.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Este artigo apresenta o ALFCG, o primeiro framework adaptativo e livre de projeção para minimização estocástica não convexa que dispensa constantes de suavidade globais e busca linear, utilizando um acumulador auto-normalizado para estimar a suavidade local e alcançar complexidades de iteração ótimas próximas de O(ϵ2)\mathcal{O}(\epsilon^{-2}) em cenários de baixo ruído.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Este artigo estende a regularização baseada em cinética (KBR) para aprender derivadas espaciais com precisão de segunda ordem em dados ruidosos, propondo esquemas explícitos e implícitos que, ao serem acoplados a solvers conservadores, permitem a captura estável de choques em EDPs hiperbólicas e abrem caminho para a resolução de equações em nuvens de pontos irregulares.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

O artigo propõe uma arquitetura de orquestração com "portões de esquema" que separa a flexibilidade conversacional da execução determinística, permitindo que modelos de linguagem traduzam objetivos naturais em fluxos de trabalho científicos reprodutíveis e governados sem comprometer a precisão.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI