cs.LG artigos | Gist.Science

Fibration Policy Optimization

Este artigo apresenta o Fibration Policy Optimization (FiberPO), um novo quadro teórico e prático que unifica o controle de estabilidade em múltiplas escalas para modelos de linguagem grandes, combinando uma reformulação exata de objetivos de confiança com uma estrutura algébrica de fibrados para otimizar a eficiência e a estabilidade do treinamento em sistemas heterogêneos.

Chang Li, Tshihao Tsu, Yaren Zhang, Chao Xue, Xiaodong He2026-03-10🤖 cs.LG

Optimising antibiotic switching via forecasting of patient physiology

Este artigo propõe um sistema de suporte à decisão baseado em processos neurais que utiliza a previsão probabilística de sinais vitais para identificar pacientes elegíveis para a transição de antibióticos intravenosos para orais, superando as limitações de abordagens que aprendem com decisões históricas e demonstrando maior eficácia na priorização de casos em dados reais dos EUA e do Reino Unido.

Magnus Ross, Nel Swanepoel, Akish Luintel, Emma McGuire, Ingemar J. Cox, Steve Harris, Vasileios Lampos2026-03-10🤖 cs.LG

FedPrism: Adaptive Personalized Federated Learning under Non-IID Data

O artigo apresenta o FedPrism, um framework de Aprendizado Federado que supera a degradação de desempenho em cenários de dados não-IID ao combinar uma decomposição prismática do modelo (compartilhando fundamentos globais, grupos similares e partes privadas) com um design de fluxo duplo que roteia previsões dinamicamente, alcançando assim um equilíbrio eficaz entre generalização e personalização adaptativa.

Prakash Kumbhakar, Shrey Srivastava, Haroon R Lone2026-03-10🤖 cs.LG

FlowTouch: View-Invariant Visuo-Tactile Prediction

O artigo apresenta o FlowTouch, um modelo inovador de previsão visuo-tátil que utiliza malhas 3D locais de objetos e modelos de Fluxo de Correspondência para gerar previsões táteis invariantes à visão, superando limitações de configuração específica e permitindo aplicações como a previsão de estabilidade de preensão.

Seongjin Bien, Carlo Kneissl, Tobias Jülg, Frank Fundel, Thomas Ressler-Antal, Florian Walter, Björn Ommer, Gitta Kutyniok, Wolfram Burgard2026-03-10🤖 cs.LG

Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

Este trabalho apresenta os estimadores ReinMax-Rao e ReinMax-CV, que incorporam técnicas de Rao-Blackwellização e variáveis de controle ao método ReinMax para reduzir a variância na estimação de gradientes de variáveis latentes discretas, demonstrando desempenho superior no treinamento de autoencoders variacionais.

Daniel Wang, Thang D. Bui2026-03-10🤖 cs.LG

Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration

Este artigo apresenta uma arquitetura de navegação por anomalia magnética totalmente adaptativa que utiliza um filtro de Kalman estendido com aprendizado de rede neural para compensar em tempo real as interferências magnéticas da aeronave sem a necessidade de voos de calibração prévia, alcançando precisão comparável aos métodos existentes.

Antonia Hager, Sven Nebendahl, Alexej Klushyn, Jasper Krauser, Torleiv H. Bryne, Tor Arne Johansen2026-03-10🤖 cs.LG

Towards a more efficient bias detection in financial language models

Este artigo propõe um método de detecção de viés mais eficiente para modelos de linguagem financeiros, demonstrando que a análise cruzada entre modelos permite identificar até 73% dos comportamentos tendenciosos utilizando apenas 20% dos pares de entrada, reduzindo significativamente os custos computacionais sem comprometer a eficácia.

Firas Hadj Kacem, Ahmed Khanfir, Mike Papadakis2026-03-10🤖 cs.LG

SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning

O artigo propõe o SCL-GNN, um novo framework de Redes Neurais em Grafos que utiliza o Critério de Independência Hilbert-Schmidt (HSIC) e uma estratégia de otimização bi-nível para identificar e mitigar correlações espúrias, melhorando significativamente a generalização do modelo em cenários de distribuição independente e fora de distribuição (OOD).

Yuxiang Zhang, Enyan Dai2026-03-10🤖 cs.LG

TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction

O artigo apresenta o TA-RNN-Medical-Hybrid, um framework de aprendizado profundo que combina codificação temporal contínua e representações baseadas em SNOMED para prever com precisão e interpretabilidade o risco de mortalidade em UTIs, superando modelos existentes no conjunto de dados MIMIC-III.

Zahra Jafari, Azadeh Zamanifar, Amirfarhad Farhadi2026-03-10🤖 cs.LG

PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

O artigo apresenta o PolyFormer, um modelo de aprendizado de máquina informado pela física que transforma restrições complexas em reformulações polipólicas eficientes, permitindo a resolução escalável de problemas de otimização com leis físicas complexas e alcançando aceleramentos computacionais de até 6.400 vezes sem comprometer a qualidade da solução.

Yilin Wen, Yi Guo, Bo Zhao, Wei Qi, Zechun Hu, Colin Jones, Jian Sun2026-03-10🤖 cs.LG

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Este artigo estabelece limites de arrependimento sublineares para o algoritmo de Reinforcement Learning com Amostragem Posterior baseada em Processos Gaussianos (GP-PSRL) em espaços de estado ilimitados, demonstrando que os estados visitados permanecem confinados e obtendo um limite de arrependimento bayesiano de ordem $\widetilde{\mathcal{O}}(H^{3/2}\sqrt{\gamma_{T/H} T})$ que resolve as limitações teóricas anteriores.

Hamish Flynn, Joe Watson, Ingmar Posner, Jan Peters2026-03-10🤖 cs.LG

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Este artigo demonstra que, ao contrário do Gradiente Descendente, o Sharpness-Aware Minimization (SAM) em redes lineares profundas exibe um viés implícito dependente da profundidade e da inicialização, podendo convergir para soluções triviais ou apresentar uma dinâmica de "amplificação sequencial de características" que prioriza coordenadas menores antes das maiores, revelando limitações nas análises de viés baseadas apenas no limite temporal infinito.

Chaewon Moon, Dongkuk Si, Chulhee Yun2026-03-10🤖 cs.LG

Graph-Instructed Neural Networks for parametric problems with varying boundary conditions

Este trabalho propõe uma metodologia inovadora baseada em Redes Neurais Instruídas por Grafos (GINNs) para simular de forma eficiente e precisa fenômenos físicos governados por equações diferenciais parciais paramétricas com condições de contorno variáveis, superando as limitações das técnicas de ordem reduzida clássicas que exigem reformulação para cada configuração.

Francesco Della Santa, Sandra Pieraccini, Maria Strazzullo2026-03-10🤖 cs.LG

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Este artigo apresenta um novo método de ajuste fino que melhora a robustez de Vision Transformers (ViTs) sob mudanças de distribuição ao orientar o raciocínio do modelo para conceitos semânticos de nível de partes, utilizando máscaras geradas automaticamente por LLMs e VLMs para reduzir a dependência de correlações espúrias.

Yehonatan Elisha, Oren Barkan, Noam Koenigstein2026-03-10🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Este artigo investiga a identificabilidade do sinal de efeitos causais em equações diferenciais estocásticas lineares contínuas e estacionárias com estrutura causal conhecida, relaxando a suposição de uma matriz de difusão conhecida e estabelecendo critérios para determinar se o sinal de um coeficiente de deriva é unicamente determinado a partir de matrizes de covariância observacionais sob uma noção de fidelidade.

Gijs van Seeventer, Saber Salehkaleybar2026-03-10🤖 cs.LG

Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology

Este trabalho apresenta um framework geral para avaliar a qualidade de mapas de calor em aprendizado de múltiplas instâncias (MIL) para patologia digital, demonstrando que métodos como perturbação, LRP e IG superam os baseados em atenção e permitem validação biológica e descoberta de estratégias de modelos sem necessidade de rótulos adicionais.

Mina Jamshidi Idaji, Julius Hense, Tom Neuhäuser, Augustin Krause, Yanqing Luo, Oliver Eberle, Thomas Schnake, Laure Ciernik, Farnoush Rezaei Jafari, Reza Vahidimajd, Jonas Dippel, Christoph Walz, Frederick Klauschen, Andreas Mock, Klaus-Robert Müller2026-03-10🤖 cs.LG

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Este artigo demonstra que a combinação de características baseadas no operador de Koopman (aproximado via EDMD com dicionário de funções de base radial) e transformadores supera tanto as abordagens baseadas apenas em wavelets quanto sistemas híbridos na classificação multiclasse de eletrocardiogramas, oferecendo insights interpretáveis sobre a dinâmica cardíaca.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Rethinking Attention Output Projection: Structured Hadamard Transforms for Efficient Transformers

Este artigo propõe substituir a projeção de saída densa na atenção multi-cabeça por uma Transformada de Hadamard estruturada e livre de parâmetros seguida de um redimensionamento afim leve, reduzindo significativamente o número de parâmetros e o custo de inferência sem comprometer o desempenho em tarefas padrão.

Shubham Aggarwal, Lokendra Kumar2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Este artigo apresenta um novo método baseado em otimização por gradiente que gera explicações contrafactuais plausíveis para problemas de classificação de séries temporais, integrando o alinhamento soft-DTW com k-vizinhos mais próximos para garantir que as explicações geradas mantenham uma estrutura temporal realista e alinhada à distribuição da classe-alvo.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Unifying On- and Off-Policy Variance Reduction Methods

Este artigo unifica os métodos de redução de variância para experimentação online e avaliação off-policy, demonstrando a equivalência matemática entre o estimador de diferenças de médias e o estimador de pontuação de propensão inversa com variáveis de controle, bem como entre métodos de ajuste por regressão e a estimativa duplamente robusta.

Olivier Jeunen2026-03-10🤖 cs.LG

← Anterior Próximo →