Improving Conditional VAE with Non-Volume Preserving transformations

Este artigo propõe aprimorar os Autoencoders Variacionais Condicionais (CVAE) para geração de imagens, introduzindo um parâmetro de variância aprendível no decodificador e utilizando transformações não preservadoras de volume (NVP) para estimar a distribuição condicional do espaço latente, resultando em imagens com maior diversidade e qualidade, conforme demonstrado pela redução de 4% no FID e aumento de 7,6% na verossimilhança logarítmica em comparação com métodos anteriores.

Tuhin Subhra De2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Este trabalho propõe um novo método de ataque adversarial para redes hiperbólicas, chamado Angular Gradient Sign, que explora as propriedades geométricas do espaço hiperbólico ao aplicar perturbações apenas na direção angular (semântica) do gradiente, resultando em taxas de engano superiores e revelando vulnerabilidades específicas dessas representações hierárquicas.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Este artigo apresenta um pipeline automatizado para gerar um conjunto de dados em larga escala de ataques de jailbreak multi-turno baseados no princípio psicológico "Pé na Porta", revelando que, embora modelos como o Gemini 2.5 Flash demonstrem alta resiliência, modelos da família GPT são significativamente vulneráveis a manipulações narrativas que exploram o histórico de conversação.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Este artigo relata os resultados de uma competição no Kaggle que demonstrou que arquiteturas de aprendizado de máquina inspiradas em soluções vencedoras podem ser acopladas com sucesso a modelos climáticos interativos, alcançando estabilidade online e desempenho de ponta em simulações híbridas de física e IA.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Este estudo apresenta o ForamDeepSlice, um framework de aprendizado profundo baseado em um ensemble de redes neurais que alcança alta precisão na classificação automática de espécies de foraminíferos a partir de fatias 2D de micro-TC, estabelecendo novos benchmarks para identificação micropaleontológica assistida por IA.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Este artigo apresenta o algoritmo DROCO, uma abordagem inovadora de aprendizado por reforço offline cruzado que garante robustez simultânea durante o treinamento e a teste contra mudanças dinâmicas, superando as limitações de métodos existentes que negligenciam a estabilidade em cenários de implantação prática.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

O artigo apresenta o GoRL, um framework que supera a instabilidade e a falta de expressividade de políticas em aprendizado por reforço online ao decoplar a otimização em um espaço latente tratável da geração de ações por um decoder generativo, alcançando desempenho superior em tarefas de controle contínuo.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

O artigo apresenta a Regressão Isotônica Shapley Esparsa (SISR), um novo framework unificado de explicação não linear que supera as limitações de aditividade e custo computacional dos valores Shapley tradicionais ao aprender simultaneamente uma transformação monótona para restaurar a aditividade e impor esparsidade para identificar características relevantes em espaços de alta dimensão.

Jialai She2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

O artigo apresenta o Re-Depth Anything, um framework de auto-supervisão em tempo de teste que aprimora a estimativa de profundidade monocromática ao fundir modelos fundamentais com priors de modelos de difusão 2D para re-sintetizar a iluminação e refinar a profundidade sem rótulos, superando significativamente os modelos existentes como o Depth Anything V2 e alcançando resultados state-of-the-art ao ser aplicado sobre o Depth Anything 3.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Este artigo propõe três estratégias complementares para acelerar o treinamento de Redes de Kolmogorov-Arnold (KANs) baseadas no método Newton-Kaczmarz: um pré-treinamento adaptado, o treinamento em subconjuntos de dados disjuntos com posterior fusão de modelos e uma técnica de paralelização implementada em FPGAs, resultando em ganhos significativos de velocidade e precisão.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG