cs.LG artigos | Gist.Science

Improving Conditional VAE with Non-Volume Preserving transformations

Este artigo propõe aprimorar os Autoencoders Variacionais Condicionais (CVAE) para geração de imagens, introduzindo um parâmetro de variância aprendível no decodificador e utilizando transformações não preservadoras de volume (NVP) para estimar a distribuição condicional do espaço latente, resultando em imagens com maior diversidade e qualidade, conforme demonstrado pela redução de 4% no FID e aumento de 7,6% na verossimilhança logarítmica em comparação com métodos anteriores.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Este artigo propõe um método de verificação de robustez escalável e mais rigoroso para ataques $\ell_0$ ao demonstrar que o casco convexo da bola $\ell_0$ pode ser aproximado por um politopo específico, permitindo uma propagação de limites lineares que supera significativamente os verificadores existentes em benchmarks desafiadores.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Este trabalho propõe um novo método de ataque adversarial para redes hiperbólicas, chamado Angular Gradient Sign, que explora as propriedades geométricas do espaço hiperbólico ao aplicar perturbações apenas na direção angular (semântica) do gradiente, resultando em taxas de engano superiores e revelando vulnerabilidades específicas dessas representações hierárquicas.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Este trabalho apresenta um novo quadro probabilístico "(k, $\varepsilon$ )-instável" que supera as limitações da defesa SmoothLLM ao fornecer garantias de segurança mais realistas e fundamentadas em dados contra uma ampla gama de ataques de jailbreaking em LLMs.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Este artigo apresenta um pipeline automatizado para gerar um conjunto de dados em larga escala de ataques de jailbreak multi-turno baseados no princípio psicológico "Pé na Porta", revelando que, embora modelos como o Gemini 2.5 Flash demonstrem alta resiliência, modelos da família GPT são significativamente vulneráveis a manipulações narrativas que exploram o histórico de conversação.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

O artigo propõe um método de regularização direcionada no espaço latente que identifica e reduz a dependência de eixos de atalho por meio da injeção de ruído anisotrópico, melhorando a generalização fora de distribuição sem exigir rótulos de atalho ou exemplos conflitantes.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Este artigo relata os resultados de uma competição no Kaggle que demonstrou que arquiteturas de aprendizado de máquina inspiradas em soluções vencedoras podem ser acopladas com sucesso a modelos climáticos interativos, alcançando estabilidade online e desempenho de ponta em simulações híbridas de física e IA.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

O artigo apresenta o CRAwDAD, um framework de debate entre dois agentes que aprimora significativamente a precisão da inferência causal em modelos de linguagem de raciocínio ao simular um diálogo crítico entre hipóteses concorrentes, alcançando ganhos substanciais de desempenho em tarefas complexas como as do conjunto de dados CLadder.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Este estudo apresenta o ForamDeepSlice, um framework de aprendizado profundo baseado em um ensemble de redes neurais que alcança alta precisão na classificação automática de espécies de foraminíferos a partir de fatias 2D de micro-TC, estabelecendo novos benchmarks para identificação micropaleontológica assistida por IA.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

O artigo apresenta o AltNet, uma abordagem baseada em redes gêmeas que resolve o dilema plasticidade-estabilidade no aprendizado por reforço, permitindo a restauração da plasticidade por meio de resets periódicos sem causar quedas de desempenho, garantindo assim maior eficiência e segurança em tarefas de controle de alta dimensão.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

O artigo apresenta o MSPT, uma arquitetura baseada em Transformers que utiliza atenção multi-escala e árvores de bolas para modelar fisicamente interações locais e globais em milhões de elementos espaciais com alta eficiência computacional e baixo consumo de memória em uma única GPU.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

O artigo propõe o "Dual Randomized Smoothing", um novo quadro teórico e prático que supera as limitações da variância de ruído global ao permitir variâncias dependentes da entrada, alcançando assim um desempenho robusto superior tanto para perturbações pequenas quanto grandes em conjuntos de dados como CIFAR-10 e ImageNet.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Este artigo apresenta o algoritmo DROCO, uma abordagem inovadora de aprendizado por reforço offline cruzado que garante robustez simultânea durante o treinamento e a teste contra mudanças dinâmicas, superando as limitações de métodos existentes que negligenciam a estabilidade em cenários de implantação prática.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

O artigo apresenta o GoRL, um framework que supera a instabilidade e a falta de expressividade de políticas em aprendizado por reforço online ao decoplar a otimização em um espaço latente tratável da geração de ações por um decoder generativo, alcançando desempenho superior em tarefas de controle contínuo.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

O artigo apresenta a Regressão Isotônica Shapley Esparsa (SISR), um novo framework unificado de explicação não linear que supera as limitações de aditividade e custo computacional dos valores Shapley tradicionais ao aprender simultaneamente uma transformação monótona para restaurar a aditividade e impor esparsidade para identificar características relevantes em espaços de alta dimensão.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Este trabalho propõe um framework de aumento de dados em duas etapas, combinando warping baseado em regras com tradução de imagem não pareada via GANs, para gerar amostras realistas de rostos mascarados e melhorar a detecção e reconhecimento facial, apesar das limitações de recursos e dados enfrentadas pelo autor.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

O artigo apresenta o SALVE, um framework unificado que utiliza autoencoders esparsos e mapeamento de saliência para descobrir, validar e realizar edições precisas no espaço de pesos de redes neurais, permitindo o controle mecânico e interpretável de seus comportamentos.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

O artigo apresenta o LaMer, um framework de Meta-RL que capacita agentes de linguagem a explorar ativamente e adaptar suas políticas em tempo de execução por meio de reflexão, superando significativamente as abordagens de RL tradicionais em tarefas de longo prazo e ambientes não vistos.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

O artigo apresenta o Re-Depth Anything, um framework de auto-supervisão em tempo de teste que aprimora a estimativa de profundidade monocromática ao fundir modelos fundamentais com priors de modelos de difusão 2D para re-sintetizar a iluminação e refinar a profundidade sem rótulos, superando significativamente os modelos existentes como o Depth Anything V2 e alcançando resultados state-of-the-art ao ser aplicado sobre o Depth Anything 3.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Este artigo propõe três estratégias complementares para acelerar o treinamento de Redes de Kolmogorov-Arnold (KANs) baseadas no método Newton-Kaczmarz: um pré-treinamento adaptado, o treinamento em subconjuntos de dados disjuntos com posterior fusão de modelos e uma técnica de paralelização implementada em FPGAs, resultando em ganhos significativos de velocidade e precisão.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

← Anterior Próximo →

cs.LG