cs.LG artigos | Gist.Science

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Este trabalho apresenta a primeira caracterização de equivalência distribucional e um método de aprendizado estruturalmente livre para modelos causais lineares não-Gaussianos com variáveis latentes e ciclos, estabelecendo critérios gráficos e um algoritmo para recuperar modelos a partir de dados sem assumir restrições estruturais prévias.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Este artigo propõe o Diffusion Policy through Conditional Proximal Policy Optimization, um método eficiente que permite o treinamento de políticas de difusão em cenários de aprendizado por reforço on-policy ao alinhar a iteração da política com o processo de difusão, eliminando a necessidade de cálculos complexos de verossimilhança e permitindo a regularização por entropia, resultando em desempenho superior em diversas tarefas de robótica.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Este artigo propõe o método DCR (Diffusion Contrastive Reconstruction), que integra sinais contrastivos derivados das imagens reconstruídas em vez das originais no processo de difusão para superar as limitações do CLIP, equilibrando simultaneamente a capacidade discriminativa e a percepção de detalhes na representação visual.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Este artigo demonstra que a localidade e o compartilhamento de pesos em redes neurais convolucionais alteram fundamentalmente a regularização implícita, permitindo a generalização em dados esféricos de alta dimensão onde redes totalmente conectadas falham, ao acoplar os filtros aprendidos a uma variedade de patches de baixa dimensão.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Este artigo apresenta a solução "WhisperAlign" para o DL Sprint 4.0, que combina uma estratégia de fragmentação de áudio baseada em WhisperX para reconhecimento de fala e um modelo de diarização de fala ajustado especificamente para o dataset da competição, resultando em reduções significativas nas taxas de erro para transcrição e identificação de falantes em longas gravações de áudio em bengali.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity

Este artigo estabelece uma conexão entre polaridade quadrática e divergências de Fenchel-Young polares, demonstrando que transformações de Legendre-Fenchel podem ser manipuladas via álgebra linear em coordenadas homogêneas e revelando uma nova dualidade de referência na geometria da informação através da generalização de divergências de Bregman.

Frank Nielsen, Basile Plus-Gourdon, Mahito Sugiyama2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artigo investiga as capacidades de generalização de modelos fundacionais corporativos para assistência corretiva em conjunto aberto, demonstrando através de dados sintéticos no Overcooked que o desempenho ideal requer conjuntos de dados diversificados que abranjam fundamentação multimodal, inferência de defeitos e exposição a cenários variados.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Mitigating Instance Entanglement in Instance-Dependent Partial Label Learning

O artigo propõe o framework CAD (Class-specific Augmentation based Disentanglement), que mitiga o emaranhamento de instâncias no aprendizado de rótulos parciais dependente de instância (ID-PLL) através de regulamentações intra e interclasse para melhorar a clareza dos limites entre classes e reduzir a confusão.

Rui Zhao, Bin Shi, Kai Sun + 1 more2026-03-06🤖 cs.LG

Multilevel Training for Kolmogorov Arnold Networks

Este artigo propõe um método de treinamento multiescala para Redes de Kolmogorov-Arnold (KANs) que explora sua estrutura de base de splines para criar uma hierarquia de modelos aninhados, resultando em aceleração significativa no treinamento e em ganhos substanciais de precisão, especialmente em redes neurais informadas por física.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

Missingness Bias Calibration in Feature Attribution Explanations

Este trabalho apresenta o MCal, um método pós-hoc leve que corrige o viés de ausência em explicações de atribuição de características ao ajustar uma simples camada linear em modelos congelados, superando abordagens anteriores mais complexas em diversos domínios médicos.

Shailesh Sridhar, Anton Xue, Eric Wong2026-03-06🤖 cs.LG

Why Is RLHF Alignment Shallow? A Gradient Analysis

Este artigo demonstra teoricamente que o alinhamento baseado em RLHF é superficial porque os gradientes de treinamento desaparecem após o ponto em que o dano é determinado, e propõe uma nova função objetivo baseada em penalidades de recuperação para garantir sinais de gradiente em todas as posições da sequência.

Robin Young2026-03-06🤖 cs.LG

Osmosis Distillation: Model Hijacking with the Fewest Samples

O artigo apresenta o ataque de "Osmosis Distillation", uma nova estratégia de sequestro de modelo que demonstra como um adversário pode comprometer modelos de aprendizado por transferência usando apenas algumas amostras envenenadas em conjuntos de dados sintetizados por destilação, mantendo ao mesmo tempo a utilidade do modelo nas tarefas originais.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

O artigo apresenta o ReCouPLe, um framework leve que utiliza raciocínios em linguagem natural para fornecer sinais causais e aprender recompensas robustas a partir de feedback de preferência, permitindo a transferência de conhecimento para novas tarefas e melhorando significativamente a precisão e o desempenho sob mudanças de distribuição.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudo apresenta um modelo interpretável que alcança 80,4% de precisão na antecipação de oito tipos de arremessos de beisebol a partir de sequências de pose 3D em broadcast, revelando que a mecânica do tronco e do pulso são os principais preditores e estabelecendo um limite empírico de aproximadamente 80% para a distinção de variantes baseadas apenas no movimento corporal.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness

Este artigo apresenta uma análise teórica unificada que demonstra como o ruído adicionado pelo DP-SGD em redes neurais degrada o aprendizado de características, comprometendo a justiça, a robustez adversarial e a eficácia do ajuste fino com pré-treinamento público devido a desequilíbrios na razão sinal-ruído das características.

Ruichen Xu, Kexin Chen2026-03-06🤖 cs.LG

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

O artigo propõe o FedAFD, um quadro unificado de aprendizado federado multimodal que utiliza alinhamento adversarial, fusão adaptativa e destilação guiada por similaridade para superar desafios de heterogeneidade de dados e modelos, melhorando o desempenho tanto no cliente quanto no servidor.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Este artigo demonstra que, para dados aleatórios de alta dimensão, o viés implícito do gradiente descendente no treinamento de modelos ReLU rasos aproxima-se com alta probabilidade da solução de norma L2 mínima, com um desvio na ordem de $\Theta(\sqrt{n/d})$ , através de uma nova análise primal-dual que rastreia a estabilização dos padrões de ativação ReLU.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning

Este trabalho apresenta o U-Parking, um sistema de estacionamento autônomo distribuído que utiliza Ultra-Wideband (UWB) para localização robusta e planejamento assistido por Modelos de Linguagem Grande (LLMs), permitindo manobras confiáveis em ambientes internos desafiadores.

Yiang Wu, Qiong Wu, Pingyi Fan + 4 more2026-03-06🤖 cs.LG

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

O artigo apresenta o VPWEM, uma política visuomotora não markoviana que integra memórias de trabalho e episódicas por meio de um compressor contextual baseado em Transformer, permitindo que robôs aprendam tarefas de manipulação complexas com memória de longo prazo de forma eficiente e superando significativamente os métodos atuais.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

EVMbench: Evaluating AI Agents on Smart Contract Security

O artigo apresenta o EVMbench, um benchmark que avalia a capacidade de agentes de IA de detectar, corrigir e explorar vulnerabilidades em contratos inteligentes, demonstrando que os modelos atuais conseguem realizar esses ataques de ponta a ponta em ambientes de blockchain reais.

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

← Anterior Próximo →