cs.LG artigos | Gist.Science

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

O artigo propõe o FedAFD, um quadro unificado de aprendizado federado multimodal que utiliza alinhamento adversarial, fusão adaptativa e destilação guiada por similaridade para superar desafios de heterogeneidade de dados e modelos, melhorando o desempenho tanto no cliente quanto no servidor.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Este artigo demonstra que, para dados aleatórios de alta dimensão, o viés implícito do gradiente descendente no treinamento de modelos ReLU rasos aproxima-se com alta probabilidade da solução de norma L2 mínima, com um desvio na ordem de $\Theta(\sqrt{n/d})$ , através de uma nova análise primal-dual que rastreia a estabilização dos padrões de ativação ReLU.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning

Este trabalho apresenta o U-Parking, um sistema de estacionamento autônomo distribuído que utiliza Ultra-Wideband (UWB) para localização robusta e planejamento assistido por Modelos de Linguagem Grande (LLMs), permitindo manobras confiáveis em ambientes internos desafiadores.

Yiang Wu, Qiong Wu, Pingyi Fan + 4 more2026-03-06🤖 cs.LG

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

O artigo apresenta o VPWEM, uma política visuomotora não markoviana que integra memórias de trabalho e episódicas por meio de um compressor contextual baseado em Transformer, permitindo que robôs aprendam tarefas de manipulação complexas com memória de longo prazo de forma eficiente e superando significativamente os métodos atuais.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

EVMbench: Evaluating AI Agents on Smart Contract Security

O artigo apresenta o EVMbench, um benchmark que avalia a capacidade de agentes de IA de detectar, corrigir e explorar vulnerabilidades em contratos inteligentes, demonstrando que os modelos atuais conseguem realizar esses ataques de ponta a ponta em ambientes de blockchain reais.

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

O artigo apresenta o BandPO, um novo método de otimização para aprendizado por reforço em LLMs que substitui o recorte fixo do PPO por limites dinâmicos baseados em divergências f para mitigar o colapso de entropia e melhorar a estabilidade do treinamento.

Yuan Li, Bo Wang, Yufei Gao + 4 more2026-03-06🤖 cs.AI

Semantic Communication-Enhanced Split Federated Learning for Vehicular Networks: Architecture, Challenges, and Case Study

Este artigo propõe o framework SC-USFL, que integra comunicação semântica ao aprendizado federativo dividido em redes veiculares para reduzir a sobrecarga de comunicação e preservar a privacidade das etiquetas, adaptando-se dinamicamente às condições do canal sem fio.

Lu Yu, Zheng Chang, Ying-Chang Liang2026-03-06🤖 cs.LG

Person Detection and Tracking from an Overhead Crane LiDAR

Este artigo apresenta a criação de um conjunto de dados específico para detecção e rastreamento de pessoas por LiDAR em visão aérea de guindastes industriais, avaliando e adaptando detectores 3D e algoritmos de rastreamento para superar o deslocamento de domínio e demonstrar a viabilidade em tempo real dessa aplicação.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

$\nabla$ -Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space

O artigo apresenta o $\nabla$ -Reasoner, um novo framework que integra otimização diferenciável no espaço latente durante a inferência para refinar o raciocínio de modelos de linguagem, alcançando melhorias significativas de precisão e eficiência em tarefas matemáticas complexas.

Peihao Wang, Ruisi Cai, Zhen Wang + 4 more2026-03-06🤖 cs.LG

TimeWarp: Evaluating Web Agents by Revisiting the Past

O artigo apresenta o TimeWarp, um benchmark que avalia a robustez de agentes web diante de mudanças no design e layout da internet, e propõe o algoritmo TimeTraj, que utiliza destilação de planos em múltiplas versões de interface para superar as limitações da clonagem de comportamento tradicional e melhorar significativamente o desempenho de modelos como Qwen-3 e Llama-3.1.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data

Este estudo demonstra que modelos baseados em Transformers com cabeças de saída evidenciais oferecem a estrutura mais eficaz para previsão de glicose no sangue e quantificação de incerteza em pacientes com diabetes tipo 1, superando arquiteturas LSTM e GRU em precisão e calibração de riscos clínicos.

Hai Siong Tan2026-03-06✓ Author reviewed ⓘ🔬 physics

WaterSIC: information-theoretically (near) optimal linear layer quantization

O artigo apresenta o WaterSIC, um novo algoritmo de quantização linear que, ao alocar taxas de quantização variáveis para diferentes colunas da matriz de pesos inspirando-se no princípio de "waterfilling", alcança um desempenho próximo ao limite teórico da informação e supera os métodos atuais em modelos de linguagem como Llama e Qwen.

Egor Lifar, Semyon Savkin, Or Ordentlich + 1 more2026-03-06🔢 math

Replaying pre-training data improves fine-tuning

O estudo demonstra que reproduzir dados genéricos durante o ajuste fino (fine-tuning) de modelos de linguagem, em vez de apenas misturá-los para evitar o esquecimento catastrófico, melhora significativamente a eficiência dos dados e o desempenho em tarefas de domínio específico.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

O artigo apresenta o Mixture of Universal Experts (MOUE), uma generalização de MoE que introduz a "largura virtual" ao reutilizar um pool universal de especialistas entre camadas, superando desafios de roteamento e balanceamento de carga para alcançar ganhos de desempenho superiores aos modelos MoE tradicionais.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Este artigo propõe um método de fusão de grandes modelos de linguagem (LLMs) baseado na média de Karcher no manifold de Fisher-Rao, que supera as limitações das abordagens heurísticas no espaço de parâmetros ao preservar a funcionalidade e evitar o colapso de representações, especialmente ao combinar múltiplos modelos heterogêneos.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

Lightweight and Scalable Transfer Learning Framework for Load Disaggregation

Este artigo apresenta o RefQuery, um framework de aprendizado por transferência leve e escalável para monitoramento não intrusivo de carga (NILM) que utiliza uma rede pré-treinada congelada e adapta-se a diferentes residências aprendendo apenas embeddings compactos por aparelho, permitindo uma desagregação precisa e eficiente em tempo real em dispositivos de borda.

L. E. Garcia-Marrero, G. Petrone, E. Monmasson2026-03-06🤖 cs.LG

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Este artigo apresenta uma estrutura de aprendizado por reforço multioperador que integra a teoria da escolha discreta para modelar a dinâmica competitiva de mercado em sistemas de Mobilidade Autônoma sob Demanda (AMoD), demonstrando que a concorrência leva a preços mais baixos e padrões de reposição de frota distintos em comparação com cenários monopolistas, enquanto mantém a robustez na convergência de políticas eficazes.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Este artigo propõe uma interpretação da Estabilidade Limite (Edge of Stability) através da suavidade direcional generalizada para normas não euclidianas, demonstrando experimentalmente que diversos otimizadores, incluindo descida de gradiente não euclidiana, exibem esse fenômeno de estabilização em torno de um limiar de curvatura definido pela geometria do espaço.

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Este trabalho propõe o método BA-Logic, que supera as limitações de ataques de backdoor existentes em Graph Neural Networks sob o cenário de "clean-label" ao coordenar a seleção de nós envenenados com a geração de gatilhos que alteram a lógica interna de previsão do modelo, garantindo assim uma alta taxa de sucesso sem a necessidade de modificar os rótulos de treinamento.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Este artigo apresenta o Índice de Credibilidade via Estabilidade de Explicação (CIES), uma nova métrica matematicamente fundamentada que avalia a robustez das explicações de modelos de IA em cenários de negócios reais, demonstrando que a estabilidade das justificativas de decisão é crucial e influenciada pela complexidade do modelo e pelo tratamento de desequilíbrio de classes.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

← Anterior Próximo →

cs.LG