cs.LG artigos | Gist.Science

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

O artigo propõe o FedLECC, uma estratégia leve e guiada por clusters e perdas para a seleção de clientes em Aprendizado Federado, que melhora a precisão, reduz o número de rodadas de comunicação e diminui a sobrecarga geral em cenários de dados não-IID.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

Este artigo apresenta um quadro de avaliação de privacidade abrangente que integra múltiplos métodos para quantificar e auditar os riscos de memorização em Modelos de Linguagem Genômica, demonstrando que a exposição de dados sensíveis varia conforme a arquitetura e o regime de treinamento, exigindo assim uma abordagem de auditoria multifacetada.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Este artigo propõe um método totalmente diferenciável para descobrir Sub-redes de Loteria Forte (SLT) utilizando portas de Bernoulli relaxadas continuamente, permitindo a otimização eficiente de redes superparametrizadas com até 90% de esparsidade e perda mínima de precisão sem necessidade de treinamento de pesos ou estimadores de gradiente não diferenciáveis.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

O artigo apresenta o MedCBR, um framework de raciocínio baseado em conceitos que integra diretrizes clínicas e modelos de linguagem-vídeo para melhorar a interpretabilidade e a precisão no diagnóstico médico, gerando narrativas clínicas estruturadas que emulam o raciocínio de especialistas.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Este artigo propõe um framework de aprendizado por reforço hierárquico que otimiza conjuntamente o ajuste de ângulos de inclinação de antenas e a estratégia de coleta de dados entre redes físicas e gêmeos digitais, visando maximizar as taxas de dados dos usuários enquanto reduz o atraso de comunicação em até 28,01%.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

O artigo apresenta o "Guardian", um sistema de suporte à decisão que utiliza uma arquitetura de três camadas combinando cadeias de Markov, aprendizado por reforço e validação por modelos de linguagem para gerar planos de busca interpretáveis e otimizados para crianças desaparecidas nas primeiras 72 horas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

O artigo apresenta o BiCLIP, um framework simples e eficiente que adapta modelos de linguagem e visão a domínios especializados aplicando uma transformação geométrica canônica baseada em poucos exemplos, alcançando resultados state-of-the-art em diversos benchmarks.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

O artigo propõe o ULFS-KDPE, um estimador de plug-in enviesado baseado em kernel e no submodelo menos favorável universal, que alcança a eficiência semiparamétrica para parâmetros diferenciáveis em modelos não paramétricos sem exigir a derivação explícita de funções de influência, fundamentando-se em uma equação diferencial ordinária não linear sobre densidades de probabilidade em espaços de Hilbert de kernel reproduzível.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Towards Reliable Simulation-based Inference

Esta tese aborda a confiabilidade da inferência baseada em simulação ao diagnosticar e mitigar conclusões excessivamente confiantes em modelos de aprendizado de máquina, propondo técnicas de regularização como "balancing" e o uso de redes neurais bayesianas para garantir aproximações calibradas ou conservadoras.

Arnaud Delaunoy2026-03-11🤖 cs.LG

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

O artigo apresenta o Guardian, um sistema de pipeline multi-LLM que utiliza modelos especializados, um mecanismo de consenso e ajuste fino QLoRA para extrair e processar informações de forma auditável e coordenada, visando otimizar as investigações de pessoas desaparecidas nas primeiras 72 horas críticas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

A Survey of Reinforcement Learning For Economics

Esta pesquisa apresenta uma revisão dos métodos de aprendizado por reforço para economistas, demonstrando como eles superam as limitações de dimensionalidade da programação dinâmica clássica em modelos complexos, ao mesmo tempo que alertam para suas vulnerabilidades práticas e dependência de simuladores precisos.

Pranjal Rawat2026-03-11🤖 cs.LG

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

O artigo introduz a desigualdade $qs$ , um critério preditivo que revela como a fragmentação de reutilização de memória e a redução do espaço para o cache KV penalizam estruturalmente os modelos Mixture-of-Experts (MoE) durante a inferência de longo contexto, tornando-os frequentemente menos eficientes em throughput do que modelos densos de qualidade equivalente.

Vignesh Adhinarayanan, Nuwan Jayasena2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

O artigo apresenta o SLoD, um framework que utiliza difusão de núcleo de calor em variedades hiperbólicas para criar uma representação contínua de conhecimento em múltiplas escalas, permitindo a detecção automática de limites de abstração semântica em grafos de conhecimento.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

O artigo propõe o MAcPNN, um paradigma de aprendizado mútuo assistido baseado na Teoria Sociocultural de Vygotsky e em Redes Neurais Progressivas Contínuas (cPNN), que permite que dispositivos IoT autônomos melhorem seu desempenho em fluxos de dados com dependência temporal e deriva de conceito, solicitando assistência apenas quando necessário para evitar o esquecimento e reduzir a comunicação em comparação com a Aprendizagem Federada tradicional.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

Este artigo apresenta uma abordagem axiomática para processos de decisão de Markov robustos em espaços de Borel com distribuições de perturbação desconhecidas, demonstrando que, ao definir conjuntos de ambiguidade baseados em funções de distância, é possível garantir limites de desempenho fora da amostra com alta probabilidade e taxas de convergência que os processos empíricos tradicionais não conseguem oferecer.

Sivaramakrishnan Ramani2026-03-11✓ Author reviewed ⓘ🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

O artigo apresenta o MAPLE, uma nova abordagem que integra modelos de recompensa de processo médico ao Aprendizado por Reforço em Tempo de Teste, substituindo a votação majoritária por supervisão alinhada a especialistas para melhorar o raciocínio médico e superar os métodos atuais.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning Guo2026-03-11🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Este livro propõe uma reinterpretação estatística da IA generativa, utilizando o Flow Matching como exemplo central para transformar modelos generativos em ferramentas de inferência estatística rigorosa que permitem imputação de dados, análise contrafactual e inferência causal em problemas de alta dimensionalidade, mantendo a validade inferencial através de técnicas como ortogonalização e cross-fitting.

Shinto Eguchi2026-03-11🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

O artigo propõe o Normalized Flow Matching (NFM), um novo método que utiliza o acoplamento quase determinístico de modelos de fluxo normalizante pré-treinados para treinar modelos de fluxo de destino, resultando em desempenho superior tanto em relação aos modelos de fluxo tradicionais quanto ao próprio modelo professor.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei Zhai2026-03-11🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

Este trabalho propõe uma medida de planicidade exata e fiel à arquitetura para Redes Neurais Convolucionais (CNNs), derivando uma expressão fechada para o traço do Hessiano que considera as simetrias de escalonamento e interações de filtros, demonstrando empiricamente sua eficácia como ferramenta robusta para estimar o desempenho de generalização e orientar o design de modelos.

Rahman Taleghani, Maryam Mohammadi, Francesco Marchetti2026-03-11🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

O artigo apresenta o CALIPER, um método independente de detector e modelo que utiliza apenas dados para determinar o tamanho amostral pós-desvio necessário para uma re-treinagem estável, identificando o momento adequado para retreinar com base em uma tendência de erro decrescente e garantindo eficiência computacional em cenários de aprendizado em fluxo.

Ren Fujiwara, Yasuko Matsubara, Yasushi Sakurai2026-03-11🤖 cs.LG

← Anterior Próximo →

cs.LG