cs.LG artigos | Gist.Science

MASEval: Extending Multi-Agent Evaluation from Models to Systems

O artigo apresenta o MASEval, uma biblioteca independente de frameworks que preenche a lacuna de avaliação ao tratar sistemas de agentes LLM completos como unidade de análise, demonstrando que a escolha do framework impacta o desempenho tanto quanto a escolha do modelo.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

Expressivity-Efficiency Tradeoffs for Hybrid Sequence Models

Este artigo demonstra teoricamente e valida empiricamente que os modelos híbridos, ao combinar camadas de Transformers e modelos de espaço de estados, superam as limitações fundamentais de expressividade e eficiência dos modelos não híbridos, alcançando melhor desempenho com menos parâmetros e maior robustez.

John Cooper, Ilias Diakonikolas, Mingchen Ma, Frederic Sala2026-03-11🤖 cs.LG

APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model

O artigo apresenta o \textsc{applv}, um método que utiliza modelos Visão-Linguagem-Ação para prever e adaptar automaticamente os parâmetros de planejadores de navegação clássicos, superando as limitações de generalização e controle preciso de abordagens anteriores em ambientes restritos.

Yuanjie Lu, Beichen Wang, Zhengqi Wu, Yang Li, Xiaomin Lin, Chengzhi Mao, Xuesu Xiao2026-03-11🤖 cs.LG

Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study

Este estudo demonstra que modelos centrados apenas no canal, como simuladores de rastreamento de raios, falham em prever com precisão o desempenho de ponta a ponta em redes 5G privadas devido à superestimação das camadas espaciais MIMO, enquanto abordagens baseadas em dados, como regressão por processos gaussianos, oferecem previsões de throughput muito mais precisas ao aprender diretamente do comportamento real do sistema.

Nils Jörgensen2026-03-11🤖 cs.LG

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

Este artigo apresenta o modelo FSbuHD, uma nova abordagem de seleção de características para sistemas de informação híbridos baseada na teoria de conjuntos fuzzy-rugosos que reformula o problema como uma otimização utilizando distâncias combinadas e opera em modos normal e otimista para superar desafios de eficiência e ruído em espaços de alta dimensão.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting

Este artigo apresenta uma ablação abrangente de nove famílias de limites para previsão seletiva com controle de risco, introduzindo o método "Transfer-Informed Betting" (TIB) que utiliza perfis de risco de domínios-fonte para obter limites mais apertados em cenários com escassez de dados, demonstrando ganhos significativos de cobertura em benchmarks como MASSIVE e NyayaBench.

Abhinaba Basu2026-03-11🤖 cs.AI

FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data

O artigo propõe o FedLECC, uma estratégia leve e guiada por clusters e perdas para a seleção de clientes em Aprendizado Federado, que melhora a precisão, reduz o número de rodadas de comunicação e diminui a sobrecarga geral em cenários de dados não-IID.

Daniel M. Jimenez-Gutierrez, Giovanni Giunta, Mehrdad Hassanzadeh, Aris Anagnostopoulos, Ioannis Chatzigiannakis, Andrea Vitaletti2026-03-11🤖 cs.AI

Quantifying Memorization and Privacy Risks in Genomic Language Models

Este artigo apresenta um quadro de avaliação de privacidade abrangente que integra múltiplos métodos para quantificar e auditar os riscos de memorização em Modelos de Linguagem Genômica, demonstrando que a exposição de dados sensíveis varia conforme a arquitetura e o regime de treinamento, exigindo assim uma abordagem de auditoria multifacetada.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Este artigo propõe um método totalmente diferenciável para descobrir Sub-redes de Loteria Forte (SLT) utilizando portas de Bernoulli relaxadas continuamente, permitindo a otimização eficiente de redes superparametrizadas com até 90% de esparsidade e perda mínima de precisão sem necessidade de treinamento de pesos ou estimadores de gradiente não diferenciáveis.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

O artigo apresenta o MedCBR, um framework de raciocínio baseado em conceitos que integra diretrizes clínicas e modelos de linguagem-vídeo para melhorar a interpretabilidade e a precisão no diagnóstico médico, gerando narrativas clínicas estruturadas que emulam o raciocínio de especialistas.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Este artigo propõe um framework de aprendizado por reforço hierárquico que otimiza conjuntamente o ajuste de ângulos de inclinação de antenas e a estratégia de coleta de dados entre redes físicas e gêmeos digitais, visando maximizar as taxas de dados dos usuários enquanto reduz o atraso de comunicação em até 28,01%.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

O artigo apresenta o "Guardian", um sistema de suporte à decisão que utiliza uma arquitetura de três camadas combinando cadeias de Markov, aprendizado por reforço e validação por modelos de linguagem para gerar planos de busca interpretáveis e otimizados para crianças desaparecidas nas primeiras 72 horas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

O artigo apresenta o BiCLIP, um framework simples e eficiente que adapta modelos de linguagem e visão a domínios especializados aplicando uma transformação geométrica canônica baseada em poucos exemplos, alcançando resultados state-of-the-art em diversos benchmarks.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

O artigo propõe o ULFS-KDPE, um estimador de plug-in enviesado baseado em kernel e no submodelo menos favorável universal, que alcança a eficiência semiparamétrica para parâmetros diferenciáveis em modelos não paramétricos sem exigir a derivação explícita de funções de influência, fundamentando-se em uma equação diferencial ordinária não linear sobre densidades de probabilidade em espaços de Hilbert de kernel reproduzível.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Towards Reliable Simulation-based Inference

Esta tese aborda a confiabilidade da inferência baseada em simulação ao diagnosticar e mitigar conclusões excessivamente confiantes em modelos de aprendizado de máquina, propondo técnicas de regularização como "balancing" e o uso de redes neurais bayesianas para garantir aproximações calibradas ou conservadoras.

Arnaud Delaunoy2026-03-11🤖 cs.LG

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

O artigo apresenta o Guardian, um sistema de pipeline multi-LLM que utiliza modelos especializados, um mecanismo de consenso e ajuste fino QLoRA para extrair e processar informações de forma auditável e coordenada, visando otimizar as investigações de pessoas desaparecidas nas primeiras 72 horas críticas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

A Survey of Reinforcement Learning For Economics

Esta pesquisa apresenta uma revisão dos métodos de aprendizado por reforço para economistas, demonstrando como eles superam as limitações de dimensionalidade da programação dinâmica clássica em modelos complexos, ao mesmo tempo que alertam para suas vulnerabilidades práticas e dependência de simuladores precisos.

Pranjal Rawat2026-03-11🤖 cs.LG

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

O artigo introduz a desigualdade $qs$ , um critério preditivo que revela como a fragmentação de reutilização de memória e a redução do espaço para o cache KV penalizam estruturalmente os modelos Mixture-of-Experts (MoE) durante a inferência de longo contexto, tornando-os frequentemente menos eficientes em throughput do que modelos densos de qualidade equivalente.

Vignesh Adhinarayanan, Nuwan Jayasena2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

O artigo apresenta o SLoD, um framework que utiliza difusão de núcleo de calor em variedades hiperbólicas para criar uma representação contínua de conhecimento em múltiplas escalas, permitindo a detecção automática de limites de abstração semântica em grafos de conhecimento.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

O artigo propõe o MAcPNN, um paradigma de aprendizado mútuo assistido baseado na Teoria Sociocultural de Vygotsky e em Redes Neurais Progressivas Contínuas (cPNN), que permite que dispositivos IoT autônomos melhorem seu desempenho em fluxos de dados com dependência temporal e deriva de conceito, solicitando assistência apenas quando necessário para evitar o esquecimento e reduzir a comunicação em comparação com a Aprendizagem Federada tradicional.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG

← Anterior Próximo →

cs.LG