cs.LG artigos | Gist.Science

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Este artigo propõe uma nova métrica de qualidade de justiça chamada "risco discriminativo" e estabelece limites teóricos de margem-dependente que demonstram como a combinação de ensembles pode melhorar simultaneamente a justiça de grupo e individual, validando a eficácia do método através de técnicas de poda de ensembles e experimentos abrangentes.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Este artigo apresenta uma avaliação atualizada da abordagem de aprendizado por reforço profundo do Google Brain para posicionamento de macros, introduzindo novos benchmarks em tecnologia sub-10nm, uma linha de base aprimorada de recozimento simulado e uma análise crítica que destaca questões de reprodutibilidade e lacunas na escalabilidade e metodologia de pré-treinamento do algoritmo Circuit Training.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Este artigo propõe um método de ramificação e limite disjuntivo combinado com novas relaxações convexas para resolver problemas de completamento de matrizes de baixo posto com garantia de otimalidade, superando significativamente os métodos heurísticos existentes em termos de precisão e certificação de soluções.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

Este artigo apresenta as Sociedades de Mentes Baseadas em Linguagem Natural (NLSOMs), um sistema modular onde múltiplos agentes de inteligência artificial interagem por meio de linguagem natural para resolver tarefas complexas de multimodalidade, ao mesmo tempo que explora questões fundamentais sobre a estrutura social, governança e economia dessas sociedades emergentes de mentes heterogêneas.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Riemannian Laplace Approximation with the Fisher Metric

Este artigo corrige as limitações de viés e estreitamento excessivo da aproximação de Laplace Riemanniana baseada na métrica de Fisher, propondo duas variantes alternativas que garantem exatidão no limite de dados infinitos e demonstram melhorias práticas em diversos experimentos.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Large Language Models for Travel Behavior Prediction

Este estudo demonstra que os Grandes Modelos de Linguagem (LLMs) podem ser aplicados eficazmente à previsão de comportamento de viagem através de estratégias de *zero-shot* e de incorporação de texto, oferecendo uma alternativa flexível e eficiente em termos de dados com desempenho competitivo em relação aos modelos tradicionais.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Este artigo propõe um framework de agregação baseado em transporte ótimo para modelos de mistura de especialistas (MoE) distribuídos, permitindo a combinação eficiente de modelos locais em um estimador global com apenas uma etapa de comunicação, preservando a estrutura do MoE e garantindo desempenho comparável ao treinamento centralizado.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

O artigo propõe o MFedMC, um framework de aprendizado federado multimodal eficiente em comunicação que utiliza uma arquitetura desacoplada e seleção conjunta de clientes e modalidades para superar desafios de heterogeneidade e limitações de rede, reduzindo o overhead de comunicação em mais de 20 vezes sem comprometer a precisão.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton2026-03-12🤖 cs.LG

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Este artigo apresenta o HyWIA, um método inovador de poda estruturada para modelos de linguagem grandes que utiliza uma avaliação híbrida de importância dos pesos, combinando granularidades fina e grossa por meio de um mecanismo de atenção adaptativo para superar as limitações de desempenho das abordagens atuais.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification

Este artigo apresenta duas aproximações para a estratégia de aprendizado ativo BAIT que reduzem drasticamente sua complexidade computacional e de memória, permitindo sua aplicação eficiente em grandes conjuntos de dados como o ImageNet sem comprometer o desempenho.

Denis Huseljic, Paul Hahn, Marek Herde + 2 more2026-03-12🤖 cs.LG

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Este estudo aplica técnicas de aprendizado de máquina explicável a um conjunto de dados de 28 anos no Golfo de Trieste para prever com precisão a toxicidade em mexilhões causada por florações de algas nocivas, identificando espécies específicas de dinoflagelados e fatores ambientais como preditores-chave para melhorar os sistemas de alerta precoce e a aquicultura sustentável.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Exploratory Optimal Stopping: A Singular Control Formulation

Este artigo formula problemas de parada ótima contínua sob uma perspectiva de aprendizado por reforço exploratório, introduzindo uma versão regularizada via entropia residual que transforma o problema em um controle estocástico singular, permitindo a identificação de estratégias ótimas e o desenvolvimento de algoritmos escaláveis de aprendizado por reforço.

Jodi Dianetti, Giorgio Ferrari, Renyuan Xu2026-03-12💰 q-fin

Mamba Neural Operator: Who Wins? Transformers vs. State-Space Models for PDEs

O artigo apresenta o Mamba Neural Operator (MNO), um novo framework que supera os Transformers na resolução de equações diferenciais parciais ao estabelecer uma conexão teórica entre modelos de espaço de estado estruturados e operadores neurais, permitindo uma captura mais eficaz de dinâmicas contínuas e dependências de longo alcance.

Chun-Wun Cheng, Jiahao Huang, Yi Zhang, Guang Yang, Carola-Bibiane Schönlieb, Angelica I. Aviles-Rivero2026-03-12🤖 cs.LG

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

O artigo apresenta o EarthquakeNPP, um novo benchmark que corrige falhas anteriores e demonstra que, atualmente, nenhum dos cinco modelos de Processos Pontuais Neurais testados supera o modelo ETAS clássico para previsão de terremotos na Califórnia.

Samuel Stockman, Daniel Lawson, Maximilian Werner2026-03-12🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

O artigo propõe uma teoria de memorização geométrica que demonstra como os modelos de difusão, ao enfrentar escassez de dados, passam por um colapso suave de suas dimensões latentes, condensando gradualmente a geração de novas variações em uma replicação quase pontual de exemplos de treinamento, um fenômeno distinto entre a generalização e a cópia exata.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca Ambrogioni2026-03-12📊 stat

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

O artigo apresenta o 3D-PIUNet, um método híbrido inovador que combina soluções físicas iniciais com redes neurais convolucionais 3D para melhorar significativamente a precisão espacial na reconstrução de fontes cerebrais a partir de sinais de EEG, superando tanto as abordagens tradicionais quanto as baseadas puramente em aprendizado de dados.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi Nakajima2026-03-12⚡ eess

Class Incremental Learning with Task-Specific Batch Normalization and Out-of-Distribution Detection

Este estudo propõe um novo framework de aprendizado contínuo para classificação incremental de classes que supera a necessidade de identificadores de tarefa explícitos ao utilizar detecção de distribuição fora do padrão em cabeças de classificação específicas para prever a tarefa, combinando normalização de lote específica para tarefas para equilibrar plasticidade e estabilidade com crescimento mínimo de parâmetros.

Zhiping Zhou, Xuchen Xie, Yiqiao Qiu, Run Lin, Weishi Zheng, Ruixuan Wang2026-03-12🤖 cs.LG

Conditional Local Importance by Quantile Expectations

O artigo propõe o método agnóstico ao modelo CLIQUE, uma nova técnica de importância local de variáveis que supera as limitações de métodos existentes ao capturar relações dependentes localmente, lidar nativamente com problemas de classificação multiclasse e reduzir vieses em regiões onde as variáveis não afetam a resposta.

Kelvyn K. Bladen, Adele Cutler, D. Richard Cutler, Kevin R. Moon2026-03-12📊 stat

A Novel Single-Layer Quantum Neural Network for Approximate SRBB-Based Unitary Synthesis

Este trabalho apresenta uma nova rede neural quântica de camada única baseada na Base de Bloco Recursiva Padrão (SRBB) que utiliza propriedades de álgebras de Lie para sintetizar unitários de forma escalável, reduzindo exponencialmente o número de portas CNOT e demonstrando eficácia tanto em simulações quanto em hardware real.

Giacomo Belli, Marco Mordacci, Michele Amoretti2026-03-12⚛️ quant-ph

Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications

Este artigo propõe uma nova família de modelos estatísticos para comparações pareadas que dispensa a suposição de transitividade estocástica, utilizando uma matriz antissimétrica de baixa dimensão para capturar dinâmicas complexas e alcançar desempenho preditivo superior e otimização minimax, mesmo em cenários com dados esparsos.

Sze Ming Lee, Yunxiao Chen2026-03-12📊 stat

← Anterior Próximo →