cs.LG artigos | Gist.Science

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Este artigo apresenta o algoritmo \texttt{SRTS} baseado em Amostragem de Thompson para otimização da razão de Sharpe em bandits estocásticos, estabelecendo limites de arrependimento superiores e inferiores que provam sua optimalidade de ordem e demonstrando seu desempenho superior em simulações empíricas.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Este artigo estabelece as condições teóricas para a universalidade de simuladores quânticos análogos com controle global, demonstra que pulsos aleatórios geram emaranhamento e aleatoriedade eficientes, e valida experimentalmente a síntese de interações efetivas complexas e dinâmicas topológicas em arrays de átomos de Rydberg através de um novo framework de controle quântico ótimo direto.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Este trabalho propõe um método rápido e determinístico para completar tensores com base na decomposição Tensor Train, utilizando apenas álgebra linear padrão para recuperar dados a partir de observações completas ou ausentes de fibras ao longo de um único modo, uma configuração comum em aplicações como séries temporais.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Este artigo apresenta um método de solução transferível para problemas de controle ótimo com objetivos variáveis, utilizando políticas de codificador de funções que aprendem uma base neural reutilizável offline para permitir adaptação zero-shot eficiente e quase ótima online com custo computacional mínimo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Este artigo explica teoricamente as vantagens de sincronizar temperatura e viés treináveis na função de perda sigmoidal, introduzindo o conceito de "Constelações" para justificar o sucesso do modelo SigLIP, elucidar o fenômeno do "modality gap" e determinar a dimensão necessária para representações de alta qualidade.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Este estudo demonstra que modelos de aprendizado profundo, especificamente U-Net e SCAN, superam métodos convencionais na segmentação de nuvens e sombras de nuvens em imagens hiperespectrais de alta resolução das missões MethaneSAT e MethaneAIR, garantindo uma detecção mais precisa essencial para a quantificação de emissões de metano.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Este estudo empírico em larga escala revela que benchmarks de perguntas e respostas visuais frequentemente apresentam dependências inesperadas de modalidades individuais (texto ou imagem) em vez de interações multimodais, destacando a necessidade de um novo paradigma para o design e avaliação de conjuntos de dados multimodais.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

Proposing a Framework for Machine Learning Adoption on Legacy Systems

Este artigo propõe um framework baseado em API que desacopla o ciclo de vida dos modelos de aprendizado de máquina do ambiente de produção, permitindo que empresas integrem essa tecnologia em sistemas legados sem custos de atualização de hardware ou interrupções operacionais, por meio de uma interface leve e interativa que empodera especialistas humanos.

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

O artigo apresenta o SMoPE, um novo framework para aprendizado contínuo baseado em prompts que utiliza uma arquitetura esparsa de Mixture of Experts para ativar dinamicamente um subconjunto de "especialistas de prompt", equilibrando assim eficiência computacional e desempenho ao mitigar interferência de conhecimento sem escalar linearmente com o número de tarefas.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

O RADAR é um framework de roteamento leve e interpretável que otimiza o desempenho e o custo de modelos de raciocínio ao direcionar consultas com base em sua dificuldade e na capacidade dos modelos em diferentes orçamentos de raciocínio.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

O artigo apresenta o Composer, um framework de busca arquitetônica modular que descobre novas arquiteturas de modelos de linguagem híbridos, superando o Llama 3.2 em desempenho, eficiência e redução de perda de validação ao explorar automaticamente combinações de primitivas computacionais e extrapolar as melhores configurações para escalas maiores.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

O artigo apresenta o MIG-Vis, um método que utiliza modelos de difusão guiados por informação mútua para visualizar e validar que grupos de neurônios no córtex visual superior de macacos codificam informações visuais-semanticas estruturadas e seletivas, como pose de objetos e transformações inter e intra-categoriais.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

O estudo demonstra que, em sistemas multiagentes de LLM, a comunicação direta é um mecanismo de coordenação mais robusto e eficaz para promover cooperação do que a aprendizagem curricular, que pode inadvertidamente induzir pessimismo e reduzir o desempenho devido a escolhas de design inadequadas.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artigo apresenta a primeira avaliação sistemática de aprendizado auto-supervisionado para o estágio do sono usando EEG vestível, demonstrando que essa abordagem supera os métodos supervisionados ao alcançar precisão clínica com apenas 5% a 10% dos dados rotulados e reduzir significativamente a dependência de anotações manuais.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Este artigo demonstra que choques geopolíticos e geoeconômicos afetam o risco soberano por canais distintos, formando um padrão de "tesoura" onde os efeitos diretos e os do ciclo financeiro global se movem em direções opostas, implicando que a liquidez pode mitigar apenas a componente mediada pelo ciclo financeiro e não o prêmio de risco geopolítico persistente.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

O artigo propõe o HyWA, um método que utiliza uma hiper-rede para gerar pesos personalizados em camadas específicas de um modelo de detecção de atividade vocal, superando as técnicas existentes ao melhorar a precisão média e facilitar a implantação através do reuso da mesma arquitetura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

O artigo apresenta um framework generativo explicável e consciente de viés que unifica fusão de atenção multimodal, atribuição Grad-CAM++ e um ciclo de feedback "Reveal-to-Revise", demonstrando desempenho superior e maior robustez em benchmarks de geração de imagens e classificação de texto.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

Este artigo apresenta novos índices absolutos de validação de clusters que definem funções de compactação e margens de separabilidade para determinar o número verdadeiro de clusters, demonstrando sua eficácia em comparação com índices relativos tradicionais em diversos conjuntos de dados sintéticos e reais.

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

Este artigo propõe um quadro teórico baseado na "ansatz de estrutura de autovalores de Hermite" (HEA) que permite prever as curvas de aprendizado da regressão por kernel em conjuntos de dados reais, como CIFAR-5m e ImageNet, utilizando apenas estatísticas de dados brutos e demonstrando que redes MLP também aprendem polinômios de Hermite conforme previsto pelo modelo.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

Este artigo apresenta uma análise unificada baseada em geometria que demonstra que o algoritmo de Iteração de Valor converge geometricamente tanto nos cenários de recompensa descontada quanto na média, sob a suposição de uma política ótima unichain única, superando assim as garantias teóricas anteriores que subestimavam sua velocidade de convergência.

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

← Anterior Próximo →