cs.LG artigos | Gist.Science

Cough activity detection for automatic tuberculosis screening

O artigo propõe o uso de um modelo pré-treinado XLS-R, otimizado com apenas suas três primeiras camadas para eficiência computacional, que supera outras arquiteturas na detecção automática de segmentos de tosse em gravações de pacientes com suspeita de tuberculose, viabilizando assim ferramentas de triagem escaláveis para dispositivos móveis.

Joshua Jansen van Vüren, Devendra Singh Parihar, Daphne Naidoo, Kimsey Zajac, Willy Ssengooba, Grant Theron, Thomas Niesler2026-03-13⚡ eess

A Standardized Framework For Evaluating Gene Expression Generative Models

O artigo apresenta o GGE, um framework de código aberto em Python que estabelece um protocolo de avaliação padronizado e reprodutível para modelos generativos de expressão gênica em células únicas, abordando a inconsistência atual nas métricas e permitindo comparações justas entre diferentes abordagens.

Andrea Rubbi, Andrea Giuseppe Di Francesco, Mohammad Lotfollahi, Pietro Liò2026-03-13🧬 q-bio

Differentiable Thermodynamic Phase-Equilibria for Machine Learning

O artigo apresenta o DISCOMAX, um algoritmo diferenciável baseado em estatística termodinâmica que garante consistência termodinâmica durante o treinamento e inferência, permitindo o aprendizado eficaz de modelos de energia livre de excesso para prever equilíbrios de fases líquidas.

Karim K. Ben Hicham, Moreno Ascani, Jan G. Rittig, Alexander Mitsos2026-03-13🤖 cs.LG

A Machine Learning-Enhanced Hopf-Cole Formulation for Nonlinear Gas Flow in Porous Media

Este artigo apresenta um framework integrado de aprendizado de máquina que combina a transformação de Hopf-Cole e redes neurais para modelar com precisão o fluxo não linear de gás em meios porosos, permitindo a simulação eficiente e a inversão de parâmetros de permeabilidade dependentes da pressão em formações de baixa permeabilidade.

V. S. Maduru, K. B. Nakshatrala2026-03-13🔢 math

Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

Este artigo identifica o colapso da sensibilidade a domínios (DSC) como uma falha geométrica em modelos treinados em domínio único que prejudica a detecção de dados fora de distribuição (OOD) e propõe a Treinamento Guiado por Professor (TGT), que utiliza um professor multi-domínio para preservar informações de deslocamento de domínio durante o treinamento, melhorando significativamente a detecção OOD sem custo adicional na inferência.

Hong Yang, Devroop Kar, Qi Yu, Travis Desell, Alex Ororbia2026-03-13🤖 cs.LG

Duration Aware Scheduling for ASR Serving Under Workload Drift

Este artigo propõe a integração de algoritmos de agendamento conscientes da duração, como HRRN, no motor vLLM para pipelines de reconhecimento automático de fala, demonstrando que essa abordagem reduz significativamente a latência média sob cargas variáveis sem comprometer o throughput ou causar degradação excessiva na latência de cauda.

Darshan Makwana, Yash Jogi, Harsh Kotta, Aayush Kubba2026-03-13🤖 cs.LG

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

O artigo "RIE-Greedy" propõe uma estratégia de seleção de ações puramente gananciosa que utiliza a aleatoriedade inerente ao processo de regularização via validação cruzada durante o treinamento de modelos como uma fonte intrínseca de exploração, demonstrando teoricamente sua equivalência ao Thompson Sampling em bandits de dois braços e validando empiricamente sua eficácia em ambientes de negócios em larga escala.

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. Williams2026-03-13📊 stat

Single molecule localization microscopy challenge: a biologically inspired benchmark for long-sequence modeling

Este artigo apresenta o desafio SMLM-C, um benchmark biologicamente inspirado que revela que os modelos de espaço de estado (SSMs) enfrentam dificuldades significativas ao modelar a dinâmica de "piscamento" irregular e de cauda pesada em dados de microscopia de localização de molécula única, destacando a necessidade de modelos sequenciais mais adequados para processos temporais esparsos e irregulares na imagem científica.

Fatemeh Valeh, Monika Farsang, Radu Grosu, Gerhard Schütz2026-03-13🧬 q-bio

Worst-case low-rank approximations

Este artigo apresenta o wcPCA, uma estrutura unificada para aproximações de baixo posto que otimiza o desempenho no pior caso em cenários com deslocamento de distribuição entre domínios heterogêneos, garantindo otimalidade teórica e demonstrando melhorias significativas em aplicações reais com apenas perdas mínimas no desempenho médio.

Anya Fries, Markus Reichstein, David Blei, Jonas Peters2026-03-13📊 stat

Client-Conditional Federated Learning via Local Training Data Statistics

O artigo propõe um método de aprendizado federado que condiciona um único modelo global às estatísticas locais de PCA de cada cliente, alcançando desempenho superior e robustez à escassez de dados em cenários de heterogeneidade complexa sem exigir comunicação adicional.

Rickard Brännvall2026-03-13🤖 cs.LG

Heavy-Tailed Principle Component Analysis

Este artigo propõe uma abordagem de Análise de Componentes Principais (PCA) robusta para dados com caudas pesadas, baseada em uma perda logarítmica que permite recuperar as componentes principais do gerador Gaussiano subjacente mesmo na ausência de momentos finitos, superando assim as limitações da PCA clássica em cenários de ruído impulsivo.

Mario Sayde, Christopher Khater, Jihad Fahs, Ibrahim Abou-Faycal2026-03-13🤖 cs.LG

MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors

O artigo apresenta o MRI2Qmap, um framework de reconstrução quantitativa que supera a escassez de dados de treinamento para Imageamento por Ressonância Magnética (MRF) ao integrar um modelo físico de aquisição com priores de desruído aprendidos por redes neurais em grandes conjuntos de imagens ponderadas de rotina clínica, permitindo reconstruções de alta qualidade sem necessidade de dados quantitativos reais para treinamento.

Mohammad Golbabaee, Matteo Cencini, Carolin Pirkl, Marion Menzel, Michela Tosetti, Bjoern Menze2026-03-13🔬 physics

On the Robustness of Langevin Dynamics to Score Function Error

O artigo demonstra que, ao contrário dos modelos de difusão, a dinâmica de Langevin não é robusta a erros no estimador da função de pontuação, produzindo distribuições distantes do alvo mesmo com erros arbitrariamente pequenos e em horizontes de tempo polinomiais, o que reforça a preferência pelos modelos de difusão na prática.

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen Wu2026-03-13🤖 cs.LG

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

O artigo apresenta a Hindsight-Anchored Policy Optimization (HAPO), um novo método que utiliza um mecanismo de injeção de sucesso sintético e um controle baseado em amostragem de Thompson para superar os desafios de recompensas esparsas e viés de distribuição no GRPO, garantindo convergência assintótica e permitindo que o modelo supere as limitações do ensino estático.

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

O artigo apresenta o MR-Search, uma abordagem de aprendizado por reforço meta com autorreflexão que permite a agentes de busca adaptar suas estratégias entre episódios utilizando reflexões explícitas como contexto, resultando em melhorias significativas de generalização e desempenho em diversos benchmarks.

Teng Xiao, Yige Yuan, Hamish Ivison, Huaisheng Zhu, Faeze Brahman, Nathan Lambert, Pradeep Dasigi, Noah A. Smith, Hannaneh Hajishirzi2026-03-13🤖 cs.LG

Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study

Este estudo analisa sistematicamente como a má condicionalidade numérica, causada por multicolinearidade em bibliotecas de funções, compromete a descoberta de equações dinâmicas em sistemas biológicos, demonstrando que bases polinomiais ortogonais só melhoram a recuperação do modelo quando os dados são amostrados de distribuições alinhadas às suas funções de peso.

Yuxiang Feng, Niall M Mangan, Manu Jayadharan2026-03-13🧬 q-bio

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

O artigo propõe um modelo teórico baseado em sistemas de vidro de spin para explicar como a injeção de prompts adversariais em modelos de linguagem grandes faz com que a taxa de sucesso de jailbreaks transite de um crescimento polinomial para um crescimento exponencial com o aumento das amostras, devido à indução de uma fase ordenada sob campos magnéticos fortes.

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

On the Computational Hardness of Transformers

Este artigo estabelece que o cálculo de múltiplos cabeçalhos de atenção em transformadores não pode ser realizado de forma mais eficiente do que a avaliação independente de cada um, provando que os algoritmos atuais são essencialmente ótimos sob a Hipótese de Tempo de Satisfação Forte (SETH) e o teorema de Baur-Strassen.

Barna Saha, Yinzhan Xu, Christopher Ye, Hantao Yu2026-03-13🤖 cs.LG

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

O artigo apresenta o FinRule-Bench, um novo benchmark que avalia a capacidade de modelos de linguagem de realizar raciocínio financeiro baseado em regras e diagnósticos de conformidade em tabelas financeiras reais, revelando que, embora performem bem na verificação isolada de regras, suas capacidades degradam-se significativamente em tarefas que exigem discriminação de princípios e diagnóstico de múltiplas violações simultâneas.

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

O artigo apresenta a "Teleodynamic Learning", um novo paradigma de aprendizado de máquina inspirado em sistemas vivos que trata a inteligência como a co-evolução de representação, adaptação e recursos sob restrições, resultando no modelo DE11 capaz de gerar regras lógicas interpretáveis e alcançar alta precisão em benchmarks sem depender da minimização de objetivos fixos.

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

← Anterior Próximo →