cs.LG artigos | Gist.Science

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

O artigo apresenta o FoleyFlow, um modelo que gera áudio sincronizado com vídeos utilizando alinhamento multimodal baseado em mascaramento e um fluxo condicional dinâmico para garantir coerência semântica e rítmica, superando os métodos existentes em benchmarks padrão.

Shentong Mo, Yibing Song2026-03-10🤖 cs.LG

TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same

O artigo apresenta o TRIAGE, um framework pós-hoc leve que decompõe a incerteza em componentes aleatórios e epistêmicos para orientar respostas específicas do sistema, como recuperação de observações ou moderação de controle, resultando em melhorias significativas tanto no sucesso de manipulação robótica quanto na eficiência computacional da percepção adaptativa.

Divake Kumar, Sina Tayebati, Devashri Naik, Patrick Poggi, Amanda Sofie Rios, Nilesh Ahuja, Amit Ranjan Trivedi2026-03-10🤖 cs.LG

Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions

Este artigo apresenta uma nova metodologia explicável para monitoramento de condição em transmissões de helicóptero, baseada apenas em dados saudáveis e no uso de detecção probabilística de anomalias com quantificação de incerteza, validada experimentalmente com desempenho competitivo em benchmarks públicos e dados reais.

Aurelio Raffa Ugolini, Jessica Leoni, Valentina Breschi, Damiano Paniccia, Francesco Aldo Tucci, Luigi Capone, Mara Tanelli2026-03-10🤖 cs.LG

Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach

O artigo propõe o SAGAD, um framework escalável e adaptativo para detecção de anomalias em grafos que mitiga disparidades de homofilia e reduz custos computacionais através de filtros de Chebyshev reparametrizados, fusão adaptativa de contextos e uma função de perda orientada por preferências de frequência, superando os métodos atuais em precisão e eficiência em grandes grafos.

Yunhui Liu, Qizhuo Xie, Yinfeng Chen, Xudong Jin, Tao Zheng, Bin Chong, Tieke He2026-03-10🤖 cs.LG

DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding

O artigo apresenta o DARC, um método de inferência sem re-treinamento que aborda a heterogeneidade nas preferências humanas ao reformular a seleção de respostas como uma decisão sensível ao risco e robusta distribucionalmente, reduzindo assim o risco de cauda e a discordância sem comprometer a qualidade média.

Mingxi Zou, Jiaxiang Chen, Junfan Li, Langzhang Liang, Qifan Wang, Xu Yinghui, Zenglin Xu2026-03-10🤖 cs.LG

Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX

O artigo apresenta o Eventax, um framework desenvolvido em JAX que resolve o compromisso entre flexibilidade de modelos e precisão de gradientes no treinamento de redes neurais baseadas em eventos, permitindo o uso de solvers numéricos diferenciáveis para calcular gradientes exatos em qualquer modelo de neurônio definido por equações diferenciais.

Lukas König, Manuel Kuhn, David Kappel, Anand Subramoney2026-03-10🤖 cs.LG

C $^2$ FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Este artigo apresenta o C $^2$ FG, um método de aprendizado livre e plug-in que otimiza a Orientação Livre de Classificador (CFG) em modelos de difusão condicional ao alinhar dinamicamente a força de orientação com a dinâmica do processo de difusão, fundamentado em uma análise teórica rigorosa das discrepâncias de pontuação.

Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang2026-03-10🤖 cs.LG

Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting

Este artigo argumenta que a avaliação atual de previsão de séries temporais de longo prazo está excessivamente focada em métricas de erro pontual agregado, o que desvia o progresso do campo de objetivos reais como a estrutura temporal e a utilidade decisória, propondo em seu lugar uma perspectiva de avaliação multidimensional que integre fidelidade estatística, coerência estrutural e relevância para a tomada de decisão.

Thanapol Phungtua-eng, Yoshitaka Yamamoto2026-03-10🤖 cs.LG

Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square

Este artigo propõe o algoritmo ALS-IRLS, um método robusto a outliers para estimação de covariância de ruído em filtros de Kalman que combina um mecanismo de limiar adaptativo e a função de custo de Huber dentro de um quadro de Mínimos Quadrados Iterativamente Reponderados, resultando em uma precisão de estimação superior e desempenho próximo ao limite ideal de Oracle em cenários com dados contaminados.

Jiahong Li, Fang Deng2026-03-10🤖 cs.LG

Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning

O artigo apresenta o TIER, um método que constrói uma taxonomia hierárquica implícita e a integra ao aprendizado de representações em Redes Ricas em Texto (TRNs) por meio de aprendizado contrastivo e regularização, superando abordagens existentes ao capturar tanto semânticas de alto quanto de baixo nível.

Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He2026-03-10🤖 cs.LG

Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

O artigo apresenta o Covenant-72B, um modelo de linguagem de 72 bilhões de parâmetros pré-treinado em escala sem precedentes por meio de uma colaboração global e permissionless apoiada por blockchain e pelo otimizador SparseLoCo, demonstrando que a participação aberta e não whitelistada é viável e competitiva em relação a modelos centralizados.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare2026-03-10🤖 cs.LG

Is continuous CoT better suited for multi-lingual reasoning?

O estudo demonstra que o raciocínio em cadeia contínuo (Continuous Chain-of-Thought) supera o raciocínio explícito em idiomas de baixa recursos, oferecendo maior robustez em cenários zero-shot e uma compressão de eficiência de 29 a 50 vezes, graças à invariância linguística inerente às representações latentes contínuas.

Ali Hamza Bashir, Behzad Shomali, Markus Frey, Mehdi Ali, Rafet Sifa, David Berghaus2026-03-10🤖 cs.LG

ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection

O artigo apresenta o ALOOD, uma abordagem inovadora que utiliza representações linguísticas de modelos visão-linguagem para alinhar características de detecção LiDAR e tratar a identificação de objetos fora da distribuição como uma tarefa de classificação zero-shot, melhorando a segurança em sistemas de direção autônoma.

Michael Kösel, Marcel Schreiber, Michael Ulrich, Claudius Gläser, Klaus Dietmayer2026-03-10🤖 cs.LG

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

O AutoAdapt é um novo framework automatizado de ponta a ponta que utiliza um sistema multiagente de debate e um substituto baseado em LLM para otimizar a adaptação de domínio de modelos de linguagem grandes, superando as abordagens atuais com maior precisão e menor custo computacional.

Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan2026-03-10🤖 cs.LG

SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization

O artigo apresenta o SERQ, um método de reconstrução de erros sensível à saliência que utiliza uma única matriz de compensação de baixo posto para permitir inferência eficiente de LLMs em 4 bits (W4A4 e W4A8), superando o estado da arte em precisão enquanto minimiza a sobrecarga computacional e a complexidade de calibração.

Yeonsik Park, Hyeonseong Kim, Seungkyu Choi2026-03-10🤖 cs.LG

Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect

Este artigo propõe um framework que integra análise de opções reais com um algoritmo de otimização baseado em Transformers (TPPO) para resolver o problema de design sequencial de regiões de serviço sob incerteza de demanda e efeitos de transbordamento, permitindo identificar sequências de investimento ótimas que superam métodos tradicionais em velocidade e valor.

Tingting Chen, Feng Chu, Jiantong Zhang2026-03-10🤖 cs.LG

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

O artigo critica a dependência atual de métricas de erro pontual para avaliar modelos fundacionais tabulares em regressão, propondo a adoção de regras de pontuação adequadas, como o CRPS, para avaliar previsões probabilísticas e incentivando o ajuste fino desses modelos para otimizar diferentes distribuições.

Jonas Landsgesell, Pascal Knoll2026-03-10🤖 cs.LG

Revisiting Gradient Staleness: Evaluating Distance Metrics for Asynchronous Federated Learning Aggregation

Este artigo estende o método de agregação adaptativa AsyncFedED ao explorar métricas de distância alternativas para medir o atraso dos gradientes em aprendizado federado assíncrono, demonstrando que certas métricas melhoram a robustez, a eficiência e a estabilidade do treinamento em cenários heterogêneos com dados não-IID.

Patrick Wilhelm, Odej Kao2026-03-10🤖 cs.LG

Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations

Este artigo apresenta um operador neural baseado em Expansão do Caos de Wiener com modulação linear por características (WCE-FiLM-NO) que resolve com eficiência equações diferenciais parciais estocásticas singulares, como os modelos dinâmicos $\boldsymbol{\Phi}^4_2$ e $\boldsymbol{\Phi}^4_3$ , alcançando alto desempenho sem a necessidade de fatores de renormalização.

Dai Shi, Luke Thompson, Andi Han, Peiyan Hu, Junbin Gao, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs

Este artigo investiga o fenômeno de jailbreak acionado por continuação em modelos de linguagem grandes, revelando através de análise mecanicista que o sucesso desses ataques resulta de uma competição intrínseca entre o impulso do modelo para continuar o texto e suas defesas de segurança, além de identificar diferenças no comportamento das cabeças de atenção críticas para a segurança em diferentes arquiteturas.

Yonghong Deng, Zhen Yang, Ping Jian, Xinyue Zhang, Zhongbin Guo, Chengzhi Li2026-03-10🤖 cs.LG

← Anterior Próximo →

cs.LG