cs.LG artigos | Gist.Science

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Este artigo estabelece fundamentos teóricos para a decodificação restrita a gramáticas, demonstrando que gramáticas linguisticamente equivalentes podem gerar custos de processamento drasticamente diferentes e propondo métricas de ambiguidade estrutural e limites inferiores para otimizar a eficiência em modelos de linguagem.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

O artigo propõe uma reorganização algébrica intuitiva da decomposição da covariância de Yates para o escore de Brier, que expressa o erro de previsão probabilística como a soma de três termos não negativos (mismatch de variância, déficit de correlação e calibração global), tornando transparentes as condições de otimalidade para previsões perfeitas.

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

O artigo apresenta o IntSeqBERT, um modelo Transformer dual-stream que utiliza embeddings de magnitude logarítmica e espectro de módulos para capturar a estrutura aritmética de sequências inteiras do OEIS, superando significativamente as abordagens baseadas em tokenização na previsão de termos subsequentes através de uma combinação de regressão, classificação e um solucionador probabilístico baseado no Teorema Chinesa do Resto.

Kazuhisa Nakasho2026-03-09🤖 cs.LG

Autocorrelation effects in a stochastic-process model for decision making via time series

Este estudo demonstra que, em um modelo estocástico de tomada de decisão baseado em séries temporais, a autocorrelação negativa é ideal para ambientes ricos em recompensas, enquanto a positiva é vantajosa em ambientes pobres, dependendo da soma das probabilidades de vitória.

Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida2026-03-09🔬 physics.optics

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Este artigo apresenta o Autoencoder de Koopman de Tempo Contínuo (CT-KAE) como um modelo substituto leve e estável para previsões oceânicas de longo prazo, demonstrando superioridade sobre baselines autoregressivos ao manter estatísticas de grande escala e crescimento de erro limitado em simulações de 2083 dias, enquanto oferece uma inferência ordens de magnitude mais rápida.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artigo propõe um modelo teórico que demonstra como a IA generativa, ao equalizar as diferenças de habilidades individuais, pode paradoxalmente ampliar a desigualdade agregada ao deslocar o valor econômico para ativos complementares concentrados, resultando em dois regimes distintos de desigualdade dependendo da estrutura tecnológica e das instituições do mercado de trabalho.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

O artigo propõe o algoritmo CDDS, que utiliza um UNet duplo para desacoplar adaptativamente as representações em componentes semânticos e modais, combinado com uma amostragem de distribuição para preencher a lacuna entre modalidades, alcançando assim um alinhamento semântico superior ao estado da arte em tarefas de aprendizado multimodal.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

FuseDiff: Symmetry-Preserving Joint Diffusion for Dual-Target Structure-Based Drug Design

O artigo apresenta o FuseDiff, um modelo de difusão end-to-end inovador que gera simultaneamente uma única molécula de fármaco e duas poses de ligação específicas para alvos distintos, superando as limitações dos métodos existentes ao preservar simetrias e garantir consistência topológica para o design de medicamentos de duplo alvo.

Jianliang Wu, Anjie Qiao, Zhen Wang, Zhewei Wei, Sheng Chen2026-03-09🤖 cs.LG

Learning Optimal Distributionally Robust Individualized Treatment Rules Integrating Multi-Source Data

Este artigo propõe uma regra de tratamento individualizada robusta distribucionalmente (PDRO-ITR) que integra dados de múltiplas fontes para lidar com o deslocamento posterior, garantindo desempenho ótimo mesmo no pior cenário através de um conjunto de incerteza adaptativo e de uma solução de forma fechada.

Wenhai Cui, Wen Su, Xingqiu Zhao2026-03-09🤖 cs.LG

Machine Learning for analysis of Multiple Sclerosis cross-tissue bulk and single-cell transcriptomics data

Este estudo desenvolveu um pipeline de aprendizado de máquina explicável para integrar dados transcriptômicos de múltiplos tecidos no Esclerose Múltipla, identificando com alta precisão biomarcadores e vias patogênicas, como checkpoints imunes não canônicos e mecanismos relacionados ao vírus Epstein-Barr, que complementam as análises tradicionais de expressão diferencial.

Francesco Massafra, Samuele Punzo, Silvia Giulia Galfré, Alessandro Maglione, Simone Pernice, Stefano Forti, Simona Rolla, Marco Beccuti, Marinella Clerico, Corrado Priami, Alina Sîrbu2026-03-09🤖 cs.LG

Why Depth Matters in Parallelizable Sequence Models: A Lie Algebraic View

Este artigo utiliza uma perspectiva de controle algébrica de Lie para demonstrar teoricamente e validar empiricamente que o aumento da profundidade em modelos de sequência paralelizáveis reduz exponencialmente o erro de aproximação, estabelecendo uma correspondência direta entre a profundidade do modelo e extensões de torres de álgebras de Lie.

Gyuryang Heo, Timothy Ngotiaoco, Kazuki Irie, Samuel J. Gershman, Bernardo Sabatini2026-03-09🤖 cs.LG

Prediction-Powered Conditional Inference

Este artigo propõe um método de inferência condicional que combina localização baseada em kernels com previsões de aprendizado de máquina para estimar funcionais condicionais em cenários com poucos dados rotulados e muitos dados não rotulados, garantindo intervalos de confiança válidos e com variância reduzida independentemente da precisão do modelo preditivo.

Yang Sui, Jin Zhou, Hua Zhou, Xiaowu Dai2026-03-09🤖 cs.LG

Koopman Regularized Deep Speech Disentanglement for Speaker Verification

O artigo propõe o DKSD-AE, um autoencoder estruturado que combina operadores de Koopman e normalização de instância para realizar a disentanglement de fala sem supervisão textual, alcançando desempenho competitivo em verificação de locutor com menos parâmetros e maior robustez.

Nikos Chazaridis, Mohammad Belal, Rafael Mestre, Timothy J. Norman, Christine Evers2026-03-09🤖 cs.LG

A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems

Este artigo apresenta um novo framework híbrido que combina heurísticas específicas do setor ferroviário com aprendizado por reforço (Q-learning) para otimizar a formação de trens em pátios de manobra, decompondo problemas complexos de acesso bilateral com duas locomotivas em subproblemas mais simples de acesso unilateral.

Ruonan Zhao, Joseph Geunes2026-03-09🤖 cs.LG

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Este estudo propõe um quadro analítico híbrido de GeoAI que integra MGWR, Random Forest e ST-GCN para modelar a heterogeneidade espaço-temporal dos fluxos de tráfego e sua interação com o uso do solo em múltiplos modos de transporte, demonstrando superioridade preditiva e fornecendo um conjunto de ferramentas interpretáveis para o planeamento urbano e de mobilidade.

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models

O artigo apresenta a BISE (Extração de Sub-redes Invariantes a Vieses), uma estratégia que identifica e isola sub-redes "livres de vieses" dentro de modelos pré-treinados convencionais através de poda, permitindo mitigar vieses algorítmicos sem a necessidade de retreinamento, ajuste fino ou dados adicionais.

Ivan Luiz De Moura Matos, Abdel Djalil Sad Saoud, Ekaterina Iakovleva, Vito Paolo Pastore, Enzo Tartaglione2026-03-09🤖 cs.LG

On the Value of Tokeniser Pretraining in Physics Foundation Models

O artigo demonstra que o pré-treinamento de tokenizadores com um objetivo de autoencoder, especialmente quando alinhado ao domínio físico específico, melhora significativamente a eficiência e a precisão dos modelos de base para física, reduzindo o erro de VRMSE em 64% em comparação com o treinamento a partir do zero.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Este artigo propõe o primeiro framework de verificação robusta acoplado para detectores de keypoints baseados em mapas de calor, utilizando um programa linear de números mistos (MILP) para garantir a robustez conjunta de todos os keypoints e superar as limitações conservadoras das abordagens decopladas anteriores.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

O artigo apresenta o modelo behavior-dLDS, um sistema dinâmico linear decomposto que desentrelaça dinâmicas neurais latentes relacionadas ao comportamento de computações internas paralelas, demonstrando sua eficácia em dados simulados e sua escalabilidade para milhares de neurônios em gravações de larvas de peixe-zebra.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. Charles2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

O artigo apresenta o RACAS, uma arquitetura agênica baseada em modelos de linguagem que permite o controle em malha fechada de robôs radicalmente diferentes (terrestres, subaquáticos e de membros articulados) utilizando apenas descrições em linguagem natural, eliminando a necessidade de reprogramação ou re-treinamento para cada nova plataforma.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

← Anterior Próximo →