cs.LG artigos | Gist.Science

Best-of- $\infty$ -- Asymptotic Performance of Test-Time LLM Ensembling

Este artigo investiga o desempenho assintótico do ensembling de modelos de linguagem (LLMs) via votação majoritária, propondo um esquema adaptativo de geração e uma otimização de pesos para ensembles múltiplos que superam modelos individuais com eficiência computacional.

Junpei Komiyama, Daisuke Oba, Masafumi Oyamada2026-03-05🤖 cs.AI

CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization

O artigo apresenta o CAD-Tokenizer, um novo framework que utiliza tokenização específica de modalidades e um VQ-VAE baseado em sequências para representar dados de CAD em tokens conscientes de primitivas, superando as limitações dos tokenizadores de linguagem padrão e melhorando significativamente a geração e edição de protótipos de CAD guiados por texto.

Ruiyu Wang, Shizhao Sun, Weijian Ma + 1 more2026-03-05🤖 cs.LG

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Este trabalho apresenta uma abordagem que utiliza agentes de LLMs com ferramentas de raciocínio para induzir árvores de decisão leves e interpretáveis a partir de pequenos conjuntos de dados tabulares, alcançando desempenho competitivo com modelos de caixa preta enquanto permite a verificação de viés e a incorporação de restrições de justiça e monotonicidade.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Scalable Second-order Riemannian Optimization for $K$ -means Clustering

Este artigo propõe uma nova formulação do problema de agrupamento $K$ -means como uma otimização suave em uma variedade Riemanniana, permitindo o uso de um algoritmo de Newton com regularização cúbica de segunda ordem que resolve subproblemas em tempo linear e converge significativamente mais rápido que os métodos de primeira ordem existentes, mantendo a mesma precisão estatística.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

Erase or Hide? Suppressing Spurious Unlearning Neurons for Robust Unlearning

O artigo apresenta o Ssiuu, um novo método de esquecimento que utiliza regularização guiada por atribuição para eliminar com fidelidade o conhecimento sensível e evitar a formação de "neurônios de esquecimento espúrios" que permitem a reaprendizagem acidental em modelos de linguagem.

Nakyeong Yang, Dong-Kyum Kim, Jea Kwon + 3 more2026-03-05🤖 cs.LG

The Lie of the Average: How Class Incremental Learning Evaluation Deceives You?

Este artigo propõe o protocolo EDGE para superar as limitações das avaliações atuais de Aprendizado Incremental de Classes, que subestimam a variabilidade de desempenho, ao introduzir a amostragem adaptativa de "sequências extremas" baseada na similaridade entre tarefas para caracterizar com precisão a distribuição completa de desempenho dos modelos.

Guannan Lai, Da-Wei Zhou, Xin Yang + 1 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

O artigo apresenta o Uni-NTFM, um modelo de fundação unificado para representação de sinais de EEG que, inspirado em mecanismos neurais biológicos, integra projeção de características heterogêneas, incorporação topológica e uma rede Transformer com mistura de especialistas para superar os modelos existentes em diversas tarefas de decodificação cerebral.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Benchmarking ECG FMs: A Reality Check Across Clinical Tasks

Este estudo apresenta um benchmark abrangente de oito Modelos Fundamentais de ECG em 26 tarefas clínicas, revelando que a arquitetura do modelo (especificamente o ECG-CPC) é mais determinante para o desempenho e a eficiência de aprendizado do que a escala, embora lacunas significativas persistam em áreas como estrutura cardíaca e previsão de desfechos.

M A Al-Masud, Juan Miguel Lopez Alcaraz, Nils Strodthoff2026-03-05🤖 cs.LG

Learning in an Echo Chamber: Online Learning with Replay Adversary

Este artigo introduz o modelo de Aprendizado Online com Adversário de Replay para analisar o risco de sistemas de aprendizado reforçarem erros em dados autoanotados, propondo a Dimensão de Limiar Estendido como a medida exata de aprendibilidade e demonstrando que algoritmos baseados em fechamento alcançam limites ótimos de erro, superando as limitações de métodos clássicos e de aprendizagem própria neste cenário.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Even Faster Kernel Matrix Linear Algebra via Density Estimation

Este artigo propõe algoritmos mais rápidos para operações de álgebra linear em matrizes de kernel, utilizando estimativa de densidade de kernel (KDE) para reduzir a dependência computacional no número de pontos e no erro de aproximação em comparação com métodos anteriores, ao mesmo tempo que estabelece limites inferiores que indicam a complexidade fundamental desses problemas.

Rikhav Shah, Sandeep Silwal, Haike Xu2026-03-05🤖 cs.LG

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

O artigo apresenta o FLOWR.root, um modelo fundamental baseado em fluxo de correspondência (flow matching) e equivariante a SE(3) que integra a geração 3D de ligantes conscientes da estrutura do sítio de ligação com a previsão de afinidade e confiança, demonstrando desempenho superior em benchmarks de afinidade e permitindo a otimização de fármacos por meio de adaptação de domínio eficiente e amostragem orientada por propriedades.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

Learning Explicit Single-Cell Dynamics Using ODE Representations

O artigo apresenta as Redes Neurais Mecanicistas Celulares (Cell-MNN), uma arquitetura de rede neural totalmente end-to-end que utiliza representações de equações diferenciais ordinárias (ODE) para modelar explicitamente e de forma interpretável as interações gênicas durante a diferenciação celular, superando os métodos atuais em escalabilidade e eficiência computacional.

Jan-Philipp von Bassewitz, Adeel Pervez, Marco Fumero + 3 more2026-03-05🤖 cs.LG

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

O artigo apresenta o ELMUR, uma arquitetura de transformador com memória externa estruturada que supera as limitações de dependências de longo prazo em problemas de RL de horizonte estendido, alcançando desempenho superior em tarefas sintéticas e robóticas complexas com observações parciais.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

Value Flows

O artigo apresenta o "Value Flows", um método de aprendizado por reforço distribucional que utiliza modelos de fluxo para estimar distribuições completas de retornos futuros e quantificar a incerteza, alcançando um desempenho superior em diversas tarefas de benchmark ao priorizar o aprendizado em transições com alta variância.

Perry Dong, Chongyi Zheng, Chelsea Finn + 2 more2026-03-05🤖 cs.AI

The Geometry of Reasoning: Flowing Logics in Representation Space

Este trabalho propõe um novo quadro geométrico que modela o raciocínio de grandes modelos de linguagem como fluxos suaves no espaço de representações, demonstrando que o treinamento por previsão de próximo token permite a internalização de invariantes lógicos como geometria de ordem superior e desafia a visão de que esses modelos são meros "papagaios estocásticos".

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

Topological Alignment of Shared Vision-Language Embedding Space

O artigo apresenta o ToMCLIP, um framework que utiliza alinhamento topológico baseado em homologia persistente para corrigir o viés linguístico e melhorar a coerência estrutural e o desempenho de modelos de visão e linguagem multilíngues.

Junwon You, Dasol Kang, Jae-Hun Jung2026-03-05🤖 cs.AI

Gym-TORAX: Open-source software for integrating RL with plasma control simulators

O artigo apresenta o Gym-TORAX, um pacote de código aberto em Python que integra algoritmos de Aprendizado por Reforço (RL) com simuladores de dinâmica de plasma em tokamaks, permitindo a criação de ambientes compatíveis com diversas bibliotecas de RL para otimizar o controle e a estabilidade do plasma, com uma implementação inicial baseada no cenário de ramp-up do reator ITER.

Antoine Mouchamps, Arthur Malherbe, Adrien Bolland + 1 more2026-03-05🤖 cs.LG

Circuit Insights: Towards Interpretability Beyond Activations

O artigo apresenta o WeightLens e o CircuitLens, dois métodos complementares que superam as limitações das análises baseadas apenas em ativações ao interpretar características diretamente a partir dos pesos e capturar dinâmicas de circuitos, permitindo uma análise mecânica escalável e robusta de redes neurais.

Elena Golimblevskaia, Aakriti Jain, Bruno Puri + 3 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

O artigo apresenta o COGS, um framework de síntese de dados que aprimora a capacidade de raciocínio de modelos de linguagem multimídia em domínios com poucas anotações, como gráficos e documentos, decompondo perguntas em fatores primitivos para gerar conjuntos de dados sintéticos que permitem treinamento com recompensas de processo em nível de fator.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

A Geometry-Based View of Mahalanobis OOD Detection

Este artigo investiga a dependência da detecção de dados fora de distribuição (OOD) baseada em Mahalanobis em relação à geometria das representações de fundo, identificando a estrutura espectral e a dimensionalidade intrínseca como fatores críticos e propondo uma normalização radial escalada ( $\ell_2$ ) que ajusta os raios das características para melhorar o desempenho sem alterar suas direções.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG

← Anterior Próximo →

cs.LG

Best-of-∞\infty∞ -- Asymptotic Performance of Test-Time LLM Ensembling