CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization

O artigo apresenta o CAD-Tokenizer, um novo framework que utiliza tokenização específica de modalidades e um VQ-VAE baseado em sequências para representar dados de CAD em tokens conscientes de primitivas, superando as limitações dos tokenizadores de linguagem padrão e melhorando significativamente a geração e edição de protótipos de CAD guiados por texto.

Ruiyu Wang, Shizhao Sun, Weijian Ma + 1 more2026-03-05🤖 cs.LG

Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data

Este trabalho apresenta uma abordagem que utiliza agentes de LLMs com ferramentas de raciocínio para induzir árvores de decisão leves e interpretáveis a partir de pequenos conjuntos de dados tabulares, alcançando desempenho competitivo com modelos de caixa preta enquanto permite a verificação de viés e a incorporação de restrições de justiça e monotonicidade.

George Yakushev, Alina Shutova, Ivan Rubachev + 3 more2026-03-05🤖 cs.LG

Scalable Second-order Riemannian Optimization for KK-means Clustering

Este artigo propõe uma nova formulação do problema de agrupamento KK-means como uma otimização suave em uma variedade Riemanniana, permitindo o uso de um algoritmo de Newton com regularização cúbica de segunda ordem que resolve subproblemas em tempo linear e converge significativamente mais rápido que os métodos de primeira ordem existentes, mantendo a mesma precisão estatística.

Peng Xu, Chun-Ying Hou, Xiaohui Chen + 1 more2026-03-05🤖 cs.LG

The Lie of the Average: How Class Incremental Learning Evaluation Deceives You?

Este artigo propõe o protocolo EDGE para superar as limitações das avaliações atuais de Aprendizado Incremental de Classes, que subestimam a variabilidade de desempenho, ao introduzir a amostragem adaptativa de "sequências extremas" baseada na similaridade entre tarefas para caracterizar com precisão a distribuição completa de desempenho dos modelos.

Guannan Lai, Da-Wei Zhou, Xin Yang + 1 more2026-03-05🤖 cs.LG

Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning

O artigo apresenta o Uni-NTFM, um modelo de fundação unificado para representação de sinais de EEG que, inspirado em mecanismos neurais biológicos, integra projeção de características heterogêneas, incorporação topológica e uma rede Transformer com mistura de especialistas para superar os modelos existentes em diversas tarefas de decodificação cerebral.

Zhisheng Chen, Yingwei Zhang, Qizhen Lan + 7 more2026-03-05🤖 cs.AI

Learning in an Echo Chamber: Online Learning with Replay Adversary

Este artigo introduz o modelo de Aprendizado Online com Adversário de Replay para analisar o risco de sistemas de aprendizado reforçarem erros em dados autoanotados, propondo a Dimensão de Limiar Estendido como a medida exata de aprendibilidade e demonstrando que algoritmos baseados em fechamento alcançam limites ótimos de erro, superando as limitações de métodos clássicos e de aprendizagem própria neste cenário.

Daniil Dmitriev, Harald Eskelund Franck, Carolin Heinzler + 1 more2026-03-05🤖 cs.LG

Even Faster Kernel Matrix Linear Algebra via Density Estimation

Este artigo propõe algoritmos mais rápidos para operações de álgebra linear em matrizes de kernel, utilizando estimativa de densidade de kernel (KDE) para reduzir a dependência computacional no número de pontos e no erro de aproximação em comparação com métodos anteriores, ao mesmo tempo que estabelece limites inferiores que indicam a complexidade fundamental desses problemas.

Rikhav Shah, Sandeep Silwal, Haike Xu2026-03-05🤖 cs.LG

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

O artigo apresenta o FLOWR.root, um modelo fundamental baseado em fluxo de correspondência (flow matching) e equivariante a SE(3) que integra a geração 3D de ligantes conscientes da estrutura do sítio de ligação com a previsão de afinidade e confiança, demonstrando desempenho superior em benchmarks de afinidade e permitindo a otimização de fármacos por meio de adaptação de domínio eficiente e amostragem orientada por propriedades.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

Learning Explicit Single-Cell Dynamics Using ODE Representations

O artigo apresenta as Redes Neurais Mecanicistas Celulares (Cell-MNN), uma arquitetura de rede neural totalmente end-to-end que utiliza representações de equações diferenciais ordinárias (ODE) para modelar explicitamente e de forma interpretável as interações gênicas durante a diferenciação celular, superando os métodos atuais em escalabilidade e eficiência computacional.

Jan-Philipp von Bassewitz, Adeel Pervez, Marco Fumero + 3 more2026-03-05🤖 cs.LG

The Geometry of Reasoning: Flowing Logics in Representation Space

Este trabalho propõe um novo quadro geométrico que modela o raciocínio de grandes modelos de linguagem como fluxos suaves no espaço de representações, demonstrando que o treinamento por previsão de próximo token permite a internalização de invariantes lógicos como geometria de ordem superior e desafia a visão de que esses modelos são meros "papagaios estocásticos".

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

Gym-TORAX: Open-source software for integrating RL with plasma control simulators

O artigo apresenta o Gym-TORAX, um pacote de código aberto em Python que integra algoritmos de Aprendizado por Reforço (RL) com simuladores de dinâmica de plasma em tokamaks, permitindo a criação de ambientes compatíveis com diversas bibliotecas de RL para otimizar o controle e a estabilidade do plasma, com uma implementação inicial baseada no cenário de ramp-up do reator ITER.

Antoine Mouchamps, Arthur Malherbe, Adrien Bolland + 1 more2026-03-05🤖 cs.LG

A Geometry-Based View of Mahalanobis OOD Detection

Este artigo investiga a dependência da detecção de dados fora de distribuição (OOD) baseada em Mahalanobis em relação à geometria das representações de fundo, identificando a estrutura espectral e a dimensionalidade intrínseca como fatores críticos e propondo uma normalização radial escalada (2\ell_2) que ajusta os raios das características para melhorar o desempenho sem alterar suas direções.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG