Continual uncertainty learning

Este artigo propõe um novo framework de aprendizado contínuo baseado em currículo que combina controle baseado em modelo e aprendizado por reforço profundo para decompor problemas de controle robusto com múltiplas incertezas em tarefas sequenciais, permitindo uma transferência eficiente do simulador para a realidade em aplicações industriais como o controle de vibração ativa de trens de força automotivos.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

O artigo apresenta o Coupled Discrete Diffusion (CoDD), um framework híbrido que supera a barreira de fatorização em modelos de linguagem de difusão ao substituir distribuições de saída totalmente fatoradas por uma camada de inferência probabilística leve, permitindo a modelagem eficiente de dependências conjuntas complexas e gerando textos coerentes em poucos passos com custo computacional reduzido.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Este artigo estuda processos de decisão de Markov robustos não retangulares sob o critério de recompensa média, demonstrando que políticas com arrependimento sublinear são ótimas, estabelecendo uma representação minimax para o valor robusto e propondo uma política baseada em épocas que garante desempenho transitório constante ao combinar a política estacionária ótima para o pior caso com testes sequenciais e aprendizado online.

Shengbo Wang, Nian Si2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

O artigo apresenta o \textsc{Gome}, um agente de engenharia de aprendizado de máquina que substitui a busca em árvore tradicional por otimização baseada em gradientes, alcançando desempenho superior em modelos de raciocínio avançados e estabelecendo uma nova direção escalável para agentes de IA.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

O artigo apresenta o FinTexTS, um novo conjunto de dados de séries temporais financeiras emparelhadas com texto, construído por meio de um framework inovador que utiliza correspondência semântica baseada em contextos específicos de empresas e classificação multinível (macro, setor, empresas relacionadas e alvo) para capturar interdependências complexas do mercado e melhorar a previsão de preços de ações.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artigo apresenta duas técnicas de software, Escalonamento Consciente de Estouro (OAS) e Escalonamento de Macro Bloco (MBS), que reduzem drasticamente a lacuna de precisão entre os formatos MXFP4 e NVFP4 em Grandes Modelos de Linguagem, permitindo que o padrão MXFP4 atinja acurácia quase equivalente ao NVFP4 sem exigir alterações no hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

O artigo apresenta o KernelCraft, o primeiro benchmark que avalia a capacidade de agentes de IA de gerar e otimizar automaticamente kernels de baixo nível para aceleradores emergentes com instruções personalizadas, demonstrando que esses sistemas podem produzir código funcional e eficiente, reduzindo significativamente o tempo e o custo de desenvolvimento para novas arquiteturas de hardware.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Este artigo de revisão analisa o cenário de processadores de IA de ultra-baixo consumo, comparando arquiteturas heterogêneas, aceleradores neurais e processamento em sensor, e valida empiricamente essas abordagens através de benchmarks de um modelo de segmentação em três plataformas representativas (GAP9, STM32N6 e IMX500), demonstrando a superioridade do processamento em sensor em eficiência energética e latência.

Luigi Capogrosso, Pietro Bonazzi, Michele Magno2026-03-11🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Este artigo demonstra que a integração equilibrada de mecanismos complementares, como aprendizado contrastivo supervisionado, redes de Hopfield e redes recorrentes com portões hierárquicos, em Redes Neurais de Spiking resulta em melhorias significativas em precisão, eficiência energética e organização estrutural para visão neuromórfica, superando as abordagens de otimização isolada.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid Rehman2026-03-11🤖 cs.LG

Hebbian-Oscillatory Co-Learning

O artigo apresenta o Hebbian-Oscillatory Co-Learning (HOC-L), um framework dinâmico unificado que integra plasticidade estrutural hebbiana em geometria hiperbólica com sincronização de fase oscilatória, utilizando um parâmetro de ordem macroscópico para regular o fortalecimento das conexões sinápticas apenas quando há coerência de fase suficiente, garantindo convergência teórica e eficiência computacional em arquiteturas neurais esparsas.

Hasi Hays2026-03-11🤖 cs.LG

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Este artigo apresenta um framework de compressão para Computação de Reservatório que utiliza um mecanismo de poda baseado em sensibilidade para otimizar o equilíbrio entre precisão do modelo e eficiência de hardware em implementações FPGA, demonstrando reduções significativas no consumo de energia e recursos sem degradação perceptível da acurácia.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

O artigo apresenta a família AetherFloat, uma arquitetura de ponto flutuante baseada em radix-4 e mantissa explícita projetada para aceleradores de IA que elimina a necessidade de lógica de escalonamento por bloco (Block-Scaling), oferecendo reduções significativas em área, potência e atraso de caminho crítico, enquanto utiliza arredondamento estocástico para mitigar gradientes que desaparecem.

Keita Morisaki2026-03-11🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabalho desenvolveu uma estrutura de Redes Neurais Informadas por Física (PINN) para a reconstrução robusta de variáveis de estado ocultas e a estimativa de parâmetros biofísicos em modelos neuronais multiescala, superando as limitações de métodos tradicionais que dependem de solvers numéricos ao lidar com não-linearidades fortes e dados observacionais parciais e ruidosos.

Changliang Wei, Yangyang Wang, Xueyu Zhu2026-03-11🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este artigo propõe o modelo VI 2D SSM e sua arquitetura VI 2D Mamba, que estabelecem uma forma canônica de modelos de espaço de estado bidimensionais equivariantes à permutação para séries temporais multivariadas, eliminando dependências sequenciais desnecessárias entre variáveis e alcançando desempenho superior em diversas tarefas ao respeitar a simetria de troca inerente aos dados.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI