cs.LG artigos | Gist.Science

Continual uncertainty learning

Este artigo propõe um novo framework de aprendizado contínuo baseado em currículo que combina controle baseado em modelo e aprendizado por reforço profundo para decompor problemas de controle robusto com múltiplas incertezas em tarefas sequenciais, permitindo uma transferência eficiente do simulador para a realidade em aplicações industriais como o controle de vibração ativa de trens de força automotivos.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

O artigo apresenta o Coupled Discrete Diffusion (CoDD), um framework híbrido que supera a barreira de fatorização em modelos de linguagem de difusão ao substituir distribuições de saída totalmente fatoradas por uma camada de inferência probabilística leve, permitindo a modelagem eficiente de dependências conjuntas complexas e gerando textos coerentes em poucos passos com custo computacional reduzido.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models

Este artigo apresenta o SpeedTransformer, um modelo baseado em Transformers que utiliza apenas dados de velocidade de trajetórias GPS densas para detectar modos de transporte com maior precisão e adaptabilidade geográfica do que modelos tradicionais como o LSTM.

Yuandong Zhang, Othmane Echchabi, Tianshu Feng, Wenyi Zhang, Hsuai-Kai Liao, Charles Chang2026-03-11🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

Este artigo estuda processos de decisão de Markov robustos não retangulares sob o critério de recompensa média, demonstrando que políticas com arrependimento sublinear são ótimas, estabelecendo uma representação minimax para o valor robusto e propondo uma política baseada em épocas que garante desempenho transitório constante ao combinar a política estacionária ótima para o pior caso com testes sequenciais e aprendizado online.

Shengbo Wang, Nian Si2026-03-11🤖 cs.LG

DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking

O artigo apresenta o framework DUEL, que permite o cálculo exato da verossimilhança em modelos de difusão mascarada (MDMs) sob a distribuição de teste, revelando que esses modelos são substancialmente mais eficientes do que se pensava anteriormente e possuem um potencial de desempenho superior ao dos modelos autoregressivos.

Gilad Turok, Chris De Sa, Volodymyr Kuleshov2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

O artigo apresenta o \textsc{Gome}, um agente de engenharia de aprendizado de máquina que substitui a busca em árvore tradicional por otimização baseada em gradientes, alcançando desempenho superior em modelos de raciocínio avançados e estabelecendo uma nova direção escalável para agentes de IA.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

O artigo apresenta o FinTexTS, um novo conjunto de dados de séries temporais financeiras emparelhadas com texto, construído por meio de um framework inovador que utiliza correspondência semântica baseada em contextos específicos de empresas e classificação multinível (macro, setor, empresas relacionadas e alvo) para capturar interdependências complexas do mercado e melhorar a previsão de preços de ações.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artigo apresenta duas técnicas de software, Escalonamento Consciente de Estouro (OAS) e Escalonamento de Macro Bloco (MBS), que reduzem drasticamente a lacuna de precisão entre os formatos MXFP4 e NVFP4 em Grandes Modelos de Linguagem, permitindo que o padrão MXFP4 atinja acurácia quase equivalente ao NVFP4 sem exigir alterações no hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Equitable Multi-Task Learning for AI-RANs

Este artigo apresenta o framework OWO-FMTL, uma abordagem de aprendizado multi-tarefa online que garante equidade de longo prazo e desempenho adaptativo para usuários heterogêneos em Redes de Acesso Rádio habilitadas por IA (AI-RANs), utilizando um mecanismo de atualização primal-dual leve para equilibrar eficiência e justiça com baixo custo computacional.

Panayiotis Raptis, Fatih Aslan, George Iosifidis2026-03-11🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

O artigo apresenta o KernelCraft, o primeiro benchmark que avalia a capacidade de agentes de IA de gerar e otimizar automaticamente kernels de baixo nível para aceleradores emergentes com instruções personalizadas, demonstrando que esses sistemas podem produzir código funcional e eficiente, reduzindo significativamente o tempo e o custo de desenvolvimento para novas arquiteturas de hardware.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

O artigo apresenta o ALADIN, um framework de análise do espaço de projeto que permite avaliar trade-offs entre precisão, latência e consumo de recursos em aceleradores de IA embarcados com memória scratchpad, utilizando modelos de redes neurais quantizadas sem a necessidade de implantação física no hardware alvo.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Este artigo de revisão analisa o cenário de processadores de IA de ultra-baixo consumo, comparando arquiteturas heterogêneas, aceleradores neurais e processamento em sensor, e valida empiricamente essas abordagens através de benchmarks de um modelo de segmentação em três plataformas representativas (GAP9, STM32N6 e IMX500), demonstrando a superioridade do processamento em sensor em eficiência energética e latência.

Luigi Capogrosso, Pietro Bonazzi, Michele Magno2026-03-11🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

Este artigo apresenta uma arquitetura de acelerador de CNN para FPGAs que realiza processamento de múltiplos pixels e exploração do espaço de projeto orientada à taxa de dados, otimizando a utilização de recursos e permitindo a implementação eficiente de redes complexas em um único dispositivo.

Tobias Habermann, Martin Kumm2026-03-11🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Este artigo demonstra que a integração equilibrada de mecanismos complementares, como aprendizado contrastivo supervisionado, redes de Hopfield e redes recorrentes com portões hierárquicos, em Redes Neurais de Spiking resulta em melhorias significativas em precisão, eficiência energética e organização estrutural para visão neuromórfica, superando as abordagens de otimização isolada.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid Rehman2026-03-11🤖 cs.LG

Hebbian-Oscillatory Co-Learning

O artigo apresenta o Hebbian-Oscillatory Co-Learning (HOC-L), um framework dinâmico unificado que integra plasticidade estrutural hebbiana em geometria hiperbólica com sincronização de fase oscilatória, utilizando um parâmetro de ordem macroscópico para regular o fortalecimento das conexões sinápticas apenas quando há coerência de fase suficiente, garantindo convergência teórica e eficiência computacional em arquiteturas neurais esparsas.

Hasi Hays2026-03-11🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

Este trabalho apresenta a arquitetura Auralink SDC, que utiliza agentes de IA especializados implantados na borda para gerenciar autonomamente a infraestrutura de carregamento de veículos elétricos, alcançando 78% de resolução automática de incidentes e baixa latência ao superar as limitações das soluções baseadas em nuvem.

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Este artigo apresenta um framework de compressão para Computação de Reservatório que utiliza um mecanismo de poda baseado em sensibilidade para otimizar o equilíbrio entre precisão do modelo e eficiência de hardware em implementações FPGA, demonstrando reduções significativas no consumo de energia e recursos sem degradação perceptível da acurácia.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

O artigo apresenta a família AetherFloat, uma arquitetura de ponto flutuante baseada em radix-4 e mantissa explícita projetada para aceleradores de IA que elimina a necessidade de lógica de escalonamento por bloco (Block-Scaling), oferecendo reduções significativas em área, potência e atraso de caminho crítico, enquanto utiliza arredondamento estocástico para mitigar gradientes que desaparecem.

Keita Morisaki2026-03-11🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabalho desenvolveu uma estrutura de Redes Neurais Informadas por Física (PINN) para a reconstrução robusta de variáveis de estado ocultas e a estimativa de parâmetros biofísicos em modelos neuronais multiescala, superando as limitações de métodos tradicionais que dependem de solvers numéricos ao lidar com não-linearidades fortes e dados observacionais parciais e ruidosos.

Changliang Wei, Yangyang Wang, Xueyu Zhu2026-03-11🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este artigo propõe o modelo VI 2D SSM e sua arquitetura VI 2D Mamba, que estabelecem uma forma canônica de modelos de espaço de estado bidimensionais equivariantes à permutação para séries temporais multivariadas, eliminando dependências sequenciais desnecessárias entre variáveis e alcançando desempenho superior em diversas tarefas ao respeitar a simetria de troca inerente aos dados.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

← Anterior Próximo →