cs.AI artigos | Gist.Science

Continual uncertainty learning

Este artigo propõe um novo framework de aprendizado contínuo baseado em currículo que combina controle baseado em modelo e aprendizado por reforço profundo para decompor problemas de controle robusto com múltiplas incertezas em tarefas sequenciais, permitindo uma transferência eficiente do simulador para a realidade em aplicações industriais como o controle de vibração ativa de trens de força automotivos.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

O artigo apresenta o ReDON, uma nova arquitetura de processador óptico neural recorrente que supera as limitações de expressividade das redes ópticas tradicionais ao incorporar não linearidades auto-moduladas reconfiguráveis, resultando em ganhos significativos de precisão em tarefas de visão computacional com consumo energético mínimo.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

O artigo apresenta o SafeGen-LLM, um modelo de linguagem grande com pós-treinamento em duas etapas (SFT e GRPO) que melhora a segurança e a generalização em tarefas de planejamento robótico, superando modelos proprietários em diversos domínios e formatos de entrada.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

O artigo apresenta o Coupled Discrete Diffusion (CoDD), um framework híbrido que supera a barreira de fatorização em modelos de linguagem de difusão ao substituir distribuições de saída totalmente fatoradas por uma camada de inferência probabilística leve, permitindo a modelagem eficiente de dependências conjuntas complexas e gerando textos coerentes em poucos passos com custo computacional reduzido.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

O artigo apresenta o OrthoAI, uma estrutura neurosimbólica que integra segmentação de dentes por meio de supervisão esparsa, inferência de viabilidade biomecânica baseada em restrições e avaliação de tratamento multicritério para apoiar a decisão clínica automatizada na ortodontia com alinhadores transparentes.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Este artigo apresenta uma abordagem de duplo pipeline para segmentação de imagens de aves que utiliza modelos fundamentais de 2025, alcançando resultados supervisionados superiores e desempenho zero-shot inédito ao combinar Grounding DINO 1.5 ou YOLOv11 para detecção com o Segment Anything Model 2.1 para geração de máscaras, sem necessidade de retreinamento do modelo de segmentação.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

O artigo apresenta o Pri4R, uma abordagem que aprimora modelos Visão-Linguagem-Ação (VLA) ao incorporar dinâmicas do mundo por meio da previsão de rastros de pontos 3D durante o treinamento, resultando em melhor desempenho em tarefas de manipulação física sem adicionar custo computacional ou complexidade na inferência.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

O artigo apresenta o \textsc{Gome}, um agente de engenharia de aprendizado de máquina que substitui a busca em árvore tradicional por otimização baseada em gradientes, alcançando desempenho superior em modelos de raciocínio avançados e estabelecendo uma nova direção escalável para agentes de IA.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

O artigo apresenta o CB-MCTS, um novo algoritmo de busca em árvore Monte Carlo descentralizada que utiliza uma política estocástica baseada em Boltzmann e um bônus de entropia decrescente para superar as limitações de exploração em ambientes de recompensa esparsa ou enganosa, superando o Dec-MCTS em cenários desafiadores.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

O artigo apresenta o FinTexTS, um novo conjunto de dados de séries temporais financeiras emparelhadas com texto, construído por meio de um framework inovador que utiliza correspondência semântica baseada em contextos específicos de empresas e classificação multinível (macro, setor, empresas relacionadas e alvo) para capturar interdependências complexas do mercado e melhorar a previsão de preços de ações.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

O artigo propõe o SPARC, um método de planejamento de trajetória para múltiplos robôs que utiliza um mecanismo de atenção aprimorado por relações espaciais (RMHA) para priorizar dinamicamente a comunicação com vizinhos próximos, alcançando uma taxa de sucesso superior em ambientes congestionados e com alta densidade de obstáculos.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artigo apresenta duas técnicas de software, Escalonamento Consciente de Estouro (OAS) e Escalonamento de Macro Bloco (MBS), que reduzem drasticamente a lacuna de precisão entre os formatos MXFP4 e NVFP4 em Grandes Modelos de Linguagem, permitindo que o padrão MXFP4 atinja acurácia quase equivalente ao NVFP4 sem exigir alterações no hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

O artigo apresenta o "Design Conductor", um agente autônomo capaz de projetar, verificar e gerar o layout final (GDSII) de uma CPU RISC-V Linux-compatível operando a 1,48 GHz em apenas 12 horas, partindo de um documento de requisitos e marcando a primeira vez que um agente autônomo construiu um processador completo do conceito à fabricação.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

O artigo apresenta o CktEvo, um benchmark e framework de referência que permite a otimização automática de nível de repositório em projetos RTL, utilizando modelos de linguagem para realizar edições que preservam a funcionalidade e melhoram métricas de Potência, Desempenho e Área (PPA) com base em feedback da cadeia de ferramentas.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

O artigo apresenta o SiliconMind-V1, um framework multi-agente que utiliza geração de dados orientada a raciocínio e verificação baseada em testbenches para permitir que modelos de linguagem localmente ajustados gerem, testem e depurem designs RTL em Verilog com maior correção funcional e menor custo do que os métodos existentes.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

O artigo apresenta o ALADIN, um framework de análise do espaço de projeto que permite avaliar trade-offs entre precisão, latência e consumo de recursos em aceleradores de IA embarcados com memória scratchpad, utilizando modelos de redes neurais quantizadas sem a necessidade de implantação física no hardware alvo.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Este estudo apresenta evidências preliminares de que técnicas de alinhamento em modelos de linguagem podem gerar patologias coletivas iatrogênicas, onde a censura invisível e a complexidade das restrições de alinhamento exacerbam comportamentos disfuncionais em sistemas multiagentes, sugerindo que as avaliações de segurança atuais podem não detectar esses efeitos adversos.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Esta tese de doutoramento apresenta métodos inovadores e economicamente eficientes para avaliar e melhorar a confiabilidade de aceleradores de hardware de redes neurais profundas, incluindo uma revisão sistemática da literatura, novas ferramentas analíticas e uma técnica de aprimoramento em tempo real chamada AdAM que equilibra eficiência computacional e tolerância a falhas.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

O artigo apresenta o ARKV, um framework leve e adaptativo que gerencia dinamicamente o cache KV em modelos de linguagem grandes sob orçamentos de memória restritos, alocando diferentes níveis de precisão aos tokens com base na importância e nas dinâmicas de atenção para reduzir o uso de memória em quatro vezes enquanto mantém a precisão em tarefas de contexto longo.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Este estudo avalia a reutilização de ancilas sem medição via "blind reset" em processadores supercondutores e de íons aprisionados, demonstrando que a técnica pode reduzir a latência do ciclo lógico em até 38 vezes enquanto mantém a limpeza das ancilas, fornecendo diretrizes específicas para cada plataforma sobre quando essa estratégia é mais eficiente.

Sangkeum Lee2026-03-11⚛️ quant-ph

← Anterior Próximo →