cs.AI artigos | Gist.Science

ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

O artigo apresenta o ARC-TGI, um framework de código aberto que utiliza geradores de tarefas validados por humanos e cadeias de raciocínio para criar dinamicamente conjuntos de dados diversificados e controlados do ARC-AGI, superando problemas de superajuste e vazamento de dados ao garantir que exemplos de treinamento revelem consistentemente as regras subjacentes.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

O artigo apresenta o SPIRIT, um sistema de autonomia compartilhada perceptiva que utiliza estimativas de incerteza de aprendizado profundo para alternar dinamicamente entre manipulação autônoma e teleoperação háptica, garantindo assim manipulação robótica robusta e segura mesmo diante de falhas na percepção baseada em IA.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

UniPAR: A Unified Framework for Pedestrian Attribute Recognition

O artigo apresenta o UniPAR, um framework unificado baseado em Transformer que supera as limitações do paradigma "um modelo por conjunto de dados" ao permitir o processamento simultâneo de dados heterogêneos (RGB, vídeo e fluxos de eventos) de múltiplas fontes, alcançando desempenho comparável aos métodos especializados e melhorando a generalização em cenários extremos.

Minghe Xu, Rouying Wu, Jiarui Xu + 5 more2026-03-06🤖 cs.AI

FedBCD:Communication-Efficient Accelerated Block Coordinate Gradient Descent for Federated Learning

Este artigo propõe o FedBCGD e sua versão acelerada FedBCGD+, métodos inovadores de descida de gradiente coordenada por blocos para aprendizado federado que dividem os parâmetros do modelo em blocos para reduzir significativamente a sobrecarga de comunicação e acelerar a convergência em modelos de grande escala.

Junkang Liu, Fanhua Shang, Yuanyuan Liu + 3 more2026-03-06🤖 cs.AI

Bidirectional Curriculum Generation: A Multi-Agent Framework for Data-Efficient Mathematical Reasoning

Este artigo apresenta um novo quadro de geração de currículo bidirecional baseado em agentes múltiplos que otimiza a eficiência de dados no raciocínio matemático de modelos de linguagem ao adaptar dinamicamente a complexidade dos problemas, simplificando-os para corrigir falhas ou complicando-os para desafiar o modelo, superando assim as abordagens unidirecionais tradicionais.

Boren Hu, Xiao Liu, Boci Peng + 4 more2026-03-06🤖 cs.AI

Measuring the Redundancy of Decoder Layers in SpeechLLMs

O estudo demonstra que os modelos de linguagem para fala (SpeechLLMs) possuem uma redundância significativa nas camadas do decodificador herdada dos modelos de texto pré-treinados, permitindo a poda de até 40% dessas camadas sem prejudicar o desempenho em tarefas como reconhecimento e tradução de fala, o que viabiliza o uso de um único backbone otimizado para múltiplas tarefas.

Adel Moumen, Guangzhi Sun, Philip C Woodland2026-03-06🤖 cs.AI

MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus

O artigo apresenta o MedCoRAG, um framework de IA interpretável para diagnóstico de doenças hepáticas que combina recuperação híbrida de evidências e raciocínio colaborativo multiagente para superar as limitações de transparência e precisão dos métodos existentes.

Zheng Li, Jiayi Xu, Zhikai Hu + 4 more2026-03-06🤖 cs.AI

LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting

Este artigo propõe o LBM, um modelo hierárquico de auto-lance que combina um componente de raciocínio (LBM-Think) e um de ação (LBM-Act) com mecanismos de fusão de embeddings e ajuste fino por reforço offline (GQPO) para superar as limitações de métodos existentes e melhorar a performance e a generalização em leilões publicitários dinâmicos.

Yewen Li, Zhiyi Lyu, Peng Jiang + 4 more2026-03-06🤖 cs.AI

Particle-Guided Diffusion for Gas-Phase Reaction Kinetics

Este artigo apresenta um método de amostragem guiada por difusão que utiliza modelos treinados em equações de advecção-reação-difusão para gerar campos de concentração fisicamente consistentes e prever com precisão as concentrações de saída em reações químicas gasosas, inclusive para parâmetros não vistos anteriormente.

Andrew Millard, Henrik Pedersen2026-03-06🔬 physics

Recurrent Graph Neural Networks and Arithmetic Circuits

Este artigo estabelece uma correspondência exata entre o poder computacional de redes neurais em grafos recorrentes e circuitos aritméticos recorrentes sobre números reais, demonstrando que ambas as arquiteturas possuem expressividade equivalente ao simularem mutuamente suas respectivas computações.

Timon Barlag, Vivian Holzapfel, Laura Strieker + 2 more2026-03-06🤖 cs.AI

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Este artigo apresenta o fedCI e o fedCI-IOD, métodos de descoberta causal federada que permitem testar independência condicional e inferir relações causais sob confusão latente em conjuntos de dados heterogêneos e distribuídos, preservando a privacidade e superando limitações de amostragem local.

Maximilian Hahn, Alina Zajak, Dominik Heider + 1 more2026-03-06🤖 cs.AI

SSR-GS: Separating Specular Reflection in Gaussian Splatting for Glossy Surface Reconstruction

O artigo propõe o SSR-GS, uma nova estrutura para a reconstrução de superfícies brilhantes que combina cubemaps pré-filtrados e um módulo IndiASG para modelar reflexões especulares diretas e indiretas, além de utilizar Priors de Geometria Visual para mitigar o impacto de regiões dominadas por reflexões, alcançando desempenho superior na síntese de novas vistas.

Ningjing Fan, Yiqun Wang2026-03-06🤖 cs.AI

Lifelong Language-Conditioned Robotic Manipulation Learning

O artigo apresenta o SkillsCrafter, um novo framework de manipulação robótica que permite a aprendizagem contínua de múltiplas habilidades linguísticas sem esquecer as anteriores, utilizando adaptação de habilidades e agregação de especialização para preservar e generalizar o conhecimento.

Xudong Wang, Zebin Han, Zhiyu Liu + 5 more2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Este artigo apresenta o C2-Faith, um benchmark derivado do PRM800K para avaliar a fidelidade causal e de cobertura de modelos de linguagem atuando como juízes de raciocínio passo a passo, revelando que a confiabilidade desses modelos varia significativamente conforme a tarefa e que eles frequentemente falham em localizar erros ou identificar lacunas no raciocínio.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Este documento estabelece diretrizes sistemáticas para a anotação e visualização da estrutura de argumentação jurídica em decisões judiciais chinesas, definindo tipos de proposições, relações argumentativas e fluxos de trabalho padronizados para viabilizar a análise computacional e o modelamento de raciocínio legal.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Logi-PAR: Logic-Infused Patient Activity Recognition via Differentiable Rule

O artigo apresenta o Logi-PAR, um novo framework de reconhecimento de atividades de pacientes que integra regras lógicas diferenciáveis para inferir riscos de forma explicável e auditable, superando os modelos atuais em precisão e capacidade de raciocínio causal em ambientes clínicos.

Muhammad Zarar, MingZheng Zhang, Xiaowang Zhang + 3 more2026-03-06🤖 cs.AI

Escaping the Hydrolysis Trap: An Agentic Workflow for Inverse Design of Durable Photocatalytic Covalent Organic Frameworks

Este artigo apresenta o Ara, um agente baseado em modelos de linguagem que supera métodos tradicionais de busca e otimização bayesiana ao identificar rapidamente estruturas de redes orgânicas covalentes (COFs) fotocatálíticas duráveis e estáveis, superando o compromisso entre atividade e resistência à hidrólise através da aplicação de lógica química interpretável.

Iman Peivaste, Nicolas D. Boscher, Ahmed Makradi + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation

O artigo propõe o Stable-LoRA, uma estratégia de otimização que estabiliza o aprendizado de características no LoRA ao encolher dinamicamente a matriz A nos estágios iniciais do treinamento, superando as limitações de estabilidade das inicializações não nulas e alcançando desempenho superior sem custos adicionais significativos.

Yize Wu, Ke Gao, Ling Li + 1 more2026-03-06🤖 cs.AI

Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding

Este artigo propõe uma abordagem de otimização para o recorte do vocabulário em modelos de rascunho de decodificação especulativa, equilibrando a cobertura de tokens e a latência de inferência para alcançar ganhos significativos de throughput e redução de atraso, especialmente em cargas de trabalho específicas de domínio.

Ofir Ben Shoham2026-03-06🤖 cs.AI

Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning

Este artigo apresenta o IAENet, um novo framework de aprendizado multi-rótulo baseado em Transformer que, ao integrar dados clínicos heterogêneos e mitigar desequilíbrios de classe, supera os métodos existentes na previsão antecipada de múltiplos eventos adversos intraoperatórios.

Xueyao Wang, Xiuding Cai, Honglin Shang + 2 more2026-03-06🤖 cs.AI

← Anterior Próximo →