ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

O artigo apresenta o ARC-TGI, um framework de código aberto que utiliza geradores de tarefas validados por humanos e cadeias de raciocínio para criar dinamicamente conjuntos de dados diversificados e controlados do ARC-AGI, superando problemas de superajuste e vazamento de dados ao garantir que exemplos de treinamento revelem consistentemente as regras subjacentes.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty

O artigo apresenta o SPIRIT, um sistema de autonomia compartilhada perceptiva que utiliza estimativas de incerteza de aprendizado profundo para alternar dinamicamente entre manipulação autônoma e teleoperação háptica, garantindo assim manipulação robótica robusta e segura mesmo diante de falhas na percepção baseada em IA.

Jongseok Lee, Ribin Balachandran, Harsimran Singh + 6 more2026-03-06🤖 cs.AI

UniPAR: A Unified Framework for Pedestrian Attribute Recognition

O artigo apresenta o UniPAR, um framework unificado baseado em Transformer que supera as limitações do paradigma "um modelo por conjunto de dados" ao permitir o processamento simultâneo de dados heterogêneos (RGB, vídeo e fluxos de eventos) de múltiplas fontes, alcançando desempenho comparável aos métodos especializados e melhorando a generalização em cenários extremos.

Minghe Xu, Rouying Wu, Jiarui Xu + 5 more2026-03-06🤖 cs.AI

Bidirectional Curriculum Generation: A Multi-Agent Framework for Data-Efficient Mathematical Reasoning

Este artigo apresenta um novo quadro de geração de currículo bidirecional baseado em agentes múltiplos que otimiza a eficiência de dados no raciocínio matemático de modelos de linguagem ao adaptar dinamicamente a complexidade dos problemas, simplificando-os para corrigir falhas ou complicando-os para desafiar o modelo, superando assim as abordagens unidirecionais tradicionais.

Boren Hu, Xiao Liu, Boci Peng + 4 more2026-03-06🤖 cs.AI

Measuring the Redundancy of Decoder Layers in SpeechLLMs

O estudo demonstra que os modelos de linguagem para fala (SpeechLLMs) possuem uma redundância significativa nas camadas do decodificador herdada dos modelos de texto pré-treinados, permitindo a poda de até 40% dessas camadas sem prejudicar o desempenho em tarefas como reconhecimento e tradução de fala, o que viabiliza o uso de um único backbone otimizado para múltiplas tarefas.

Adel Moumen, Guangzhi Sun, Philip C Woodland2026-03-06🤖 cs.AI

SSR-GS: Separating Specular Reflection in Gaussian Splatting for Glossy Surface Reconstruction

O artigo propõe o SSR-GS, uma nova estrutura para a reconstrução de superfícies brilhantes que combina cubemaps pré-filtrados e um módulo IndiASG para modelar reflexões especulares diretas e indiretas, além de utilizar Priors de Geometria Visual para mitigar o impacto de regiões dominadas por reflexões, alcançando desempenho superior na síntese de novas vistas.

Ningjing Fan, Yiqun Wang2026-03-06🤖 cs.AI

C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning

Este artigo apresenta o C2-Faith, um benchmark derivado do PRM800K para avaliar a fidelidade causal e de cobertura de modelos de linguagem atuando como juízes de raciocínio passo a passo, revelando que a confiabilidade desses modelos varia significativamente conforme a tarefa e que eles frequentemente falham em localizar erros ou identificar lacunas no raciocínio.

Avni Mittal, Rauno Arike2026-03-06🤖 cs.AI

Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions

Este documento estabelece diretrizes sistemáticas para a anotação e visualização da estrutura de argumentação jurídica em decisões judiciais chinesas, definindo tipos de proposições, relações argumentativas e fluxos de trabalho padronizados para viabilizar a análise computacional e o modelamento de raciocínio legal.

Kun Chen, Xianglei Liao, Kaixue Fei + 2 more2026-03-06🤖 cs.AI

Escaping the Hydrolysis Trap: An Agentic Workflow for Inverse Design of Durable Photocatalytic Covalent Organic Frameworks

Este artigo apresenta o Ara, um agente baseado em modelos de linguagem que supera métodos tradicionais de busca e otimização bayesiana ao identificar rapidamente estruturas de redes orgânicas covalentes (COFs) fotocatálíticas duráveis e estáveis, superando o compromisso entre atividade e resistência à hidrólise através da aplicação de lógica química interpretável.

Iman Peivaste, Nicolas D. Boscher, Ahmed Makradi + 1 more2026-03-06🔬 cond-mat.mtrl-sci