Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

O artigo apresenta o EvoKernel, um framework de agentes autoevolutivos que utiliza uma abordagem de memória orientada a valor para superar a escassez de dados na síntese de kernels para NPUs, melhorando drasticamente a precisão e o desempenho através de rascunhos iniciais e refinamento contínuo sem necessidade de ajuste fino custoso.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Este artigo apresenta um Filtro de Partículas com Marcos Semânticos (SLPF) que integra a detecção de troncos e postes com dados LiDAR e GNSS para superar a ambiguidade perceptiva em vinhedos, demonstrando em testes de campo uma redução significativa no erro de localização e uma maior precisão na identificação de fileiras em comparação com métodos tradicionais baseados apenas em geometria, visão ou GNSS.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

O artigo propõe o V0.5V_{0.5}, um modelo de valor generalista que funde adaptativamente uma prioridade pré-treinada com médias empíricas de rollouts esparsos, utilizando testes estatísticos em tempo real para equilibrar viés e variância, resultando em uma melhoria de desempenho superior a 10% e convergência mais rápida em benchmarks de raciocínio matemático em comparação com métodos como GRPO e DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

O artigo apresenta o GRACE, um simulador e conjunto de benchmarks unificado para planejamento de trajetórias de múltiplos robôs em 2D, que permite comparações justas e reprodutíveis entre diferentes níveis de abstração (grade, mapa de rotas e contínuo) para avaliar as compensações entre fidelidade e escalabilidade.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este artigo apresenta um novo corpus bilíngue (inglês/alemão) e uma taxonomia de arquivo de autoridade (GND) para treinar e avaliar sistemas de classificação de texto multi-rótulo, visando aprimorar a indexação e o trabalho dos catalogadores em bibliotecas digitais por meio de IA transparente e baseada em autoridade.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabalho propõe a Amostragem Preditiva de Dinâmica (DPS), um método que utiliza inferência bayesiana online sobre um modelo de Markov oculto para prever e selecionar prompts informativos antes de custosas simulações, reduzindo assim a sobrecarga computacional e acelerando o ajuste fino por aprendizado por reforço de modelos de raciocínio grandes.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

O artigo apresenta o PharmGraph-Auditor, um sistema híbrido que combina uma Base de Conhecimento Farmacêutico (HPKB) com um paradigma de Verificação em Cadeia (CoV) para transformar modelos de linguagem em motores de raciocínio transparentes e baseados em evidências, visando aumentar a segurança e a rastreabilidade na verificação de prescrições médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artigo propõe o "Historical Consensus Training", um método iterativo que utiliza múltiplas clusterizações de modelos de mistura gaussiana para criar uma barreira histórica no espaço de parâmetros, eliminando permanentemente o colapso posterior em autoencoders variacionais sem depender de restrições arquiteturais ou ajuste de hiperparâmetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

O artigo propõe o RAD, um novo framework de alinhamento em Aprendizado por Reforço com Feedback Humano (RLHF) que substitui restrições de custo esperado por restrições de Dominância Estocástica de Primeira Ordem dentro de um quadro de Transporte Ótimo, permitindo o controle universal de riscos espectrais e oferecendo maior robustez contra falhas catastróficas e distribuições fora do padrão.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

O artigo propõe o CCGE, um método de exploração guiada pela cobertura de contato que utiliza contadores de interações dedo-objeto para gerar recompensas de cobertura e de alcance, melhorando significativamente a eficiência do treinamento e a transferência para o mundo real em tarefas de manipulação destreza de propósito geral.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

O artigo apresenta o GroundCount, um framework que integra modelos de detecção de objetos a Modelos Visuais-Linguísticos (VLMs) para mitigar alucinações de contagem, demonstrando que a ancoragem espacial explícita via prompts estruturados supera a fusão de características e melhora significativamente a precisão na maioria das arquiteturas avaliadas.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Este artigo investiga como a Inteligência Artificial atua como catalisador para a inovação na Engenharia de Software, demonstrando através de revisão bibliográfica e estudo empírico que a integração de ferramentas de ML e NLP otimiza práticas ágeis ao automatizar tarefas repetitivas e melhorar a gestão de requisitos, geração de código e testes.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Este artigo analisa os desafios metodológicos e propõe soluções práticas para estudos de melhoria humana com IA de ponta, baseando-se em entrevistas com especialistas que identificam tensões entre as suposições padrão de inferência causal e a natureza dinâmica desses sistemas ao informar decisões de alto risco.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Em uma colaboração interdisciplinar, este estudo caracteriza os mecanismos pelos quais os Modelos de Linguagem Visual (VLMs) preveem estilos artísticos, revelando que a grande maioria dos conceitos extraídos é considerada coerente e relevante por historiadores da arte, embora o sucesso do modelo em alguns casos também possa ser atribuído à sua compreensão formal de características visuais como contrastes de luz e sombra.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

O artigo apresenta o NeFTY, um framework de física diferenciável que utiliza campos neurais para realizar a reconstrução quantitativa 3D de propriedades materiais e a localização de defeitos subsuperficiais a partir de medições térmicas, superando as limitações de métodos tradicionais e redes PINNs em cenários de difusão transitória.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci