cs.AI artigos | Gist.Science

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

O artigo apresenta o EvoKernel, um framework de agentes autoevolutivos que utiliza uma abordagem de memória orientada a valor para superar a escassez de dados na síntese de kernels para NPUs, melhorando drasticamente a precisão e o desempenho através de rascunhos iniciais e refinamento contínuo sem necessidade de ajuste fino custoso.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Este artigo apresenta um Filtro de Partículas com Marcos Semânticos (SLPF) que integra a detecção de troncos e postes com dados LiDAR e GNSS para superar a ambiguidade perceptiva em vinhedos, demonstrando em testes de campo uma redução significativa no erro de localização e uma maior precisão na identificação de fileiras em comparação com métodos tradicionais baseados apenas em geometria, visão ou GNSS.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

O artigo propõe o $V_{0.5}$ , um modelo de valor generalista que funde adaptativamente uma prioridade pré-treinada com médias empíricas de rollouts esparsos, utilizando testes estatísticos em tempo real para equilibrar viés e variância, resultando em uma melhoria de desempenho superior a 10% e convergência mais rápida em benchmarks de raciocínio matemático em comparação com métodos como GRPO e DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

O artigo apresenta o GRACE, um simulador e conjunto de benchmarks unificado para planejamento de trajetórias de múltiplos robôs em 2D, que permite comparações justas e reprodutíveis entre diferentes níveis de abstração (grade, mapa de rotas e contínuo) para avaliar as compensações entre fidelidade e escalabilidade.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este artigo apresenta um novo corpus bilíngue (inglês/alemão) e uma taxonomia de arquivo de autoridade (GND) para treinar e avaliar sistemas de classificação de texto multi-rótulo, visando aprimorar a indexação e o trabalho dos catalogadores em bibliotecas digitais por meio de IA transparente e baseada em autoridade.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Este artigo apresenta um modelo eficiente de Difusão Transformer (DiT) que gera sequências de DNA regulatório específicas de tipos celulares com maior eficiência de treinamento e menor memorização que abordagens anteriores, alcançando uma melhoria de 38 vezes na atividade regulatória predita após o ajuste fino com DDPO.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabalho propõe a Amostragem Preditiva de Dinâmica (DPS), um método que utiliza inferência bayesiana online sobre um modelo de Markov oculto para prever e selecionar prompts informativos antes de custosas simulações, reduzindo assim a sobrecarga computacional e acelerando o ajuste fino por aprendizado por reforço de modelos de raciocínio grandes.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

O artigo apresenta o PharmGraph-Auditor, um sistema híbrido que combina uma Base de Conhecimento Farmacêutico (HPKB) com um paradigma de Verificação em Cadeia (CoV) para transformar modelos de linguagem em motores de raciocínio transparentes e baseados em evidências, visando aumentar a segurança e a rastreabilidade na verificação de prescrições médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

O LookaheadKV é um framework de evicção de cache KV leve e preciso que supera os métodos existentes ao prever a importância dos tokens sem a necessidade de geração de rascunho computacionalmente custosa, resultando em menor latência e melhor desempenho em tarefas de longo contexto.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS

Este trabalho demonstra que o ajuste fino LoRA de modelos de linguagem grandes (LLMs) para sistemas de síntese de fala (TTS) melhora significativamente a qualidade perceptiva, a fidelidade do locutor e a relação sinal-ruído, desde que apoiado por dados de treinamento com diversidade acústica suficiente.

Anupam Purwar, Aditya Choudhary2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artigo propõe o "Historical Consensus Training", um método iterativo que utiliza múltiplas clusterizações de modelos de mistura gaussiana para criar uma barreira histórica no espaço de parâmetros, eliminando permanentemente o colapso posterior em autoencoders variacionais sem depender de restrições arquiteturais ou ajuste de hiperparâmetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

O artigo propõe o RAD, um novo framework de alinhamento em Aprendizado por Reforço com Feedback Humano (RLHF) que substitui restrições de custo esperado por restrições de Dominância Estocástica de Primeira Ordem dentro de um quadro de Transporte Ótimo, permitindo o controle universal de riscos espectrais e oferecendo maior robustez contra falhas catastróficas e distribuições fora do padrão.

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

O artigo propõe o CCGE, um método de exploração guiada pela cobertura de contato que utiliza contadores de interações dedo-objeto para gerar recompensas de cobertura e de alcance, melhorando significativamente a eficiência do treinamento e a transferência para o mundo real em tarefas de manipulação destreza de propósito geral.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

O artigo apresenta o GroundCount, um framework que integra modelos de detecção de objetos a Modelos Visuais-Linguísticos (VLMs) para mitigar alucinações de contagem, demonstrando que a ancoragem espacial explícita via prompts estruturados supera a fusão de características e melhora significativamente a precisão na maioria das arquiteturas avaliadas.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Este artigo investiga como a Inteligência Artificial atua como catalisador para a inovação na Engenharia de Software, demonstrando através de revisão bibliográfica e estudo empírico que a integração de ferramentas de ML e NLP otimiza práticas ágeis ao automatizar tarefas repetitivas e melhorar a gestão de requisitos, geração de código e testes.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Este artigo analisa os desafios metodológicos e propõe soluções práticas para estudos de melhoria humana com IA de ponta, baseando-se em entrevistas com especialistas que identificam tensões entre as suposições padrão de inferência causal e a natureza dinâmica desses sistemas ao informar decisões de alto risco.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Em uma colaboração interdisciplinar, este estudo caracteriza os mecanismos pelos quais os Modelos de Linguagem Visual (VLMs) preveem estilos artísticos, revelando que a grande maioria dos conceitos extraídos é considerada coerente e relevante por historiadores da arte, embora o sucesso do modelo em alguns casos também possa ser atribuído à sua compreensão formal de características visuais como contrastes de luz e sombra.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Instruction set for the representation of graphs

O artigo apresenta o IsalGraph, um método que codifica a estrutura de qualquer grafo finito e simples em uma string compacta de nove caracteres, garantindo decodificação válida, invariância a isomorfismos e forte correlação entre a distância de edição de grafos e a distância de Levenshtein nas strings resultantes.

Ezequiel Lopez-Rubio, Mario Pascual-Gonzalez2026-03-12💬 cs.CL

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

O artigo apresenta o V2M-Zero, um método inovador de geração de música sincronizada com vídeos que, ao alinhar as curvas de eventos temporais de cada modalidade de forma independente, alcança resultados superiores aos modelos baseados em dados pareados sem exigir treinamento cruzado ou pares de dados.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

O artigo apresenta o NeFTY, um framework de física diferenciável que utiliza campos neurais para realizar a reconstrução quantitativa 3D de propriedades materiais e a localização de defeitos subsuperficiais a partir de medições térmicas, superando as limitações de métodos tradicionais e redes PINNs em cenários de difusão transitória.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

← Anterior Próximo →

cs.AI