cs.AI artigos | Gist.Science

On the Value of Tokeniser Pretraining in Physics Foundation Models

O artigo demonstra que o pré-treinamento de tokenizadores com um objetivo de autoencoder, especialmente quando alinhado ao domínio físico específico, melhora significativamente a eficiência e a precisão dos modelos de base para física, reduzindo o erro de VRMSE em 64% em comparação com o treinamento a partir do zero.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces

O artigo apresenta o DreamCAD, um framework generativo multimodal que produz modelos CAD editáveis (BRep) a partir de supervisão em nível de pontos, permitindo treinamento em larga escala em milhões de malhas 3D não anotadas e introduzindo o conjunto de dados CADCap-1M para avançar na pesquisa de texto-para-CAD.

Mohammad Sadil Khan, Muhammad Usama, Rolandos Alexandros Potamias, Didier Stricker, Muhammad Zeshan Afzal, Jiankang Deng, Ismail Elezi2026-03-09🤖 cs.AI

Real-Time AI Service Economy: A Framework for Agentic Computing Across the Continuum

Este artigo propõe uma arquitetura de gerenciamento híbrida para a economia de serviços de IA em tempo real, demonstrando que a topologia dos grafos de dependência é determinante para a estabilidade de preços em alocação de recursos descentralizada e que encapsular subgrafos complexos reduz a volatilidade de preços em até 75% sem sacrificar o desempenho.

Lauri Lovén, Alaa Saleh, Reza Farahani, Ilir Murturi, Miguel Bordallo López, Praveen Kumar Donta, Schahram Dustdar2026-03-09🤖 cs.AI

RACAS: Controlling Diverse Robots With a Single Agentic System

O artigo apresenta o RACAS, uma arquitetura agênica baseada em modelos de linguagem que permite o controle em malha fechada de robôs radicalmente diferentes (terrestres, subaquáticos e de membros articulados) utilizando apenas descrições em linguagem natural, eliminando a necessidade de reprogramação ou re-treinamento para cada nova plataforma.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

Adversarial Batch Representation Augmentation for Batch Correction in High-Content Cellular Screening

O artigo propõe o método ABRA, uma abordagem de generalização de domínio que utiliza aumento de representação adversária para mitigar efeitos de lote biológico em imagens de triagem celular de alto conteúdo, estabelecendo um novo estado da arte na classificação de perturbações siRNA.

Lei Tong, Xujing Yao, Adam Corrigan, Long Chen, Navin Rathna Kumar, Kerry Hallbrook, Jonathan Orme, Yinhai Wang, Huiyu Zhou2026-03-09🤖 cs.AI

Post Fusion Bird's Eye View Feature Stabilization for Robust Multimodal 3D Detection

O artigo propõe o "Post Fusion Stabilizer" (PFS), um módulo leve que estabiliza as representações de visão de pássaro em detectores de fusão Câmera-LiDAR existentes, melhorando significativamente a robustez contra falhas de sensores e mudanças de domínio sem a necessidade de reestruturar a arquitetura ou reentrenar modelos completos.

Trung Tien Dong, Dev Thakkar, Arman Sargolzaei, Xiaomin Lin2026-03-09🤖 cs.AI

Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search

O artigo apresenta o SCOUT, um método inovador para busca interativa de objetos em ambientes domésticos abertos que utiliza grafos de cena 3D e conhecimento relacional destilado de modelos de linguagem para superar as limitações de velocidade e precisão das abordagens anteriores, alcançando desempenho eficiente e generalizável tanto em simulação quanto em robôs físicos.

Imen Mahdi, Matteo Cassinelli, Fabien Despinoy, Tim Welschehold, Abhinav Valada2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

Este estudo demonstra que os julgamentos morais de modelos de linguagem grandes são altamente instáveis e manipuláveis, dependendo mais da estrutura narrativa, da perspectiva e do protocolo de avaliação do que da substância moral dos dilemas, o que levanta sérias preocupações sobre reprodutibilidade e equidade.

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Este estudo revela que, embora o TikTok cumpra formalmente a proibição da DSA de publicidade profilada a menores, a definição restritiva de "anúncio" permite que conteúdos comerciais disfarçados (como marketing de influenciadores) contornem a regulação, resultando numa profilagem algorítmica para menores que é significativamente mais intensa do que a observada em adultos.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan Srba2026-03-09🤖 cs.AI

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Este artigo propõe a Contagem Implícita de Erros (IEC), uma abordagem de aprendizado por reforço sem referência que enumera e pondera erros em vez de verificar acertos contra um gabarito, demonstrando sua superioridade em tarefas de "virtual try-on" onde múltiplas respostas válidas tornam a geração de rubricas tradicional inviável.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

SecureRAG-RTL: A Retrieval-Augmented, Multi-Agent, Zero-Shot LLM-Driven Framework for Hardware Vulnerability Detection

O artigo propõe o SecureRAG-RTL, um framework baseado em Geração Aumentada por Recuperação (RAG) e múltiplos agentes que melhora significativamente a detecção de vulnerabilidades em projetos de hardware descritos em HDL ao integrar conhecimento específico do domínio, superando as limitações dos modelos de linguagem pura e apresentando um novo conjunto de dados de benchmark para validação.

Touseef Hasan, Blessing Airehenbuwa, Nitin Pundir, Souvika Sarkar, Ujjwal Guin2026-03-09🤖 cs.AI

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Este artigo apresenta um novo framework de inpainting longitudinal baseado em modelos de difusão que utiliza contexto temporal e atenção a regiões específicas para reparar lesões em ressonâncias magnéticas cerebrais com alta fidelidade perceptual, estabilidade temporal e eficiência computacional, superando significativamente os métodos existentes.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. Arnold2026-03-09🤖 cs.AI

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

O artigo apresenta o Ptychi-Evolve, um quadro autônomo que utiliza modelos de linguagem grandes e mecanismos evolutivos para descobrir e evoluir automaticamente novos algoritmos de regularização para ptychografia, superando os métodos convencionais em diversas tarefas de caracterização de materiais.

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Reasoning Models Struggle to Control their Chains of Thought

O artigo introduz a suite de avaliação CoT-Control e demonstra que os modelos de raciocínio atuais possuem uma capacidade significativamente baixa de controlar seus pensamentos internos (CoT) em comparação com suas respostas finais, o que oferece uma cautela otimista sobre a viabilidade da monitorização de CoT, embora o mecanismo subjacente permaneça pouco compreendido.

Chen Yueh-Han, Robert McCarthy, Bruce W. Lee, He He, Ian Kivlichan, Bowen Baker, Micah Carroll, Tomek Korbak2026-03-09🤖 cs.AI

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

O artigo alerta que a rápida adoção da IA na ciência climática, embora prometa avanços, corre o risco de ampliar a desigualdade global ao concentrar infraestrutura e dados no Norte Global, exigindo uma mudança de paradigma para uma abordagem centrada em dados, infraestrutura digital pública e co-produção de conhecimento para garantir equidade e resiliência sistêmica.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Este artigo apresenta os resultados de uma pesquisa global que analisa as atitudes e crenças sobre como a Inteligência Artificial Generativa deve representar culturas, propondo definições de cultura extraídas das próprias comunidades e recomendando abordagens participativas e um quadro de sensibilidade para lidar com limites culturais.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

LTLGuard: Formalizing LTL Specifications with Compact Language Models and Lightweight Symbolic Reasoning

O artigo apresenta o LTLGuard, uma ferramenta modular que combina geração com restrições e verificação formal leve para permitir que modelos de linguagem compactos (4B–14B parâmetros) traduzam requisitos informais em especificações de LTL corretas e consistentes, superando as limitações de modelos menores em lógica temporal.

Medina Andresel, Cristinel Mateis, Dejan Nickovic, Spyridon Kounoupidis, Panagiotis Katsaros, Stavros Tripakis2026-03-09🤖 cs.AI

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

Este artigo demonstra que, ao analisar a taxa de vitória em vez da recompensa esperada, a amostragem Best-of-N (BoN) é estatisticamente ótima para alinhamento em tempo de inferência e propõe uma variante prática que elimina o "reward hacking" mantendo essa otimalidade.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

Este artigo apresenta o TML-Bench, um novo benchmark para avaliar agentes de ciência de dados autônomos em tarefas de aprendizado de máquina tabular baseadas em competições do Kaggle, demonstrando que o modelo MiniMax-M2.1 obteve o melhor desempenho agregado entre os 10 modelos de linguagem de código aberto testados sob diferentes limites de tempo.

Mykola Pinchuk2026-03-09🤖 cs.AI

Bridging Domains through Subspace-Aware Model Merging

O artigo propõe o método SCORE, que resolve conflitos de subespaço entre modelos treinados em domínios distintos ao projetá-los em uma base ortogonal compartilhada, melhorando significativamente a generalização de domínio em tarefas de fusão de modelos.

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

← Anterior Próximo →