cs.AI artigos | Gist.Science

EvoPrune: Early-Stage Visual Token Pruning for Efficient MLLMs

O artigo apresenta o EvoPrune, um método de poda de tokens visuais em estágios iniciais que otimiza a eficiência de modelos multimodais grandes (MLLMs) ao reduzir o custo computacional durante a codificação visual, alcançando um aumento de duas vezes na velocidade de inferência com degradação mínima de desempenho.

Yuhao Chen, Bin Shan, Xin Ye + 1 more2026-03-05🤖 cs.AI

Mathematicians in the age of AI

Este ensaio convida os matemáticos a acompanharem o avanço da inteligência artificial, a refletirem sobre como ela transformará a prática matemática e a responderem adequadamente aos desafios e oportunidades que surgem com a capacidade da IA de provar teoremas de nível de pesquisa.

Jeremy Avigad2026-03-05🤖 cs.AI

AI4S-SDS: A Neuro-Symbolic Solvent Design System via Sparse MCTS and Differentiable Physics Alignment

O artigo apresenta o AI4S-SDS, um sistema neuro-simbólico de design de solventes que integra colaboração multiagente, busca em árvore Monte Carlo (MCTS) esparsa e um motor de física diferenciável para superar limitações de modelos de linguagem na exploração de espaços químicos complexos, resultando na descoberta de formulações inovadoras e fisicamente viáveis.

Jiangyu Chen2026-03-05🤖 cs.AI

Error as Signal: Stiffness-Aware Diffusion Sampling via Embedded Runge-Kutta Guidance

O artigo propõe o ERK-Guid, um método de amostragem para modelos de difusão que utiliza erros de solução de ODE em regiões rígidas como sinal de orientação para estabilizar a geração e superar os métodos atuais.

Inho Kong, Sojin Lee, Youngjoon Hong + 1 more2026-03-05🤖 cs.AI

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Este trabalho estabelece limites de erro de amostragem finita para modelos de difusão baseados em pontuação, demonstrando que eles se adaptam à estrutura intrínseca de baixa dimensão dos dados e superam a maldição da dimensionalidade, com taxas de convergência que dependem da dimensão de Wasserstein $(p,q)$ da distribuição em vez da dimensão ambiente.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

UrbanHuRo: A Two-Layer Human-Robot Collaboration Framework for the Joint Optimization of Heterogeneous Urban Services

O artigo propõe o UrbanHuRo, um framework de colaboração humano-robô em duas camadas que otimiza conjuntamente serviços urbanos heterogêneos, como entregas e sensoriamento, demonstrando através de dados reais aumentos significativos na cobertura de sensoriamento e na renda dos entregadores.

Tonmoy Dey, Lin Jiang, Zheng Dong + 1 more2026-03-05🤖 cs.AI

Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning

O artigo apresenta o CoCo-TAMP, um framework hierárquico que utiliza o raciocínio de senso comum de Grandes Modelos de Linguagem (LLMs) para estimar estados em ambientes parcialmente observáveis, permitindo que robôs identifiquem objetos relevantes e reduzam significativamente o tempo de planejamento e execução em tarefas de longo prazo.

Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín + 3 more2026-03-05🤖 cs.AI

MPFlow: Multi-modal Posterior-Guided Flow Matching for Zero-Shot MRI Reconstruction

O artigo apresenta o MPFlow, um framework de reconstrução de ressonância magnética (MRI) zero-shot baseado em fluxo retificado que utiliza um pré-treinamento auto-supervisionado multi-modal (PAMRI) para guiar a geração com dados auxiliares, resultando em uma reconstrução mais eficiente e fiel à anatomia com redução significativa de alucinações tumorais.

Seunghoi Kim, Chen Jin, Henry F. J. Tregidgo + 2 more2026-03-05🤖 cs.AI

Order Is Not Layout: Order-to-Space Bias in Image Generation

Este artigo identifica e quantifica o viés "Ordem-Espaço" (OTS) em modelos de geração de imagens, demonstrando que a ordem de menção das entidades no texto influencia indevidamente o layout espacial, e propõe estratégias de intervenção que mitigam esse problema sem comprometer a qualidade da geração.

Yongkang Zhang, Zonglin Zhao, Yuechen Zhang + 3 more2026-03-05🤖 cs.AI

Why Do Unlearnable Examples Work: A Novel Perspective of Mutual Information

Este artigo propõe uma nova perspectiva teórica baseada na redução da informação mútua para criar exemplos não aprendíveis, introduzindo o método MI-UE que maximiza a similaridade cosseno entre características intra-classe para impedir eficazmente a generalização de modelos não autorizados.

Yifan Zhu, Yibo Miao, Yinpeng Dong + 1 more2026-03-05🤖 cs.AI

Understanding Parents' Desires in Moderating Children's Interactions with GenAI Chatbots through LLM-Generated Probes

Este estudo investiga as preferências dos pais para moderar as interações de crianças com chatbots de IA generativa, utilizando cenários sintéticos validados para revelar a necessidade de controles parentais mais transparentes, granulares e adaptáveis às idades das crianças e às estratégias familiares.

John Driscoll, Yulin Chen, Viki Shi + 3 more2026-03-05🤖 cs.AI

PROSPECT: Unified Streaming Vision-Language Navigation via Semantic--Spatial Fusion and Latent Predictive Representation

O artigo apresenta o PROSPECT, um agente de navegação unificado e em streaming que combina compreensão semântica com representação latente preditiva para alcançar desempenho superior e robustez em tarefas de navegação visão-linguagem de longo horizonte.

Zehua Fan, Wenqi Lyu, Wenxuan Song + 12 more2026-03-05🤖 cs.AI

HALyPO: Heterogeneous-Agent Lyapunov Policy Optimization for Human-Robot Collaboration

O artigo propõe o HALyPO, um método de otimização de política que utiliza certificação de estabilidade de Lyapunov no espaço de parâmetros para corrigir gradientes descentralizados e estabilizar o aprendizado em colaborações humano-robô, superando a lacuna de racionalidade inerente à heterogeneidade entre agentes.

Hao Zhang, Yaru Niu, Yikai Wang + 2 more2026-03-05🤖 cs.AI

RAGNav: A Retrieval-Augmented Topological Reasoning Framework for Multi-Goal Visual-Language Navigation

O artigo apresenta o RAGNav, um framework de navegação visual-linguística multi-objetivo que supera as limitações de raciocínio espacial e planejamento de métodos genéricos ao integrar mapas topológicos e florestas semânticas em uma memória de dupla base, alcançando desempenho state-of-the-art através de recuperação guiada por âncoras e propagação de scores de vizinhança.

Ling Luo, Qiangian Bai2026-03-05🤖 cs.AI

JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

O artigo apresenta o JANUS, um novo framework que unifica a geração de dados sintéticos de alta fidelidade, o controle rigoroso de restrições lógicas complexas e a estimativa eficiente de incerteza, superando as limitações dos modelos atuais ao utilizar uma estrutura de árvores de decisão bayesianas com um algoritmo de preenchimento reverso que garante 100% de satisfação das restrições sem necessidade de rejeição.

Taha Racicot2026-03-05🤖 cs.AI

Interaction-Aware Whole-Body Control for Compliant Object Transport

Este artigo apresenta um controle corporal completo orientado à interação (IO-WBC), inspirado no cerebelo, que combina um gerador de referência otimizado com uma política de aprendizado por reforço para permitir que humanoides assistivos realizem o transporte cooperativo de objetos de forma estável e complacente em ambientes desestruturados, mantendo o equilíbrio mesmo sob forças de interação fortes e variáveis.

Hao Zhang, Yves Tseng, Ding Zhao + 1 more2026-03-05🤖 cs.AI

Confidence-Calibrated Small-Large Language Model Collaboration for Cost-Efficient Reasoning

O artigo apresenta o COREA, um sistema que otimiza o custo e a precisão em tarefas de raciocínio complexo ao encadear um modelo de linguagem pequeno (SLM) com um grande (LLM), utilizando um algoritmo de aprendizado por reforço para calibrar a confiança do SLM e direcionar apenas as questões mais difíceis para o modelo maior, reduzindo significativamente os custos com uma perda mínima de desempenho.

Chuang Zhang, Zizhen Zhu, Yihao Wei + 5 more2026-03-05🤖 cs.AI

Agentic Peer-to-Peer Networks: From Content Distribution to Capability and Action Sharing

Este artigo propõe uma arquitetura de referência baseada em planos e um espectro de verificação em camadas para viabilizar redes ponto a ponto agênticas, permitindo a troca segura e eficiente de capacidades e ações entre agentes autônomos locais, superando os desafios de descoberta e adversários inerentes a esse novo paradigma de colaboração.

Taotao Wang, Lizhao You, Jingwen Tong + 2 more2026-03-05🤖 cs.AI

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Este artigo propõe e analisa o framework de aprendizado alternado $\texttt{ALTERNATING-MARL}$ , que permite a um agente global e a uma população massiva de agentes locais em sistemas com restrições de comunicação convergirem para um Equilíbrio de Nash aproximado com complexidade de amostra reduzida, validando a eficácia da abordagem em simulações de controle multi-robô e otimização federada.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

AgentSelect: Benchmark for Narrative Query-to-Agent Recommendation

O artigo apresenta o AgentSelect, um benchmark unificado que transforma a seleção de agentes LLM em uma tarefa de recomendação baseada em consultas narrativas, fornecendo um grande conjunto de dados e uma infraestrutura de avaliação para superar a fragmentação atual e permitir a descoberta de configurações de agentes personalizadas e eficazes.

Yunxiao Shi, Wujiang Xu, Tingwei Chen + 7 more2026-03-05🤖 cs.AI

← Anterior Próximo →