cs.AI artigos | Gist.Science

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Este artigo propõe uma abordagem de assincronia periódica que desacopla a inferência do treinamento em um pipeline produtor-consumidor, alcançando um aumento de 3 a 5 vezes no throughput de RL on-policy para LLMs sem comprometer a precisão ou introduzir viés off-policy.

Jian Lu2026-03-11🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

O artigo apresenta o UPA-RFAS, um quadro unificado que gera um ataque de patch adversarial universal e transferível para modelos Visão-Linguagem-Ação (VLA), capaz de comprometer robôs em cenários de caixa preta, diferentes arquiteturas e transições simulação-realidade ao manipular representações de recursos, atenção e semântica.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong Jiang2026-03-11🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Este artigo propõe um novo quadro de aprendizado por reforço multiagente que utiliza um prior generalizado de comunicação com restrições e um estimador de informação mútua dual para distinguir e quantificar o impacto de mensagens com e sem perdas na tomada de decisão distribuída, demonstrando eficácia em benchmarks com limitações de comunicação.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao2026-03-11🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

O artigo propõe o ELERAG, uma arquitetura aprimorada de Geração Aumentada por Recuperação (RAG) que integra a Vinculação de Entidades para melhorar a precisão factual em sistemas de perguntas e respostas educacionais em italiano, demonstrando que estratégias híbridas adaptadas ao domínio superam abordagens padrão em contextos especializados.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

O artigo apresenta o EMFusion, um framework de previsão probabilística baseado em difusão condicional que utiliza uma arquitetura U-Net residual com atenção cruzada para realizar previsões multivariadas e seletivas em frequência de campos eletromagnéticos em redes sem fio, superando os modelos existentes ao fornecer estimativas de incerteza calibradas e lidar com medições irregulares.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Este artigo demonstra que um modelo de linguagem pequeno (SLM) de 350 milhões de parâmetros, como o OPT-350M, pode superar modelos grandes e complexos na execução de chamadas de ferramentas após um ajuste fino direcionado, alcançando uma taxa de sucesso de 77,55% no ToolBench e oferecendo uma solução mais eficiente em termos de custos para a adoção de IA generativa em escala empresarial.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

O artigo apresenta o SAGE, um novo framework de Aprendizado por Reforço que utiliza um processo de "Rolloout Sequencial" e recompensas integradas a habilidades para permitir que agentes baseados em Grandes Modelos de Linguagem aprendam e acumulem automaticamente um banco de habilidades, resultando em maior precisão e eficiência em tarefas complexas.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

O artigo apresenta o MCGI, um método de indexação de grafos geométrico e residente em disco que utiliza a Dimensão Intrínseca Local (LID) para adaptar dinamicamente as estratégias de busca à geometria dos dados, superando significativamente os métodos existentes em termos de throughput e latência em buscas de vizinhos mais próximos aproximados em escala bilionária.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

O artigo apresenta o CRANE, um novo framework que identifica neurônios específicos de idiomas em modelos de linguagem multilíngues através de intervenções direcionadas e análise de relevância funcional, superando os métodos baseados apenas em magnitude de ativação ao demonstrar que a especialização linguística é seletiva, mas não exclusiva.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

O artigo apresenta a Modelagem Generativa Bayesiana (BGM), uma estrutura unificada baseada em aprendizado de máquina que permite inferência condicional arbitrária com quantificação de incerteza rigorosa, superando as limitações de métodos existentes ao aprender um modelo generativo único que não requer retreinamento para diferentes condições.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Este trabalho apresenta o SpaceHMchat, um framework de colaboração Humano-IA de código aberto que implementa o princípio de alinhamento de capacidades subjacentes para gerenciar a saúde de sistemas de energia de satélites em megaconstelações, validado experimentalmente com um dataset inédito e demonstrando alta precisão em reconhecimento de condições, detecção de anomalias, localização de falhas e tomada de decisão de manutenção.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

O artigo apresenta o CLEAR-Mamba, um framework aprimorado baseado em MedMamba que utiliza uma camada de condicionamento adaptativo (HaC) e um esquema de previsão consciente da confiabilidade (RaP) para superar as limitações de generalização e confiabilidade na classificação de angiografias oftalmológicas multimodais (FFA e ICGA), demonstrando desempenho superior em um novo conjunto de dados de grande escala.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Este artigo apresenta um sistema automatizado baseado em agentes de pesquisa web com LLMs que gera e resolve em escala milhares de perguntas de previsão diversificadas e verificáveis, superando plataformas humanas em qualidade e demonstrando como essa abordagem pode melhorar o desempenho de modelos de IA na previsão de eventos.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Este artigo apresenta o EigenData, um quadro unificado que combina um agente de dados auto-evolutivo para síntese de diálogos com ferramentas e verificação, com um treinamento por reforço baseado em verificador, permitindo o desenvolvimento escalável de agentes interativos de uso de ferramentas que superam ou igualam modelos de ponta sem necessidade de anotação humana cara.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

Multi-head automated segmentation by incorporating detection head into the contextual layer neural network

Este artigo propõe uma arquitetura Transformer de múltiplas cabeças com um mecanismo de "gate" baseado em detecção que integra contexto inter-corte para suprimir falsos positivos e melhorar a plausibilidade anatômica na segmentação automática de radioterapia, demonstrando superioridade significativa sobre modelos convencionais ao eliminar previsões alucinadas em cortes sem estruturas-alvo.

Edwin Kys, Febian Febian2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

O artigo propõe o UAT-LITE, um framework de inferência que torna a atenção em transformers pré-treinados ciente da incerteza epistêmica por meio de dropout de Monte Carlo, permitindo a modulação da atenção e o diagnóstico de incerteza em nível de token sem alterar os pesos do modelo, resultando em melhor calibração e seleção preditiva sob mudanças de distribuição.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

O artigo apresenta o WebAccessVL, um modelo de linguagem e visão que corrige automaticamente violações de acessibilidade em sites (WCAG2) preservando o design original, alcançando uma redução de 96% nas violações e superando o desempenho do GPT-5 através de uma estratégia iterativa de refinamento guiada por detectores de erros.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

O artigo argumenta que a confiança em chatbots é frequentemente moldada por vieses cognitivos e escolhas de design que os posicionam como "vendedores habilidosos", em vez de refletir uma verdadeira confiabilidade normativa, exigindo uma distinção clara entre a formação psicológica da confiança e a confiabilidade real para ajudar os usuários a calibrar adequadamente sua interação com essas IAs.

Aditya Gulati, Nuria Oliver2026-03-11🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

O artigo apresenta o RoSE, um novo método que reformula a estimativa de normais monoculares como uma tarefa de estimativa de sequências de sombreamento utilizando modelos generativos de imagem para vídeo, superando as limitações de alinhamento 3D dos métodos existentes e alcançando desempenho de última geração em benchmarks reais.

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song Bai2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

O artigo apresenta o Infusion, um framework que utiliza aproximações escaláveis de funções de influência para realizar pequenas perturbações em documentos de treinamento, permitindo moldar sistematicamente o comportamento de modelos de visão e linguagem de forma sutil e eficaz.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

← Anterior Próximo →