cs.AI artigos | Gist.Science

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

O artigo apresenta o EXPLORE-Bench, um novo benchmark derivado de vídeos em primeira pessoa para avaliar a capacidade de modelos de linguagem multimodal em prever cenas finais após sequências longas de ações, revelando uma lacuna significativa em relação ao desempenho humano e demonstrando que a decomposição passo a passo das ações pode melhorar o raciocínio a longo prazo, embora com custos computacionais adicionais.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha2026-03-11🤖 cs.AI

Ego: Embedding-Guided Personalization of Vision-Language Models

O artigo "Ego" propõe um método eficiente de personalização para modelos de linguagem visual que, ao extrair tokens visuais representativos de conceitos específicos por meio dos mecanismos de atenção internos, permite que o modelo reconheça e descreva esses conceitos em novas imagens sem a necessidade de treinamento adicional ou pipelines complexos.

Soroush Seifi, Simon Gardier, Vaggelis Dorovatas, Daniel Olmeda Reino, Rahaf Aljundi2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

O artigo apresenta o World2Mind, um kit de ferramentas de inteligência espacial sem treinamento que, ao construir mapas cognitivos estruturados e uma Árvore Espacial Alocêntrica (AST) a partir de reconstrução 3D e segmentação, permite que modelos de fundação realizem raciocínio espacial robusto e generalizável, alcançando desempenho superior mesmo em modelos puramente textuais.

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

Este artigo demonstra que a inferência baseada em simulação (SBI) é uma ferramenta viável para estimar parâmetros de modelos de interação de neutrinos, conseguindo refinar as configurações do gerador GENIE e aproximar-se de simulações alternativas como o NuWro, superando ligeiramente os ajustes empíricos anteriores ao utilizar dados experimentais do MicroBooNE.

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe Cerati2026-03-11⚛️ hep-ph

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

O artigo formaliza o conceito de "profundidade serial opaca" para quantificar a capacidade de raciocínio interno não externalizado em modelos de linguagem, demonstrando que a arquitetura Transformer impõe limites teóricos que tornam a Cadeia de Pensamento uma ferramenta essencial para monitorar e entender o raciocínio complexo desses modelos.

Jonah Brown-Cohen, David Lindner, Rohin Shah2026-03-11🤖 cs.AI

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Este artigo propõe e valida um framework híbrido quântico-clássico que combina redes LSTM com Máquinas de Nascimento de Circuitos Quânticos (QCBM) para prever a volatilidade financeira, demonstrando superioridade em métricas de erro em comparação com modelos puramente clássicos em dados reais do mercado chinês.

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Este artigo propõe o esquema ACP-SL, que utiliza um módulo de pontuação de importância de canais sensível ao rótulo para realizar a poda adaptativa de canais no aprendizado dividido, reduzindo assim a sobrecarga de comunicação sem comprometer a precisão.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

O artigo apresenta o MITRA, um assistente de IA baseado em RAG e hospedado localmente para colaborações científicas como o CMS, que utiliza um pipeline automatizado de extração de texto e uma arquitetura de banco de dados vetorial em dois níveis para recuperar com precisão informações de documentação interna de física, garantindo a privacidade dos dados.

Abhishikth Mallampalli, Sridhara Dasu2026-03-11🤖 cs.AI

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Este artigo apresenta o "pseudo-projetor", uma modificação leve inspirada no paradigma multigrid que atua como um corretor de representações ocultas para reduzir a sensibilidade ao ruído e melhorar a dinâmica de treinamento e a robustez em modelos baseados em transformers, sem alterar sua arquitetura central.

Vitaly Bulgakov2026-03-11🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Este trabalho apresenta o MA-EgoQA, um novo benchmark e definição de problema para avaliar a compreensão de múltiplos vídeos egocêntricos de agentes corporificados, introduzindo também o modelo EgoMAS como baseline para lidar com a coordenação e memória compartilhada entre agentes.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

O artigo apresenta o SCENEBench, um conjunto de benchmarks para avaliar a compreensão de áudio além da transcrição de fala, focando em cenários de acessibilidade e industriais como a compreensão de sons ambientes, localização de ruído e reconhecimento de características vocais, e revela lacunas críticas no desempenho de modelos de linguagem de áudio de última geração.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Este artigo apresenta o HR-GAT, um modelo de rede de atenção hierárquica baseado em grafos que utiliza dados geoespaciais para prever a demanda de espectro com 21% mais precisão que modelos existentes, superando desafios de autocorrelação espacial em cinco cidades canadenses.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artigo apresenta o framework DAPL, que utiliza modelagem de mundo explícita para aprender representações de dinâmicas induzidas por contato, permitindo que a destreza extrínseca em cenas desordenadas surja naturalmente sem heurísticas manuais e superando métodos existentes tanto em simulação quanto em aplicações do mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

O artigo propõe o "Local Classifier Alignment" (LCA), uma nova função de perda que alinha classificadores específicos de tarefas com um backbone adaptado em aprendizado contínuo, mitigando o esquecimento catastrófico e alcançando desempenho superior ao estado da arte em diversos benchmarks.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Este artigo propõe um framework leve que parametriza prompts como ações para influenciar o comportamento de diálogos em sistemas multiagentes baseados em LLMs sem necessidade de treinamento, demonstrando sua eficácia em controlar dinâmicas conversacionais e simular interações sociais.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

O artigo propõe o MSSR, um framework de replay adaptativo que estima a força de memória em nível de amostra e agenda a reutilização de dados em intervalos dinâmicos para mitigar o esquecimento catastrófico durante o ajuste contínuo de grandes modelos de linguagem, superando os métodos existentes em eficiência e desempenho.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

O artigo apresenta o MedMASLab, um framework unificado e plataforma de benchmarking para sistemas de agentes médicos multimodais que estabelece um protocolo de comunicação padronizado, um avaliador de raciocínio clínico automatizado e o maior conjunto de testes até a data, revelando lacunas críticas de desempenho na transição entre subdomínios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Este artigo apresenta uma abordagem baseada em inteligência artificial e aprendizado de máquina que utiliza dados de licenças e crowdsourcing para estimar com precisão a demanda por espectro, auxiliando reguladores no planejamento dinâmico e na alocação eficiente de recursos em cinco cidades canadenses.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

O artigo apresenta o ACADiff, um framework baseado em difusão latente que utiliza dados clínicos e metadados para sintetizar modalidades de imagem cerebral ausentes e realizar a imputação de dados multimodais, demonstrando desempenho superior na geração de imagens e na manutenção da precisão diagnóstica para a doença de Alzheimer mesmo em cenários com até 80% de dados faltantes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Este artigo apresenta uma metodologia baseada em dados e aprendizado de máquina para estimar e identificar os principais fatores da variação da demanda por espectro em regiões urbanas, demonstrando sua eficácia em um estudo de caso no Canadá para orientar políticas de acesso flexível ao espectro nas redes 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

← Anterior Próximo →