cs.AI artigos | Gist.Science

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

O artigo formaliza o conceito de "profundidade serial opaca" para quantificar a capacidade de raciocínio interno não externalizado em modelos de linguagem, demonstrando que a arquitetura Transformer impõe limites teóricos que tornam a Cadeia de Pensamento uma ferramenta essencial para monitorar e entender o raciocínio complexo desses modelos.

Jonah Brown-Cohen, David Lindner, Rohin Shah2026-03-11🤖 cs.AI

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Este artigo propõe e valida um framework híbrido quântico-clássico que combina redes LSTM com Máquinas de Nascimento de Circuitos Quânticos (QCBM) para prever a volatilidade financeira, demonstrando superioridade em métricas de erro em comparação com modelos puramente clássicos em dados reais do mercado chinês.

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Este artigo propõe o esquema ACP-SL, que utiliza um módulo de pontuação de importância de canais sensível ao rótulo para realizar a poda adaptativa de canais no aprendizado dividido, reduzindo assim a sobrecarga de comunicação sem comprometer a precisão.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

O artigo apresenta o MITRA, um assistente de IA baseado em RAG e hospedado localmente para colaborações científicas como o CMS, que utiliza um pipeline automatizado de extração de texto e uma arquitetura de banco de dados vetorial em dois níveis para recuperar com precisão informações de documentação interna de física, garantindo a privacidade dos dados.

Abhishikth Mallampalli, Sridhara Dasu2026-03-11🤖 cs.AI

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Este artigo apresenta o "pseudo-projetor", uma modificação leve inspirada no paradigma multigrid que atua como um corretor de representações ocultas para reduzir a sensibilidade ao ruído e melhorar a dinâmica de treinamento e a robustez em modelos baseados em transformers, sem alterar sua arquitetura central.

Vitaly Bulgakov2026-03-11🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Este trabalho apresenta o MA-EgoQA, um novo benchmark e definição de problema para avaliar a compreensão de múltiplos vídeos egocêntricos de agentes corporificados, introduzindo também o modelo EgoMAS como baseline para lidar com a coordenação e memória compartilhada entre agentes.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

O artigo apresenta o SCENEBench, um conjunto de benchmarks para avaliar a compreensão de áudio além da transcrição de fala, focando em cenários de acessibilidade e industriais como a compreensão de sons ambientes, localização de ruído e reconhecimento de características vocais, e revela lacunas críticas no desempenho de modelos de linguagem de áudio de última geração.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Este artigo apresenta o HR-GAT, um modelo de rede de atenção hierárquica baseado em grafos que utiliza dados geoespaciais para prever a demanda de espectro com 21% mais precisão que modelos existentes, superando desafios de autocorrelação espacial em cinco cidades canadenses.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artigo apresenta o framework DAPL, que utiliza modelagem de mundo explícita para aprender representações de dinâmicas induzidas por contato, permitindo que a destreza extrínseca em cenas desordenadas surja naturalmente sem heurísticas manuais e superando métodos existentes tanto em simulação quanto em aplicações do mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

O artigo propõe o "Local Classifier Alignment" (LCA), uma nova função de perda que alinha classificadores específicos de tarefas com um backbone adaptado em aprendizado contínuo, mitigando o esquecimento catastrófico e alcançando desempenho superior ao estado da arte em diversos benchmarks.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Este artigo propõe um framework leve que parametriza prompts como ações para influenciar o comportamento de diálogos em sistemas multiagentes baseados em LLMs sem necessidade de treinamento, demonstrando sua eficácia em controlar dinâmicas conversacionais e simular interações sociais.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

O artigo propõe o MSSR, um framework de replay adaptativo que estima a força de memória em nível de amostra e agenda a reutilização de dados em intervalos dinâmicos para mitigar o esquecimento catastrófico durante o ajuste contínuo de grandes modelos de linguagem, superando os métodos existentes em eficiência e desempenho.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

O artigo apresenta o MedMASLab, um framework unificado e plataforma de benchmarking para sistemas de agentes médicos multimodais que estabelece um protocolo de comunicação padronizado, um avaliador de raciocínio clínico automatizado e o maior conjunto de testes até a data, revelando lacunas críticas de desempenho na transição entre subdomínios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Este artigo apresenta uma abordagem baseada em inteligência artificial e aprendizado de máquina que utiliza dados de licenças e crowdsourcing para estimar com precisão a demanda por espectro, auxiliando reguladores no planejamento dinâmico e na alocação eficiente de recursos em cinco cidades canadenses.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

O artigo apresenta o ACADiff, um framework baseado em difusão latente que utiliza dados clínicos e metadados para sintetizar modalidades de imagem cerebral ausentes e realizar a imputação de dados multimodais, demonstrando desempenho superior na geração de imagens e na manutenção da precisão diagnóstica para a doença de Alzheimer mesmo em cenários com até 80% de dados faltantes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Este artigo apresenta uma metodologia baseada em dados e aprendizado de máquina para estimar e identificar os principais fatores da variação da demanda por espectro em regiões urbanas, demonstrando sua eficácia em um estudo de caso no Canadá para orientar políticas de acesso flexível ao espectro nas redes 6G.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

O artigo apresenta o PathMem, um framework multimodal centrado na memória que, inspirado no processo cognitivo de patologistas humanos, organiza o conhecimento estruturado em memória de longo prazo e utiliza um Transformer de Memória para integrá-lo dinamicamente à memória de trabalho, resultando em desempenho superior na geração de laudos e diagnósticos abertos em patologia computacional.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

O artigo apresenta o k-MTR, um framework de aprendizado de representação no espaço k que elimina a necessidade de reconstrução de imagens ao alinhar dados subamostrados diretamente com rótulos fisiológicos, permitindo uma análise cardíaca multi-tarefa precisa e eficiente sem passar pelo passo intermediário de formação de imagem.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artigo estabelece que a abstenção baseada em confiança em sistemas de decisão ranqueada só melhora consistentemente a qualidade quando as condições de alinhamento de rank e ausência de zonas de inversão são atendidas, demonstrando empiricamente que a incerteza estrutural favorece esse ganho, enquanto a incerteza contextual (como deriva de distribuição) frequentemente viola a monotonicidade e exige sinais de confiança específicos para mitigar falhas.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artigo apresenta o Indicador de Superajuste-Subajuste (OUI) como um sinal estrutural precoce e eficiente para identificar taxas de aprendizado ideais em algoritmos PPO, demonstrando que a análise das ativações neuronais permite descartar execuções promissoras muito antes do término do treinamento com maior precisão do que métricas tradicionais.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

← Anterior Próximo →