cs.AI artigos | Gist.Science

Autoregressive Visual Decoding from EEG Signals

O artigo apresenta o AVDE, um framework leve e eficiente que utiliza aprendizado contrastivo e um modelo autoregressivo de "predição de próxima escala" para decodificar sinais de EEG em imagens, superando os métodos atuais em precisão e reduzindo significativamente o custo computacional.

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

Decomposing Physician Disagreement in HealthBench

O estudo demonstra que a maior parte da discordância entre médicos na avaliação de IA em saúde é estrutural e inerente a casos clínicos limítrofes, embora a redução de incertezas evitáveis, como falta de contexto, possa oferecer melhorias pontuais no design da avaliação.

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

O artigo apresenta o CeRA, um adaptador paralelo que supera a limitação linear do LoRA em tarefas de raciocínio complexo ao induzir expansão de variedades via portas SiLU e dropout estrutural, permitindo alcançar desempenho superior com ranks significativamente menores.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

On Sample-Efficient Generalized Planning via Learned Transition Models

Este trabalho propõe formular o planejamento generalizado como um problema de aprendizado de modelos de transição explícitos, demonstrando que prever estados intermediários em vez de ações diretas resulta em maior generalização fora da distribuição e eficiência amostral com modelos menores do que as abordagens baseadas em Transformers que predizem sequências de ações diretamente.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Este artigo descreve como o uso de um modelo de linguagem grande (LLM) especializado e ajustado para gerar milhões de rótulos de relevância textual permitiu aprimorar o sistema de classificação da App Store, resultando em ganhos simultâneos na relevância comportamental e textual e em um aumento estatisticamente significativo na taxa de conversão, especialmente para consultas de cauda longa.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

O artigo apresenta o Attn-QAT, um método pioneiro de treinamento consciente de quantização (QAT) para atenção em FP4 que, ao corrigir instabilidades de treinamento através de recomputação de baixa precisão e ajustes nos cálculos de gradiente, permite a computação de ponta a ponta em FP4 sem heurísticas de mitigação de outliers, recuperando a qualidade do modelo e oferecendo até 1,5x de aceleração em GPUs RTX 5090.

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

PEPA: a Persistently Autonomous Embodied Agent with Personalities

O artigo apresenta o PEPA, uma arquitetura cognitiva de três camadas que utiliza traços de personalidade para permitir que agentes corporificados gerem objetivos internos e operem de forma autônoma e persistente em ambientes dinâmicos, validado experimentalmente em um robô quadrúpede real.

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

How Well Do Multimodal Models Reason on ECG Signals?

Este trabalho apresenta um quadro reprodutível para avaliar o raciocínio de modelos multimodais em sinais de ECG, decompondo-o em percepção (verificada via geração de código) e dedução (validada contra critérios clínicos estruturados), permitindo uma avaliação escalável e rigorosa da verdadeira capacidade de raciocínio clínico.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Este artigo apresenta um framework de previsão conformal que garante cobertura estatística para a extração de entidades médicas por modelos de linguagem, demonstrando que a calibração depende do domínio clínico e da estrutura do documento, permitindo a implantação segura com taxas de rejeição gerenciáveis.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

Este relatório técnico valida estendida e empiricamente a Espaço de Soluções de Explicabilidade (ESS) através de uma avaliação transversal que, além da previsão de rotatividade de funcionários, incorpora um sistema heterogêneo de alocação de recursos urbanos inteligentes, demonstrando a generalidade e adaptabilidade do framework a diferentes domínios, perfis de risco e configurações de partes interessadas.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Este artigo apresenta um framework híbrido que combina um Modelo de Markov Oculto para inferir estados ocultos de rivais e uma Rede Q Profunda para otimizar a estratégia de energia em corridas de Fórmula 1 de 2026, permitindo a detecção de armadilhas estratégicas como o "counter-harvest" em um ambiente de observabilidade parcial.

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

O artigo apresenta o HarmonyCell, um framework de agente autônomo que resolve as heterogeneidades semântica e estatística em estudos de perturbação de células únicas, unificando metadados via LLM e otimizando arquiteturas de modelos com busca em árvore Monte Carlo para superar deslocamentos de distribuição sem necessidade de engenharia específica por conjunto de dados.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

Este artigo apresenta um novo quadro de aprendizado por reforço profundo assistido por modelos de linguagem (LLM) que mapeia instruções em linguagem natural para regras executáveis e anotações semânticas, melhorando a eficiência de dados, a conformidade com restrições e a transferabilidade entre tarefas em ambientes complexos.

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

Este artigo apresenta um pipeline baseado em detecção que integra um localizador e um segmentador para extrair com precisão e generalidade a forma de onda da área glótica a partir de videoendoscopia de alta velocidade, permitindo a avaliação clínica robusta de biomarcadores funcionais em tempo real.

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

Este artigo propõe um framework robusto que combina a arquitetura híbrida CoAtNet com a técnica de "model soups" para classificar imagens de Patrimônio Cultural Imaterial do Delta do Mekong, alcançando resultados state-of-the-art ao reduzir a variância e melhorar a generalização em cenários com dados limitados.

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory

Este artigo apresenta um framework de diagnóstico que demonstra que, em agentes LLM com memória, a qualidade da recuperação é o fator determinante para o desempenho, superando significativamente o impacto das estratégias de escrita e sugerindo que métodos de armazenamento simples e sem perdas podem ser mais eficazes do que abordagens complexas e custosas.

Boqin Yuan, Yue Su, Kun Yao2026-03-10🤖 cs.AI

Agentified Assessment of Logical Reasoning Agents

Os autores apresentam um framework de avaliação baseado em agentes para testar raciocínio lógico, demonstrando sua eficácia ao benchmarkar um agente de auto-formalização no conjunto de dados FOLIO, onde ele superou uma linha de base de cadeia de pensamento com 86,70% de precisão.

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Este artigo apresenta o GramCol e o IMAP, métodos que localizam espacial e temporalmente conceitos de movimento e objetos em Transformers de Difusão de Vídeo sem necessidade de cálculo de gradiente ou atualização de parâmetros, oferecendo mapas de saliência interpretáveis para tarefas como segmentação semântica zero-shot.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Este artigo estabelece a primeira separação teórica entre o Adam e o SGD, demonstrando que a normalização do segundo momento no Adam permite uma dependência de $\delta^{-1/2}$ no parâmetro de confiança para a convergência de alta probabilidade, superando a dependência de $\delta^{-1}$ inerente ao SGD.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

O artigo apresenta a Decomposição de Sonda Composicional (CPD) para demonstrar que a alinhamento da tarefa de treinamento e a arquitetura equivariante são fatores determinantes que moldam a acessibilidade linear e a disjunção de informações geométricas e composicionais em modelos de base atômica, revelando que modelos treinados em propriedades específicas (como o gap HOMO-LUMO) organizam seus representações de forma mais eficiente do que aqueles treinados apenas em energia.

Joshua Steier2026-03-10🤖 cs.LG

← Anterior Próximo →