Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm

O artigo propõe o paradigma CSV (Clustering-Sampling-Voting), um novo framework que reduz a complexidade das invocações de modelos de linguagem grandes (LLMs) para sublinear ao agrupar tuplas semanticamente, amostrar um subconjunto para avaliação e inferir rótulos via estratégias de votação, alcançando uma redução de 1,28 a 355 vezes no número de chamadas ao LLM em comparação com abordagens atuais, sem comprometer a precisão e a pontuação F1.

Nan Hou, Kangfei Zhao, Jiadong Xie + 1 more2026-03-06💻 cs

Attention's Gravitational Field:A Power-Law Interpretation of Positional Correlation

Este artigo propõe o conceito de Campo Gravitacional de Atenção (AGF) para decodificar e otimizar os mecanismos de posicionamento em Modelos de Linguagem de Grande Escala (LLMs), demonstrando que essa abordagem, alinhada à Lei da Gravitação Universal de Newton, supera os métodos de codificação atuais e oferece novas perspectivas para a interpretabilidade e otimização de modelos.

Edward Zhang2026-03-06💻 cs

Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

O artigo apresenta o Meta-D, uma arquitetura que utiliza metadados categóricos de exames de ressonância magnética para orientar a extração de características, melhorando significativamente a detecção de tumores cerebrais e a segmentação em cenários com modalidades ausentes ao estabilizar representações e reduzir parâmetros do modelo.

SangHyuk Kim, Daniel Haehn, Sumientra Rampersad2026-03-06💻 cs

EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

O artigo apresenta o EchoGuard, um framework de IA agênica que utiliza um Grafo de Conhecimento como memória episódica e semântica para analisar diálogos longitudinais, detectar padrões de comunicação manipuladora e orientar os usuários por meio de prompts socráticos que promovem a autodescoberta.

Ratna Kandala, Niva Manchanda, Akshata Kishore Moharir + 1 more2026-03-06🤖 cs.AI

LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks

Este artigo apresenta o AIS-TGNN, um framework que combina Redes de Atenção Gráfica Temporais com um módulo de raciocínio de LLM estruturado para prever congestionamentos portuários e gerar explicações em linguagem natural baseadas em evidências, alcançando alta precisão preditiva e consistência direcional de 99,6% em dados do Porto de Los Angeles e Long Beach.

Zhiming Xue, Yujue Wang2026-03-06🤖 cs.AI

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artigo investiga as capacidades de generalização de modelos fundacionais corporativos para assistência corretiva em conjunto aberto, demonstrando através de dados sintéticos no Overcooked que o desempenho ideal requer conjuntos de dados diversificados que abranjam fundamentação multimodal, inferência de defeitos e exposição a cenários variados.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

O artigo apresenta o SCoUT, um método de aprendizado por reforço multiagente que melhora a coordenação em ambientes parcialmente observados ao agrupar agentes temporalmente e utilizar vantagens contrafactuais para aprender de forma escalável e precisa quando e com quem comunicar, mantendo a execução descentralizada.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models

Este artigo apresenta o benchmark DBC, um novo quadro de governança em tempo de inferência para modelos de linguagem grandes que, ao ser aplicado, reduz significativamente a taxa de exposição a riscos em comparação com métodos tradicionais, oferecendo uma camada de controle auditável e adaptável a diferentes jurisdições.

G. Madan Mohan, Veena Kiran Nambiar, Kiranmayee Janardhan2026-03-06🤖 cs.AI

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artigo apresenta a primeira aquisição simultânea de vídeo de ressonância magnética em tempo real, EEG e EMG de superfície para capturar movimentos articulares, atividade muscular e sinais cerebrais durante a produção da fala, introduzindo um pipeline de supressão de artefatos para superar os desafios técnicos dessa abordagem multimodal.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation

O K-Gen é um framework multimodal interpretável que utiliza Grandes Modelos de Linguagem Multimodais para gerar trajetórias realistas e diversas em simulações de direção autônoma, combinando mapas em visão de pássaro rasterizados com descrições textuais para produzir pontos-chave explicativos que são posteriormente refinados em trajetórias precisas.

Mingxuan Mu, Guo Yang, Lei Chen + 2 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudo apresenta um modelo interpretável que alcança 80,4% de precisão na antecipação de oito tipos de arremessos de beisebol a partir de sequências de pose 3D em broadcast, revelando que a mecânica do tronco e do pulso são os principais preditores e estabelecendo um limite empírico de aproximadamente 80% para a distinção de variantes baseadas apenas no movimento corporal.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI