cs.AI artigos | Gist.Science

Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling

O artigo apresenta o Timer-S1, um modelo fundamental de séries temporais de escala bilionária baseado em Mixture-of-Experts que supera limitações de escalabilidade através de um paradigma de "Serial Scaling" em arquitetura, dados e pipeline de treinamento, alcançando desempenho state-of-the-art em previsões de longo prazo.

Yong Liu, Xingjian Su, Shiyu Wang + 7 more2026-03-06💻 cs

LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation

O artigo apresenta o framework LAW & ORDER, que utiliza adaptadores espaciais para melhorar a geração de imagens médicas e a segmentação ao corrigir desequilíbrios espaciais, resultando em ganhos significativos de qualidade sintética e precisão de segmentação com custo computacional reduzido.

Anugunj Naman, Ayushman Singh, Gaibo Zhang + 1 more2026-03-06💻 cs

Comparative Evaluation of Traditional Methods and Deep Learning for Brain Glioma Imaging. Review Paper

Esta revisão compara métodos tradicionais e de aprendizado profundo para segmentação e classificação de gliomas cerebrais em imagens de ressonância magnética, concluindo que as arquiteturas de redes neurais convolucionais superam as técnicas convencionais.

Kiranmayee Janardhan, Vinay Martin DSa Prabhu, T. Christy Bobby2026-03-06💻 cs

Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm

O artigo propõe o paradigma CSV (Clustering-Sampling-Voting), um novo framework que reduz a complexidade das invocações de modelos de linguagem grandes (LLMs) para sublinear ao agrupar tuplas semanticamente, amostrar um subconjunto para avaliação e inferir rótulos via estratégias de votação, alcançando uma redução de 1,28 a 355 vezes no número de chamadas ao LLM em comparação com abordagens atuais, sem comprometer a precisão e a pontuação F1.

Nan Hou, Kangfei Zhao, Jiadong Xie + 1 more2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Este artigo propõe o método DCR (Diffusion Contrastive Reconstruction), que integra sinais contrastivos derivados das imagens reconstruídas em vez das originais no processo de difusão para superar as limitações do CLIP, equilibrando simultaneamente a capacidade discriminativa e a percepção de detalhes na representação visual.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

Attention's Gravitational Field:A Power-Law Interpretation of Positional Correlation

Este artigo propõe o conceito de Campo Gravitacional de Atenção (AGF) para decodificar e otimizar os mecanismos de posicionamento em Modelos de Linguagem de Grande Escala (LLMs), demonstrando que essa abordagem, alinhada à Lei da Gravitação Universal de Newton, supera os métodos de codificação atuais e oferece novas perspectivas para a interpretabilidade e otimização de modelos.

Edward Zhang2026-03-06💻 cs

Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

O artigo apresenta o Meta-D, uma arquitetura que utiliza metadados categóricos de exames de ressonância magnética para orientar a extração de características, melhorando significativamente a detecção de tumores cerebrais e a segmentação em cenários com modalidades ausentes ao estabilizar representações e reduzir parâmetros do modelo.

SangHyuk Kim, Daniel Haehn, Sumientra Rampersad2026-03-06💻 cs

EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

O artigo apresenta o EchoGuard, um framework de IA agênica que utiliza um Grafo de Conhecimento como memória episódica e semântica para analisar diálogos longitudinais, detectar padrões de comunicação manipuladora e orientar os usuários por meio de prompts socráticos que promovem a autodescoberta.

Ratna Kandala, Niva Manchanda, Akshata Kishore Moharir + 1 more2026-03-06🤖 cs.AI

LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks

Este artigo apresenta o AIS-TGNN, um framework que combina Redes de Atenção Gráfica Temporais com um módulo de raciocínio de LLM estruturado para prever congestionamentos portuários e gerar explicações em linguagem natural baseadas em evidências, alcançando alta precisão preditiva e consistência direcional de 99,6% em dados do Porto de Los Angeles e Long Beach.

Zhiming Xue, Yujue Wang2026-03-06🤖 cs.AI

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artigo investiga as capacidades de generalização de modelos fundacionais corporativos para assistência corretiva em conjunto aberto, demonstrando através de dados sintéticos no Overcooked que o desempenho ideal requer conjuntos de dados diversificados que abranjam fundamentação multimodal, inferência de defeitos e exposição a cenários variados.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

VISA: Value Injection via Shielded Adaptation for Personalized LLM Alignment

O artigo propõe o VISA, um novo framework que utiliza adaptação protegida e otimização de política para injetar valores humanos precisos em Grandes Modelos de Linguagem sem comprometer sua consistência factual ou capacidades gerais, superando assim as limitações dos métodos de ajuste fino tradicionais.

Jiawei Chen, Tianzhuo Yang, Guoxi Zhang + 3 more2026-03-06🤖 cs.AI

Multilevel Training for Kolmogorov Arnold Networks

Este artigo propõe um método de treinamento multiescala para Redes de Kolmogorov-Arnold (KANs) que explora sua estrutura de base de splines para criar uma hierarquia de modelos aninhados, resultando em aceleração significativa no treinamento e em ganhos substanciais de precisão, especialmente em redes neurais informadas por física.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

O artigo apresenta o SCoUT, um método de aprendizado por reforço multiagente que melhora a coordenação em ambientes parcialmente observados ao agrupar agentes temporalmente e utilizar vantagens contrafactuais para aprender de forma escalável e precisa quando e com quem comunicar, mantendo a execução descentralizada.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models

Este artigo apresenta o benchmark DBC, um novo quadro de governança em tempo de inferência para modelos de linguagem grandes que, ao ser aplicado, reduz significativamente a taxa de exposição a riscos em comparação com métodos tradicionais, oferecendo uma camada de controle auditável e adaptável a diferentes jurisdições.

G. Madan Mohan, Veena Kiran Nambiar, Kiranmayee Janardhan2026-03-06🤖 cs.AI

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artigo apresenta a primeira aquisição simultânea de vídeo de ressonância magnética em tempo real, EEG e EMG de superfície para capturar movimentos articulares, atividade muscular e sinais cerebrais durante a produção da fala, introduzindo um pipeline de supressão de artefatos para superar os desafios técnicos dessa abordagem multimodal.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

On Multi-Step Theorem Prediction via Non-Parametric Structural Priors

Este trabalho propõe o uso de Grafos de Precedência de Teoremas e restrições topológicas explícitas para superar o problema de "Deriva Estrutural" na previsão de teoremas via aprendizado in-context, alcançando desempenho competitivo com modelos supervisionados sem necessidade de otimização baseada em gradientes.

Junbo Zhao, Ting Zhang, Can Li + 3 more2026-03-06🤖 cs.AI

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

O artigo apresenta o ReCouPLe, um framework leve que utiliza raciocínios em linguagem natural para fornecer sinais causais e aprender recompensas robustas a partir de feedback de preferência, permitindo a transferência de conhecimento para novas tarefas e melhorando significativamente a precisão e o desempenho sob mudanças de distribuição.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation

O K-Gen é um framework multimodal interpretável que utiliza Grandes Modelos de Linguagem Multimodais para gerar trajetórias realistas e diversas em simulações de direção autônoma, combinando mapas em visão de pássaro rasterizados com descrições textuais para produzir pontos-chave explicativos que são posteriormente refinados em trajetórias precisas.

Mingxuan Mu, Guo Yang, Lei Chen + 2 more2026-03-06🤖 cs.AI

SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms

O artigo propõe o SEA-TS, um agente autoevolutivo que gera autonomamente algoritmos de previsão de séries temporais através de um ciclo iterativo de busca e refinamento, superando métodos state-of-the-art e descobrindo novos padrões arquitetônicos inovadores.

Longkun Xu, Xiaochun Zhang, Qiantu Tuo + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudo apresenta um modelo interpretável que alcança 80,4% de precisão na antecipação de oito tipos de arremessos de beisebol a partir de sequências de pose 3D em broadcast, revelando que a mecânica do tronco e do pulso são os principais preditores e estabelecendo um limite empírico de aproximadamente 80% para a distinção de variantes baseadas apenas no movimento corporal.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

← Anterior Próximo →