cs.AI artigos | Gist.Science

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache

O artigo apresenta o DynaKV, um framework de pós-treinamento inovador que otimiza a compressão de cache KV em modelos de linguagem grandes ao alocar dinamicamente taxas de compressão baseadas no significado semântico de cada token, superando métodos existentes ao reduzir significativamente o uso de memória sem comprometer a qualidade da geração.

Liming Lu, Kaixi Qiu, Jiayu Zhou + 6 more2026-03-06💻 cs

Simulating Meaning, Nevermore! Introducing ICR: A Semiotic-Hermeneutic Metric for Evaluating Meaning in LLM Text Summaries

Este artigo propõe e valida a métrica Inductive Conceptual Rating (ICR), um framework qualitativo que integra semiótica e hermenêutica para avaliar a precisão semântica e a alinhamento de significado em resumos gerados por LLMs, demonstrando que, embora essas modelos apresentem alta similaridade lexical, frequentemente falham em capturar significados contextualmente fundamentados em comparação com a produção humana.

Natalie Perez, Sreyoshi Bhaduri, Aman Chadha2026-03-06💻 cs

Decorrelating the Future: Joint Frequency Domain Learning for Spatio-temporal Forecasting

O artigo propõe a FreST Loss, um objetivo de treinamento aprimorado no domínio da frequência que utiliza a Transformada de Fourier Conjunta para alinhar previsões e dados reais no espectro espaço-temporal, decorrelacionando dependências complexas e melhorando consistentemente o desempenho de modelos de previsão em diversos conjuntos de dados reais.

Zepu Wang, Bowen Liao, Jeff + 1 more2026-03-06💻 cs

Context-Dependent Affordance Computation in Vision-Language Models

Este estudo demonstra que os Modelos Visão-Linguagem exibem uma dependência contextual massiva na computação de affordances, onde tanto o vocabulário quanto o significado semântico variam drasticamente conforme o contexto, sugerindo a necessidade de projeções ontológicas dinâmicas para aplicações em robótica.

Murad Farzulla2026-03-06💻 cs

Do Mixed-Vendor Multi-Agent LLMs Improve Clinical Diagnosis?

O estudo demonstra que sistemas multiagente de LLMs com diversidade de fornecedores superam as configurações homogêneas em diagnósticos clínicos, pois a combinação de modelos distintos pooling vieses indutivos complementares para identificar corretamente diagnósticos que seriam ignorados por equipes de um único fornecedor.

Grace Chang Yuan, Xiaoman Zhang, Sung Eun Kim + 1 more2026-03-06💻 cs

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

O artigo apresenta o FedEMA-Distill, um método de aprendizado federado que combina uma média móvel exponencial do modelo global com destilação de conhecimento baseada em logits, permitindo treinamento robusto e eficiente em termos de comunicação em cenários com dados não-IID e presença de clientes maliciosos, sem exigir alterações no software dos clientes ou transmissão de pesos completos do modelo.

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

Generating Realistic, Protocol-Compliant Maritime Radio Dialogues using Self-Instruct and Low-Rank Adaptation

Este estudo apresenta uma metodologia de Self-Instruct combinada com Low-Rank Adaptation (LoRA) e um pipeline de verificação rigoroso para gerar diálogos de rádio marítima realistas e conformes às normas da OMI, superando a escassez de dados de alta qualidade necessários para o desenvolvimento de sistemas de IA que visam melhorar a segurança operacional no mar.

Gürsel Akdeniz, Emin Cagatay Nakilcioglu2026-03-06💻 cs

Delta-Crosscoder: Robust Crosscoder Model Diffing in Narrow Fine-Tuning Regimes

O artigo apresenta o Delta-Crosscoder, um método robusto que combina esparsidade BatchTopK e uma função de perda baseada em deltas para identificar com precisão e mitigar mudanças comportamentais localizadas em modelos de linguagem após ajustes finos, superando abordagens baseadas em SAEs em diversos cenários de teste.

Aly Kassem, Thomas Jiralerspong, Negar Rostamzadeh + 1 more2026-03-06💻 cs

Thin Keys, Full Values: Reducing KV Cache via Low-Dimensional Attention Selection

O artigo propõe e valida a hipótese de que a seleção de atenção (queries e keys) pode ser realizada em dimensões muito menores do que a transferência de valores, permitindo reduzir o cache KV em 75% com perda mínima de qualidade através de compressão SVD e ajuste fino leve, o que aumenta significativamente a capacidade de usuários simultâneos em modelos de grande escala.

Hengshuai Yao, Guan Wang2026-03-06💻 cs

Agent Memory Below the Prompt: Persistent Q4 KV Cache for Multi-Agent LLM Inference on Edge Devices

Este artigo apresenta um sistema para inferência de LLMs multiagentes em dispositivos de borda que persiste caches KV quantizados em 4 bits no disco, permitindo a restauração direta do estado de atenção e reduzindo drasticamente o tempo de geração inicial enquanto otimiza o uso de memória RAM.

Yakov Pyotr Shkolnikov2026-03-06💻 cs

What Is Missing: Interpretable Ratings for Large Language Model Outputs

O artigo apresenta o sistema de avaliação "What Is Missing" (WIM), que converte feedback textual sobre o que falta em uma resposta de LLM em uma pontuação baseada em similaridade semântica, oferecendo ratings mais discriminativos e interpretáveis para melhorar o aprendizado de preferências em comparação com escalas numéricas tradicionais.

Nicholas Stranges, Yimin Yang2026-03-06💻 cs

Uncertainty-Calibrated Spatiotemporal Field Diffusion with Sparse Supervision

O artigo apresenta o SOLID, um framework de difusão condicionado a máscaras que aprende dinâmicas espaço-temporais exclusivamente a partir de observações esparsas, permitindo a reconstrução de campos físicos completos com incertezas calibradas sem a necessidade de dados densos ou pré-imputação.

Kevin Valencia, Xihaier Luo, Shinjae Yoo + 1 more2026-03-06💻 cs

ZorBA: Zeroth-order Federated Fine-tuning of LLMs with Heterogeneous Block Activation

O artigo propõe o ZorBA, um framework de ajuste fino federado para grandes modelos de linguagem que utiliza otimização de ordem zero e ativação heterogênea de blocos para reduzir significativamente o uso de VRAM e a sobrecarga de comunicação sem comprometer a convergência.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

ASFL: An Adaptive Model Splitting and Resource Allocation Framework for Split Federated Learning

Este artigo propõe o framework ASFL, uma solução adaptativa para Aprendizado Federativo Dividido que otimiza a convergência do modelo e reduz significativamente o atraso e o consumo de energia em redes sem fio através da divisão dinâmica do modelo e da alocação conjunta de recursos, resolvida por um algoritmo de otimização online.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction

O artigo propõe o CogGen, um modelo generativo profundo totalmente não supervisionado que melhora a reconstrução de MRI amostrada compressivamente ao regular a "carga cognitiva" através de um aprendizado curricular auto-orientado que prioriza progressivamente dados de baixa frequência e alta qualidade antes de introduzir frequências mais altas e ruído.

Qingyong Zhu, Yumin Tan, Xiang Gu + 1 more2026-03-06💻 cs

A systematic approach to answering the easy problems of consciousness based on an executable cognitive system

Este estudo apresenta uma abordagem sistemática para resolver os "problemas fáceis" da consciência utilizando um sistema cognitivo executável baseado na teoria kantiana, demonstrando como mecanismos computacionais de aprendizado, controle emocional e manipulação de informações podem explicar capacidades como discriminação, atenção e a diferença entre vigília e sono.

Qi Zhang2026-03-06💻 cs

AMV-L: Lifecycle-Managed Agent Memory for Tail-Latency Control in Long-Running LLM Systems

O artigo apresenta o AMV-L, um framework de gerenciamento de memória para agentes LLM que utiliza uma pontuação de utilidade contínua e tiers de ciclo de vida para limitar o conjunto de trabalho de recuperação, resultando em melhorias significativas na latência de cauda e na taxa de transferência em comparação com políticas baseadas em tempo (TTL) ou LRU.

Emmanuel Bamidele2026-03-06💻 cs

vLLM Semantic Router: Signal Driven Decision Routing for Mixture-of-Modality Models

O artigo apresenta o vLLM Semantic Router, um framework de roteamento de decisões baseado em sinais que orquestra características heterogêneas e regras configuráveis para direcionar dinamicamente solicitações a modelos de mistura de modalidades adequados, garantindo otimização de custos, privacidade e segurança em ambientes de produção diversos.

Xunzhuo Liu, Huamin Chen, Samzong Lu + 25 more2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

O artigo apresenta o SkillNet, uma infraestrutura aberta que organiza e avalia habilidades de IA em escala, permitindo que agentes aprendam com experiências passadas e melhorem significativamente seu desempenho em tarefas complexas.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06✓ Author reviewed ⓘ💻 cs

An Explainable Ensemble Framework for Alzheimer's Disease Prediction Using Structured Clinical and Cognitive Data

Esta pesquisa apresenta um framework de aprendizado de conjunto explicável que, ao integrar dados clínicos e cognitivos estruturados com técnicas avançadas de pré-processamento e balanceamento, alcança alta precisão na previsão do Alzheimer, superando redes neurais profundas e destacando variáveis como o MMSE e a idade funcional como fatores determinantes para o suporte à decisão clínica.

Nishan Mitra2026-03-06💻 cs

← Anterior Próximo →