FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

O artigo apresenta o FLoC, um método de compressão de tokens visuais livre de treinamento e agnóstico a modelos, baseado na função de localização de instalações e no algoritmo ganancioso preguiçoso, que seleciona eficientemente um subconjunto representativo de tokens para melhorar a compreensão de vídeos longos em Modelos Multimodais de Grande Escala.

Janghoon Cho, Jungsoo Lee, Munawar Hayat + 3 more2026-03-06💻 cs

CCSD: Cross-Modal Compositional Self-Distillation for Robust Brain Tumor Segmentation with Missing Modalities

O artigo propõe o framework CCSD, uma nova abordagem de auto-distilação composicional multimodal que utiliza arquiteturas codificador-decodificador compartilhadas e específicas, combinadas com mecanismos hierárquicos e progressivos de transferência de conhecimento, para alcançar segmentação robusta e de alto desempenho de tumores cerebrais em cenários clínicos onde modalidades de ressonância magnética estão ausentes.

Dongqing Xie, Yonghuang Wu, Zisheng Ai + 4 more2026-03-06💻 cs

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

O artigo apresenta o FlashCache, um novo framework de compressão de cache KV para modelos de linguagem multimodal que utiliza uma abordagem guiada por domínio de frequência para identificar e preservar outliers críticos, resultando em uma aceleração de decodificação de até 1,69 vezes e uma redução de 80% no uso de memória sem comprometer o desempenho.

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs

Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding

O artigo apresenta o Deep FlexQP, um solver de programação quadrática convexa acelerado por aprendizado profundo e baseado em relaxação elástica 1\ell_1, que garante soluções ótimas viáveis ou minimiza violações de restrições de forma esparsa, resultando em um solver SQP mais rápido e robusto para problemas de otimização não linear e filtros de segurança preditiva.

Alex Oshin, Rahul Vodeb Ghosh, Augustinos D. Saravanos + 1 more2026-03-06🔢 math

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

O artigo apresenta a Guided Flow Policy (GFP), um método de aprendizado por reforço offline que combina um policy de fluxo de múltiplos passos com um ator destilado para focar na clonagem de ações de alto valor, alcançando desempenho de última geração em diversos benchmarks ao superar as limitações da regularização comportamental tradicional.

Franki Nguimatsia Tiofack, Théotime Le Hellard, Fabian Schramm + 2 more2026-03-06💻 cs

ClinNoteAgents: An LLM Multi-Agent System for Predicting and Interpreting Heart Failure 30-Day Readmission from Clinical Notes

O artigo apresenta o ClinNoteAgents, um sistema multiagente baseado em LLM que transforma notas clínicas em texto livre em representações estruturadas e abstrações interpretáveis para prever com precisão as readmissões hospitalares em 30 dias de pacientes com insuficiência cardíaca, superando as limitações dos modelos tradicionais que dependem de campos estruturados e anotação manual.

Rongjia Zhou, Chengzhuo Li, Carl Yang + 1 more2026-03-06💻 cs

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

O artigo apresenta o InternGeometry, um agente de modelo de linguagem baseado em Aprendizado por Reforço com Aumento de Complexidade (CBRL) e um mecanismo de memória dinâmica que, utilizando apenas 13 mil exemplos de treinamento, supera o desempenho de medalhistas de ouro no International Mathematical Olympiad em problemas de geometria ao propor construções auxiliares inovadoras e interagir iterativamente com um motor simbólico.

Haiteng Zhao, Junhao Shen, Yiming Zhang + 7 more2026-03-06💻 cs