AMiD: Knowledge Distillation for LLMs with αα-mixture Assistant Distribution

O artigo propõe o AMiD, um novo framework unificado para destilação de conhecimento em LLMs que introduz uma distribuição de assistente baseada em mistura-α\alpha e uma família generalizada de divergências, superando as limitações de estabilidade e desempenho dos métodos anteriores ao explorar sistematicamente o espaço de interpolação e otimização.

Donghyeok Shin, Yeongmin Kim, Suhyeon Jo + 2 more2026-03-05🤖 cs.AI

REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

O artigo apresenta o framework REVISION, que integra mineração de intenções implícitas offline e raciocínio online via modelos de linguagem para otimizar sistemas de busca visual no e-commerce, reduzindo significativamente a taxa de cliques nulos ao alinhar as respostas do sistema às necessidades diversificadas dos usuários.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

Este artigo apresenta o MuSaG, o primeiro conjunto de dados multimodal em alemão para detecção de sarcasmo, composto por trechos de programas de televisão com anotações humanas alinhadas de texto, áudio e vídeo, e demonstra que, embora os modelos atuais performem melhor com texto, existe uma lacuna significativa em relação à dependência humana de pistas auditivas, motivando o desenvolvimento de modelos mais robustos para cenários realistas.

Aaron Scott, Maike Züfle, Jan Niehues2026-03-05🤖 cs.AI

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Este trabalho apresenta o Protocolo de Dados de Agentes (ADP), uma linguagem de representação leve que unifica diversos conjuntos de dados de agentes em um formato padronizado, permitindo o ajuste fino eficaz de modelos de linguagem e alcançando desempenho de ponta em tarefas como codificação, navegação e uso de ferramentas sem necessidade de ajuste específico por domínio.

Yueqi Song, Ketan Ramaneti, Zaid Sheikh + 18 more2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Este trabalho demonstra que o viés implícito do Adam com amostras individuais (incremental) em dados linearmente separáveis pode divergir do regime de lote completo, convergindo para classificadores de margem máxima em normas diferentes (como 2\ell_2 em vez de \ell_\infty) dependendo do conjunto de dados, ao contrário do Signum, que mantém invariância no viés para qualquer tamanho de lote.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Multimodal Large Language Models for Low-Resource Languages: A Case Study for Basque

Este artigo apresenta o desenvolvimento de um Modelo de Linguagem Multimodal (MLLM) robusto para a língua basca, demonstrando que uma pequena proporção de dados multimodais em basco (cerca de 20%) é suficiente para obter bons resultados e que não é necessário utilizar um modelo de linguagem base pré-adaptado ao basco para alcançar esse desempenho.

Lukas Arana, Julen Etxaniz, Ander Salaberria + 1 more2026-03-05🤖 cs.AI

SpatialBench: Benchmarking Multimodal Large Language Models for Spatial Cognition

O artigo apresenta o SpatialBench, um benchmark em larga escala e um framework hierárquico para avaliar a cognição espacial de Modelos de Linguagem Multimodais (MLLMs), revelando que, embora possuam forte percepção, eles ainda carecem em raciocínio simbólico, inferência causal e planejamento em comparação com a capacidade humana de abstração direcionada a objetivos.

Peiran Xu, Sudong Wang, Yao Zhu + 3 more2026-03-05🤖 cs.AI

Training High-Level Schedulers with Execution-Feedback Reinforcement Learning for Long-Horizon GUI Automation

Este artigo propõe o framework CES, que utiliza aprendizado por reforço com feedback de execução para treinar modelos de alto nível (Coordenador e Rastreador de Estado) que, integrados a qualquer executor de baixo nível, superam os desafios de planejamento e gerenciamento de estado em tarefas de automação de GUI de longo prazo.

Zehao Deng, Tianjie Ju, Zheng Wu + 2 more2026-03-05🤖 cs.AI