SpiroLLM: Finetuning Pretrained LLMs to Understand Spirogram Time Series with Clinical Validation in COPD Reporting

O artigo apresenta o SpiroLLM, o primeiro modelo de linguagem multimodal capaz de interpretar séries temporais de espirogramas para gerar relatórios diagnósticos explicáveis e clinicamente validados para a DPOC, superando as limitações de modelos anteriores ao alcançar alta precisão e robustez mesmo com dados incompletos.

Shuhao Mei, Yongchao Long, Xiaoyu Xiao + 6 more2026-03-03💬 cs.CL

Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks

O estudo demonstra que a esparsidade ideal em modelos de linguagem do tipo Mixture-of-Experts para tarefas de raciocínio depende de um equilíbrio entre FLOPs ativos e tokens totais por parâmetro, revelando que o aumento do cálculo ativo melhora o raciocínio enquanto a memorização beneficia-se de mais parâmetros, independentemente de técnicas de pós-treinamento ou computação em tempo de teste.

Taishi Nakamura, Satoki Ishikawa, Masaki Kawamura + 4 more2026-03-03💬 cs.CL

Distribution-Aligned Decoding for Efficient LLM Task Adaptation

O artigo apresenta o SVDecode, um método leve e teoricamente fundamentado que melhora a adaptação de tarefas em grandes modelos de linguagem alinhando suas distribuições de saída durante a decodificação por meio de um vetor de direção extraído de um ajuste fino inicial, alcançando ganhos de desempenho significativos sem adicionar parâmetros treináveis além dos adaptadores PEFT existentes.

Senkang Hu, Xudong Han, Jinqi Jiang + 5 more2026-03-03💬 cs.CL

Actions Speak Louder than Prompts: A Large-Scale Study of LLMs for Graph Inference

Este estudo de grande escala avalia sistematicamente a interação entre modelos de linguagem grandes (LLMs) e dados gráficos, revelando que a geração de código supera outras abordagens em desempenho e adaptabilidade, especialmente em grafos heterofílicos e com textos longos, oferecendo diretrizes práticas para o desenvolvimento futuro de métodos de inferência gráfica.

Ben Finkelshtein, Silviu Cucerzan, Sujay Kumar Jauhar + 1 more2026-03-03💬 cs.CL

Bridging Draft Policy Misalignment: Group Tree Optimization for Speculative Decoding

Este artigo apresenta a Otimização de Árvore de Grupo (GTO), um novo método que alinha o treinamento do modelo de rascunho com a política de decodificação em árvore do tempo de execução, resultando em um aumento significativo no comprimento de aceitação e na velocidade de inferência de modelos de linguagem grandes em comparação com o estado da arte.

Shijing Hu, Jingyang Li, Zhihui Lu + 1 more2026-03-03💬 cs.CL

Dynamic Level Sets

Este artigo apresenta e analisa o conceito matemático de "conjuntos de nível dinâmicos", uma noção distinta da literatura padrão que, fundamentada no Princípio da Auto-modificabilidade, desafia resultados clássicos sobre a equivalência entre máquinas de Turing determinísticas e probabilísticas ao propor que a realização física de um conjunto lógico invariante é reconfigurada a cada passo por um processo físico incomputável.

Michael Stephen Fiske2026-03-03🔢 math-ph