Modelling the Diachronic Emergence of Phoneme Frequency Distributions

O artigo propõe um modelo estocástico de mudança fonológica que, ao incorporar efeitos de carga funcional e uma tendência estabilizadora para um tamanho preferencial de inventário, demonstra que as regularidades estatísticas observadas nas distribuições de frequência de fonemas podem surgir naturalmente de processos diacrônicos, sem a necessidade de mecanismos explícitos de otimização.

Fermín Moscoso del Prado Martín, Suchir Salhan2026-03-11💬 cs.CL

You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases

O artigo demonstra que modelos de linguagem podem adquirir subliminarmente preferências comportamentais de um modelo professor ao serem treinados em paráfrases fiéis de dados semânticamente não relacionados ou até contraditórios, revelando uma vulnerabilidade crítica em pipelines de geração de dados sintéticos que não pode ser detectada apenas pela inspeção do conteúdo.

Isaia Gisler (ETH Zürich), Zhonghao He (University of Cambridge), Tianyi Qiu (Peking University)2026-03-11🤖 cs.LG

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Este estudo propõe uma metodologia inovadora que utiliza Grandes Modelos de Linguagem (LLMs) para adaptar mensagens de desmentido de fake news aos traços de personalidade do Big Five, demonstrando que a personalização aumenta a persuasão e oferecendo uma avaliação automatizada que levanta questões éticas sobre o uso dessa tecnologia.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models

Este artigo apresenta um pipeline totalmente aberto e localmente implantável, baseado no modelo de linguagem \texttt{qwen2.5-72b} e no framework \texttt{llm\_extractinator}, que extrai com alta precisão informações longitudinais sobre carga tumoral e resposta ao tratamento de relatórios de radiologia, demonstrando a viabilidade de modelos de linguagem abertos para tarefas oncológicas que exigem privacidade e reprodutibilidade.

Luc Builtjes, Alessa Hering2026-03-11💬 cs.CL

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Este estudo apresenta um framework de classificação automatizada para o gerenciamento de risco cardiovascular em idosos, demonstrando que uma arquitetura Transformer personalizada supera tanto métodos tradicionais quanto modelos de linguagem generativos ao analisar registros de saúde eletrônicos não estruturados de longo contexto.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van Es2026-03-11🤖 cs.AI

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

O artigo apresenta o ActiveUltraFeedback, um pipeline de aprendizado ativo que utiliza estimativas de incerteza e métodos inovadores de seleção de pares de respostas para gerar dados de preferência de alta qualidade, permitindo o alinhamento eficiente de modelos de linguagem com até seis vezes menos dados anotados em comparação com baselines estáticas.

Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna Pásztor, Andreas Krause2026-03-11🤖 cs.AI

Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning

O artigo apresenta o Mousse, um novo otimizador que melhora o método Muon ao incorporar a estimativa estrutural do Shampoo para criar um sistema de coordenadas branqueado, permitindo atualizações espectrais adaptativas à curvatura que reduzem o número de etapas de treinamento em cerca de 12% com custo computacional insignificante.

Yechen Zhang, Shuhao Xing, Junhao Huang, Kai Lv, Yunhua Zhou, Xipeng Qiu, Qipeng Guo, Kai Chen2026-03-11🤖 cs.AI

Evaluation of LLMs in retrieving food and nutritional context for RAG systems

Este artigo avalia a eficácia de quatro Grandes Modelos de Linguagem (LLMs) em traduzir consultas em linguagem natural para filtros de metadados estruturados em um sistema RAG para dados nutricionais, concluindo que, embora sejam altamente precisos para consultas expressíveis, enfrentam desafios significativos ao lidar com restrições não representáveis no formato de metadados.

Maks Požarnik Vavken, Matevž Ogrinc, Tome Eftimov, Barbara Koroušic Seljak2026-03-11💬 cs.CL

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

O artigo apresenta o MUGEN, um benchmark abrangente que revela as limitações dos Modelos Grandes de Áudio-Linguagem na compreensão de múltiplos áudios simultâneos e demonstra que estratégias de treinamento sem supervisão, como a Autoconsistência Permutacional de Áudio combinada com Cadeia de Pensamento, podem melhorar significativamente o desempenho nesses cenários.

Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi Lee2026-03-11🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

O artigo apresenta o EXPLORE-Bench, um novo benchmark derivado de vídeos em primeira pessoa para avaliar a capacidade de modelos de linguagem multimodal em prever cenas finais após sequências longas de ações, revelando uma lacuna significativa em relação ao desempenho humano e demonstrando que a decomposição passo a passo das ações pode melhorar o raciocínio a longo prazo, embora com custos computacionais adicionais.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha2026-03-11🤖 cs.AI

EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting

Este artigo apresenta uma versão atualizada e combinada dos corpora EPIC-UdS e EuroParl-UdS, corrigindo erros e adicionando novas camadas de anotação para apoiar pesquisas sobre variações linguísticas e tradução, incluindo uma nova análise ilustrativa que valida os dados falados e avalia modelos de IA na previsão de partículas de preenchimento em interpretação.

Maria Kunilovskaya, Christina Pollkläsener2026-03-11💬 cs.CL