An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artigo apresenta a primeira aquisição simultânea de vídeo de ressonância magnética em tempo real, EEG e EMG de superfície para capturar movimentos articulares, atividade muscular e sinais cerebrais durante a produção da fala, introduzindo um pipeline de supressão de artefatos para superar os desafios técnicos dessa abordagem multimodal.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

Free Lunch for Pass@kk? Low Cost Diverse Sampling for Diffusion Language Models

Os autores propõem uma intervenção de baixo custo e sem necessidade de re-treinamento para modelos de linguagem difusivos, que modifica sequencialmente amostras intermediárias para repelir redundâncias no espaço de características, resultando em maior diversidade e melhor desempenho Pass@kk em tarefas complexas como geração de código e resolução de problemas matemáticos.

Sean Lamont, Christian Walder, Paul Montague + 2 more2026-03-06🤖 cs.AI

Can LLMs Capture Expert Uncertainty? A Comparative Analysis of Value Alignment in Ethnographic Qualitative Research

Este estudo avalia a capacidade de modelos de linguagem (LLMs) de capturar a incerteza de especialistas na análise qualitativa de valores humanos, constatando que, embora superem em métricas de conjunto e se aproximem do desempenho humano, eles divergem nos padrões de incerteza e nas classificações exatas, sendo que o modelo Qwen e métodos de ensemble demonstraram o melhor alinhamento com as análises de especialistas.

Arina Kostina, Marios Dikaiakos, Alejandro Porcel + 1 more2026-03-06💬 cs.CL

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

Este artigo demonstra que as intervenções de alinhamento em modelos de linguagem, embora eficazes em inglês, podem gerar um "efeito colateral de alinhamento" que inverte a segurança e amplifica patologias coletivas em outros idiomas, revelando que a eficácia da segurança é estruturalmente determinada pelo espaço linguístico e cultural e não se transfere universalmente.

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

Este artigo apresenta um pipeline inovador baseado em LLMs agênticos para a tarefa 10 do SemEval-2026, que utiliza uma arquitetura decoplada com "Dynamic Discriminative Chain-of-Thought" para extração de marcadores e um sistema "Anti-Echo Chamber" para detecção de endosso de teorias da conspiração, alcançando desempenho superior ao baseline e estabelecendo um novo paradigma para NLP interpretável e fundamentado psicolinguisticamente.

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

Este artigo apresenta o sistema AILS-NTUA para a tarefa DimABSA da SemEval-2026, que combina fine-tuning de codificadores e ajuste de instruções em modelos de linguagem com LoRA para realizar regressão, extração de tripletas e previsão de quadrupletas de sentimento baseado em aspectos de forma eficiente e multilíngue, superando consistentemente as linhas de base.

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition

Este artigo propõe um paradigma de "correspondência e fusão" com algoritmos genéticos e de aprendizado por reforço para otimizar a agregação de modelos de linguagem heterogêneos em sistemas de reconhecimento automático de fala federados, demonstrando que o algoritmo reforçado (RMMA) alcança menor taxa de erro e convergência mais rápida em comparação com métodos existentes.

Mengze Hong, Yi Gu, Di Jiang + 4 more2026-03-06💬 cs.CL

LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services

O artigo apresenta o LocalSUG, um framework baseado em LLM para sugestão de consultas em serviços locais que supera as limitações de sistemas tradicionais ao integrar grounding geográfico, otimizar o viés de exposição com um algoritmo GRPO guiado por busca em feixe e reduzir a latência de inferência, resultando em melhorias significativas no CTR e na taxa de resultados nulos em testes reais.

Jinwen Chen, Shuai Gong, Shiwen Zhang + 7 more2026-03-06💬 cs.CL

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

O artigo apresenta o VisionPangu, um assistente multimodal compacto de 1,7 bilhão de parâmetros que, ao combinar um codificador de visão derivado do InternVL com o modelo de linguagem OpenPangu e utilizar descrições humanas densas do conjunto de dados DOCCI, alcança desempenho competitivo na geração de legendas detalhadas e semanticamente coerentes sem depender de escalas de modelo agressivas.

Jiaxin Fan, Wenpo Song2026-03-06💬 cs.CL

VRM: Teaching Reward Models to Understand Authentic Human Preferences

O artigo apresenta o VRM (Variational Reward Modeling), um novo quadro teórico e prático que supera as limitações dos modelos de recompensa tradicionais ao simular o processo de julgamento humano através da inferência variacional de pesos de objetivos e características semânticas, resultando em uma melhor captura das preferências autênticas e em um limite de erro de generalização mais apertado.

Biao Liu, Ning Xu, Junming Yang + 2 more2026-03-06💬 cs.CL