An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artículo presenta un enfoque pionero para la adquisición simultánea de video de resonancia magnética en tiempo real, EEG y EMG superficial, junto con un pipeline de supresión de artefactos, con el fin de capturar integralmente la actividad cerebral, muscular y articular durante la producción del habla.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

Can LLMs Capture Expert Uncertainty? A Comparative Analysis of Value Alignment in Ethnographic Qualitative Research

Este estudio compara el rendimiento y los patrones de incertidumbre de los modelos de lenguaje grande (LLM) frente a expertos humanos en la identificación de valores según la teoría de Schwartz en entrevistas etnográficas, revelando que, aunque los LLM alcanzan un alto rendimiento en métricas de conjunto y mejoran con métodos de ensamble, sus estructuras de incertidumbre y sesgos sistemáticos difieren de los expertos, lo que subraya tanto su potencial como colaboradores como las limitaciones actuales en el análisis cualitativo ambiguo.

Arina Kostina, Marios Dikaiakos, Alejandro Porcel + 1 more2026-03-06💬 cs.CL

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

Este estudio demuestra que las intervenciones de alineación en modelos de lenguaje grandes pueden provocar un "efecto rebote" dependiente del idioma, donde la seguridad superficial en inglés se invierte en patologías colectivas y disociación en otros idiomas como el japonés, revelando que la validación de seguridad en inglés no garantiza resultados seguros en otros contextos lingüísticos y culturales.

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

Este artículo presenta un pipeline de LLMs agénticos novedoso para la tarea 10 de SemEval-2026 que, mediante la arquitectura DD-CoT y un sistema de "Anti-Cámara de Eco", logra resultados superiores en la extracción de marcadores psicolingüísticos de conspiración y la detección de su respaldo, estableciendo un paradigma interpretable y fundamentado en la psicolingüística.

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

El sistema AILS-NTUA presentado en este trabajo aborda la Tarea 3 de SemEval-2026 sobre Análisis de Sentimiento Basado en Aspectos Dimensional mediante un enfoque unificado que combina el ajuste fino de codificadores y la adaptación eficiente de grandes modelos de lenguaje para lograr un rendimiento competitivo en regresión, extracción de tripletes y predicción de cuádruplets multilingües.

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services

El artículo presenta LocalSUG, un marco de sugerencia de consultas basado en LLM que aborda los desafíos de la falta de fundamentación geográfica, el sesgo de exposición y la latencia en los servicios de vida local mediante estrategias de minería de candidatos sensibles a la ciudad, un algoritmo GRPO impulsado por búsqueda en haz y técnicas de aceleración, logrando mejoras significativas en el CTR y la reducción de consultas sin resultados en pruebas en línea a gran escala.

Jinwen Chen, Shuai Gong, Shiwen Zhang + 7 more2026-03-06💬 cs.CL

MPCEval: A Benchmark for Multi-Party Conversation Generation

El artículo presenta MPCEval, una suite de evaluación y benchmarking diseñada para medir la generación de conversaciones multipersona mediante métricas cuantitativas y sin referencia que descomponen la calidad en modelado del hablante, calidad del contenido y consistencia entre ambos, revelando cómo los objetivos de evaluación influyen en la percepción de las capacidades de los modelos de IA generativa.

Minxing Zhang, Yi Yang, Zhuofan Jia + 5 more2026-03-06🤖 cs.AI

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

El artículo presenta MOUE, una generalización de los modelos de expertos mezclados (MoE) que introduce la "ancho virtual" al reutilizar expertos universales entre capas mediante una topología rotacional escalonada y mecanismos de balanceo de carga específicos, logrando mejoras significativas en el rendimiento y la escalabilidad frente a las arquitecturas MoE convencionales.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

VRM: Teaching Reward Models to Understand Authentic Human Preferences

El artículo presenta VRM (Modelado de Recompensa Variacional), un nuevo marco que supera las limitaciones de los modelos de recompensa tradicionales al imitar el proceso de evaluación humana mediante la inferencia variacional de pesos de objetivos de alta dimensión y características semánticas de baja dimensión, logrando así una mejor generalización y una captura más auténtica de las preferencias humanas.

Biao Liu, Ning Xu, Junming Yang + 2 more2026-03-06💬 cs.CL