cs.CL artículos | Gist.Science

SarcasmMiner: A Dual-Track Post-Training Framework for Robust Audio-Visual Sarcasm Reasoning

El artículo presenta SarcasmMiner, un marco de entrenamiento posterior basado en aprendizaje por refuerzo que utiliza una estrategia de destilación dual y optimización de políticas para mejorar significativamente la detección de sarcasmo multimodal al reformularla como un proceso de razonamiento estructurado.

Zhu Li, Yongjian Chen, Huiyuan Lai + 3 more2026-03-06💬 cs.CL

Knowledge Divergence and the Value of Debate for Scalable Oversight

Este trabajo establece un marco formal que vincula la seguridad mediante debate y el aprendizaje por refuerzo con retroalimentación de IA (RLAIF), demostrando que la ventaja del debate depende geométricamente de la divergencia de conocimientos entre los modelos y que solo es esencial cuando dicha divergencia alcanza un régimen lineal, permitiendo así revelar información latente inaccesible para un solo agente.

Robin Young2026-03-06🤖 cs.LG

WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation

El artículo presenta WavSLM, un modelo de lenguaje de voz de un solo flujo que, mediante la cuantización y destilación de representaciones de WavLM sin supervisión textual, logra generar habla coherente y semánticamente consistente de manera eficiente y con inferencia en tiempo real.

Luca Della Libera, Cem Subakan, Mirco Ravanelli2026-03-06🤖 cs.AI

Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution

Med-V1 es una familia de modelos de lenguaje pequeños y eficientes que, entrenados con datos sintéticos de alta calidad, superan a sus modelos base y rivalizan con modelos avanzados como GPT-5 en la atribución de evidencia biomédica, permitiendo aplicaciones escalables como la detección de alucinaciones en respuestas generadas por IA y la identificación de errores en guías clínicas.

Qiao Jin, Yin Fang, Lauren He + 12 more2026-03-06🤖 cs.AI

PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration

Este trabajo presenta PersianPunc, un gran conjunto de datos de 17 millones de muestras para la restauración de puntuación en persa, junto con un modelo eficiente basado en ParsBERT que supera a los grandes modelos de lenguaje al lograr un alto rendimiento sin correcciones excesivas ni altos costos computacionales.

Mohammad Javad Ranjbar Kalahroodi, Heshaam Faili, Azadeh Shakery2026-03-06🤖 cs.AI

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Este trabajo presenta un corpus multilingüe de textos originales y sus versiones de lectura fácil anotadas por expertos humanos en español, catalán e italiano, creado para apoyar la investigación en simplificación automática y fomentar la participación democrática.

Stefan Bott, Verena Riegler, Horacio Saggion + 2 more2026-03-06💬 cs.CL

Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR

Este trabajo evalúa once algoritmos de fusión de modelos para la adaptación multi-dominio en reconocimiento automático de habla en portugués europeo, proponiendo el nuevo método BoostedTSV-M que supera al ajuste completo manteniendo la generalización fuera de distribución en un único modelo.

Carlos Carvalho, Francisco Teixeira, Thomas Rolland + 1 more2026-03-06💬 cs.CL

DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning

DiSCTT es un marco de auto-curriculum guiado por consenso que mejora la adaptación eficiente en tiempo de prueba de modelos de razonamiento al asignar dinámicamente estrategias de optimización basadas en la incertidumbre epistémica, logrando mayor precisión y menor coste computacional en comparación con métodos existentes.

Mohammad Mahdi Moradi, Sudhir Mudur2026-03-06💬 cs.CL

Progressive Residual Warmup for Language Model Pretraining

Este artículo presenta ProRes, un método de preentrenamiento para modelos de lenguaje que estabiliza el entrenamiento y acelera la convergencia mediante un "calentamiento" progresivo de las conexiones residuales, permitiendo que las capas iniciales se estabilicen antes de que las capas más profundas contribuyan al aprendizaje.

Tianhao Chen, Xin Xu, Lu Yin + 4 more2026-03-06💬 cs.CL

An Exploration-Analysis-Disambiguation Reasoning Framework for Word Sense Disambiguation with Low-Parameter LLMs

Este estudio demuestra que modelos de lenguaje de bajo parámetro (<4B), al ser ajustados finamente con estrategias de razonamiento como el pensamiento encadenado y análisis de palabras vecinas, pueden igualar o superar el rendimiento de modelos de alto parámetro en la desambiguación de sentido de palabras, ofreciendo una solución escalable y eficiente energéticamente.

Deshan Sumanathilaka, Nicholas Micallef, Julian Hough2026-03-06💬 cs.CL

Dissociating Direct Access from Inference in AI Introspection

Este estudio demuestra que los modelos de IA grandes poseen dos mecanismos de introspección separables: uno basado en la inferencia de anomalías en el prompt y otro de acceso directo a estados internos que, aunque detecta la presencia de una anomalía, es agnóstico al contenido y no puede identificar semánticamente los conceptos inyectados sin generar confabulaciones.

Harvey Lederman, Kyle Mahowald2026-03-06🤖 cs.AI

Ensembling Language Models with Sequential Monte Carlo

Este trabajo presenta un marco unificado para combinar múltiples modelos de lenguaje mediante distribuciones de conjuntos $f$ -ensembles, utilizando un algoritmo de Monte Carlo secuencial a nivel de bytes que permite muestrear consistentemente de distribuciones agregadas complejas y superar las limitaciones de las técnicas de ensembling tradicionales.

Robin Shing Moon Chan, Tianyu Liu, Samuel Kiegeland + 5 more2026-03-06🤖 cs.AI

Distributed Partial Information Puzzles: Examining Common Ground Construction Under Epistemic Asymmetry

Este artículo presenta el rompecabezas de información parcial distribuida (DPIP) y un conjunto de datos multimodales correspondiente para evaluar la capacidad de los modelos de lenguaje grandes y de los sistemas basados en lógica dinámica epistémica para construir un terreno común bajo asimetría epistémica, demostrando que las tareas de seguimiento de creencias y progreso del equipo representan un desafío significativo para los LLMs actuales.

Yifan Zhu, Mariah Bradford, Kenneth Lai + 4 more2026-03-06🤖 cs.AI

FlashAttention-4: Algorithm and Kernel Pipelining Co-Design for Asymmetric Hardware Scaling

El artículo presenta FlashAttention-4, una co-diseño de algoritmo y kernel optimizado para las GPUs Blackwell que aborda sus características de escalado asimétrico mediante nuevas técnicas de pipeline y emulación de software, logrando un rendimiento superior y tiempos de compilación significativamente más rápidos gracias a su implementación en CuTe-DSL.

Ted Zadouri, Markus Hoehnerbach, Jay Shah + 3 more2026-03-06💬 cs.CL

DEBISS: a Corpus of Individual, Semi-structured and Spoken Debates

Este artículo presenta DEBISS, un corpus de debates hablados, individuales y semiestructurados con diversas anotaciones de PLN para abordar la escasez de recursos en este dominio.

Klaywert Danillo Ferreira de Souza, David Eduardo Pereira, Cláudio E. C. Campelo + 1 more2026-03-06💬 cs.CL

NCTB-QA: A Large-Scale Bangla Educational Question Answering Dataset and Benchmarking Performance

Este estudio presenta NCTB-QA, un nuevo conjunto de datos a gran escala en bengalí para preguntas y respuestas educativas que incluye un equilibrio de preguntas con y sin respuesta, demostrando que el ajuste fino de modelos transformadores mejora significativamente el rendimiento en este contexto de recursos limitados.

Abrar Eyasir, Tahsin Ahmed, Muhammad Ibrahim2026-03-06💬 cs.CL

Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval

Este trabajo propone el enfoque de verificación de hechos sin recuperación, introduce el método INTRA que aprovecha las representaciones internas de los modelos para lograr un rendimiento superior y generalización robusta, y establece esta línea de investigación como una alternativa escalable y complementaria a los métodos basados en recuperación.

Artem Vazhentsev, Maria Marina, Daniil Moskovskiy + 8 more2026-03-06🤖 cs.AI

Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought

El estudio demuestra que los modelos de razonamiento a menudo exhiben un "teatro de razonamiento" performático donde la certeza interna se manifiesta en las activaciones mucho antes de que se revele en el texto, lo que permite utilizar la detección de estas señales para reducir significativamente el consumo de tokens sin sacrificar la precisión.

Siddharth Boppana, Annabel Ma, Max Loeffler + 5 more2026-03-06🤖 cs.AI

Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation

Este estudio utiliza modelos de lenguaje abiertos chinos que censuran temas políticamente sensibles como un banco de pruebas natural para evaluar técnicas de elicitación de honestidad y detección de mentiras, encontrando que métodos como el muestreo sin plantillas de chat y el prompting de autoevaluación mejoran la veracidad, aunque ninguna técnica elimina completamente las respuestas falsas.

Helena Casademunt, Bartosz Cywiński, Khoi Tran + 3 more2026-03-06🤖 cs.AI

The Spike, the Sparse and the Sink: Anatomy of Massive Activations and Attention Sinks

Este estudio demuestra que las activaciones masivas y los sumideros de atención, aunque a menudo coexisten como un artefacto arquitectónico de los Transformers modernos, cumplen funciones distintas (globales y locales, respectivamente) que se desacoplan al modificar la configuración de pre-normalización.

Shangwen Sun, Alfredo Canziani, Yann LeCun + 1 more2026-03-06🤖 cs.AI

← Anterior Siguiente →