Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

El artículo presenta la Decodificación Restringida Condicionada por Borrador (DCCD), un método de inferencia sin entrenamiento que separa la planificación semántica de la validación estructural mediante la generación de un borrador no restringido, logrando así una mayor precisión en tareas de generación estructurada y una eficiencia de parámetros superior a la decodificación restringida convencional.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

El estudio compara la generación de JSON (plano y con decodificación restringida) frente a la notación orientada a tokens TOON mediante aprendizaje en contexto, concluyendo que aunque TOON ofrece una prometedora relación precisión/consumo de tokens en tareas complejas, su ventaja se ve a menudo anulada por la sobrecarga del prompt en contextos cortos, mientras que la generación JSON plana demuestra la mayor precisión general y la decodificación restringida supera a TOON en estructuras simples.

Ivan Matveev2026-03-05🤖 cs.AI

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Este artículo propone un nuevo paradigma de inferencia llamado "tiempo entrópico" para modelos de lenguaje grandes, que reemplaza la progresión lineal de tokens por un proceso auto-organizado donde la asignación de recursos computacionales, la poda de atención y la temperatura de muestreo se controlan dinámicamente mediante un objetivo unificado de reducción de incertidumbre.

Andrew Kiruluta2026-03-05🤖 cs.LG

The Logovista English-Japanese Machine Translation System

Este documento describe la arquitectura, las prácticas de desarrollo y los artefactos preservados del sistema de traducción automática Logovista inglés-japonés, un sistema comercial basado en reglas que operó desde principios de los años 90 hasta al menos 2012, destacando su evolución continua ante las presiones del uso real y sirviendo como registro técnico e histórico de sus recursos lingüísticos y de software.

Barton D. Wright2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

El artículo presenta SemKey, un marco innovador que supera las limitaciones actuales en la decodificación de EEG a texto mediante la guía semántica desacoplada y la alineación estricta con señales neurales, logrando así una generación libre de alucinaciones y una evaluación más robusta que las métricas tradicionales como BLEU.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Este trabajo presenta M-QUEST, un marco semántico y un benchmark de 609 pares de preguntas y respuestas diseñado para evaluar la capacidad de los modelos de lenguaje para interpretar la toxicidad y el significado de los memes mediante el análisis de múltiples dimensiones, revelando que los modelos con ajuste de instrucciones y razonamiento superan a los demás, aunque siguen enfrentando desafíos en la inferencia pragmática.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Este artículo presenta un enfoque neurosimbólico basado en la teoría de las ciencias sociales y el razonamiento abductivo que permite a los modelos de lenguaje grandes transformar eficazmente narrativas entre marcos individualistas y colectivistas, superando significativamente a los métodos de base cero mientras preservan la fidelidad del mensaje original.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Este trabajo presenta DBench-Bio, un marco de referencia dinámico y automatizado que evalúa la capacidad de los modelos de lenguaje grandes para descubrir nuevo conocimiento biológico, superando las limitaciones de los conjuntos de datos estáticos mediante un proceso de actualización mensual basado en literatura científica rigurosa.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI