cs.CL artículos | Gist.Science

Draft-Conditioned Constrained Decoding for Structured Generation in LLMs

El artículo presenta la Decodificación Restringida Condicionada por Borrador (DCCD), un método de inferencia sin entrenamiento que separa la planificación semántica de la validación estructural mediante la generación de un borrador no restringido, logrando así una mayor precisión en tareas de generación estructurada y una eficiencia de parámetros superior a la decodificación restringida convencional.

Avinash Reddy, Thayne T. Walker, James S. Ide + 1 more2026-03-05🤖 cs.AI

Token-Oriented Object Notation vs JSON: A Benchmark of Plain and Constrained Decoding Generation

El estudio compara la generación de JSON (plano y con decodificación restringida) frente a la notación orientada a tokens TOON mediante aprendizaje en contexto, concluyendo que aunque TOON ofrece una prometedora relación precisión/consumo de tokens en tareas complejas, su ventaja se ve a menudo anulada por la sobrecarga del prompt en contextos cortos, mientras que la generación JSON plana demuestra la mayor precisión general y la decodificación restringida supera a TOON en estructuras simples.

Ivan Matveev2026-03-05🤖 cs.AI

TopicENA: Enabling Epistemic Network Analysis at Scale through Automated Topic-Based Coding

El estudio presenta TopicENA, un marco que integra BERTopic con el Análisis de Redes Epistémicas (ENA) para automatizar la codificación de conceptos y permitir el análisis de redes a gran escala, ofreciendo además directrices prácticas sobre la granularidad de los temas y los umbrales de inclusión para optimizar los resultados.

Owen H. T. Lu, Tiffany T. Y. Hsu2026-03-05🤖 cs.AI

Old Habits Die Hard: How Conversational History Geometrically Traps LLMs

Este trabajo presenta el marco History-Echoes, que demuestra mediante análisis probabilísticos y geométricos que la historia conversacional atrapa a los modelos de lenguaje grandes en un "bucle geométrico" en el espacio latente, lo que provoca una persistencia de comportamientos y sesgos en sus generaciones futuras.

Adi Simhi, Fazl Barez, Martin Tutek + 2 more2026-03-05🤖 cs.AI

Combating data scarcity in recommendation services: Integrating cognitive types of VARK and neural network technologies (LLM)

Este trabajo propone un marco híbrido innovador que combina modelos de lenguaje grandes (LLM) para el análisis semántico con perfiles cognitivos VARK para superar el problema de inicio en frío en los sistemas de recomendación, permitiendo generar sugerencias personalizadas y explicables incluso con datos iniciales limitados.

Nikita Zmanovskii2026-03-05💬 cs.CL

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Este artículo propone un nuevo paradigma de inferencia llamado "tiempo entrópico" para modelos de lenguaje grandes, que reemplaza la progresión lineal de tokens por un proceso auto-organizado donde la asignación de recursos computacionales, la poda de atención y la temperatura de muestreo se controlan dinámicamente mediante un objetivo unificado de reducción de incertidumbre.

Andrew Kiruluta2026-03-05🤖 cs.LG

The Logovista English-Japanese Machine Translation System

Este documento describe la arquitectura, las prácticas de desarrollo y los artefactos preservados del sistema de traducción automática Logovista inglés-japonés, un sistema comercial basado en reglas que operó desde principios de los años 90 hasta al menos 2012, destacando su evolución continua ante las presiones del uso real y sirviendo como registro técnico e histórico de sus recursos lingüísticos y de software.

Barton D. Wright2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

El artículo presenta SemKey, un marco innovador que supera las limitaciones actuales en la decodificación de EEG a texto mediante la guía semántica desacoplada y la alineación estricta con señales neurales, logrando así una generación libre de alucinaciones y una evaluación más robusta que las métricas tradicionales como BLEU.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

How does fine-tuning improve sensorimotor representations in large language models?

Este estudio demuestra que el ajuste fino (fine-tuning) puede reducir la brecha de encarnación en los modelos de lenguaje grandes al alinear sus representaciones internas con experiencias sensoriomotoras humanas, aunque esta mejora generaliza entre idiomas pero depende críticamente del objetivo de aprendizaje específico.

Minghua Wu, Javier Conde, Pedro Reviriego + 1 more2026-03-05🤖 cs.AI

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Este trabajo propone CoIPO, un método de optimización de preferencias inversa basado en aprendizaje contrastivo que mejora la resistencia intrínseca de los modelos de lenguaje grandes al ruido en los prompts, superando a las técnicas actuales y validándose mediante el nuevo benchmark NoisyPromptBench.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Este trabajo presenta M-QUEST, un marco semántico y un benchmark de 609 pares de preguntas y respuestas diseñado para evaluar la capacidad de los modelos de lenguaje para interpretar la toxicidad y el significado de los memes mediante el análisis de múltiples dimensiones, revelando que los modelos con ajuste de instrucciones y razonamiento superan a los demás, aunque siguen enfrentando desafíos en la inferencia pragmática.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Este estudio demuestra que la transferencia de aprendizaje basada en la iconicidad entre pares de lenguas de señas (chino-árabe y griego-flamenco) mejora significativamente el reconocimiento, logrando un aumento del 7,02% en árabe y del 1,07% en flamenco al utilizar Mediapipe para extraer características espaciotemporales.

Keren Artiaga, Conor Lynch, Haithem Afli + 1 more2026-03-05🤖 cs.AI

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations

Este artículo presenta Retcon, una técnica de prompting con pocos ejemplos diseñada para ofrecer un control preciso a nivel de turno sobre el comportamiento de los modelos de lenguaje grandes en conversaciones multivuelta, demostrando un rendimiento superior frente a métodos tradicionales.

David Kogan, Sam Nguyen, Masanori Suzuki + 1 more2026-03-05💬 cs.CL

Quantum-Inspired Self-Attention in a Large Language Model

Este artículo presenta un mecanismo de autoatención clásico inspirado en la cuántica (QISA) integrado en el modelo GPT-1, el cual supera significativamente a la autoatención estándar en métricas de error y pérdida, aunque con un tiempo de inferencia 2,6 veces mayor.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

Automated Concept Discovery for LLM-as-a-Judge Preference Analysis

Este trabajo presenta un método basado en autoencoders dispersos para descubrir automáticamente conceptos interpretables que explican los sesgos de los modelos de lenguaje utilizados como jueces, revelando nuevas tendencias en sus preferencias sin depender de taxonomías predefinidas.

James Wedgwood, Chhavi Yadav, Virginia Smith2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Este artículo presenta un enfoque neurosimbólico basado en la teoría de las ciencias sociales y el razonamiento abductivo que permite a los modelos de lenguaje grandes transformar eficazmente narrativas entre marcos individualistas y colectivistas, superando significativamente a los métodos de base cero mientras preservan la fidelidad del mensaje original.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

El artículo presenta DIALEVAL, un marco de evaluación basado en teoría de tipos que utiliza agentes duales de LLM para automatizar la descomposición y verificación de instrucciones, logrando una mayor precisión y correlación con el juicio humano que los métodos existentes.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Este trabajo presenta DBench-Bio, un marco de referencia dinámico y automatizado que evalúa la capacidad de los modelos de lenguaje grandes para descubrir nuevo conocimiento biológico, superando las limitaciones de los conjuntos de datos estáticos mediante un proceso de actualización mensual basado en literatura científica rigurosa.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

Este artículo presenta DCR, un nuevo método de alineación que utiliza el refinamiento contrastivo para reducir la sobre-denegación en modelos de lenguaje grandes, permitiéndoles distinguir con mayor precisión entre contenido realmente tóxico y contenido inofensivo sin comprometer su seguridad ni sus capacidades generales.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Este artículo demuestra que los atributos estilísticos en los modelos de lenguaje grandes se codifican como direcciones lineales en su espacio de activación, lo que permite un control preciso y sin entrenamiento mediante la ingeniería de representaciones.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

← Anterior Siguiente →