cs.CL artículos | Gist.Science

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

Este trabajo presenta MemeIntel, un enfoque que introduce el primer dataset a gran escala con explicaciones para memes propagandísticos y de odio, y propone un método de optimización multi-etapa que mejora significativamente la detección y la generación de justificaciones en comparación con el estado del arte.

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan + 2 more2026-03-03💬 cs.CL

Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models

Este artículo propone un enfoque novedoso de aprendizaje por refuerzo que ajusta finamente los modelos de lenguaje grandes para generar estimaciones de confianza calibradas junto con sus respuestas, optimizando una recompensa basada en la regla de puntuación logarítmica para alinear la confianza expresada con la precisión real y generalizar a tareas no vistas.

David Bani-Harouni, Chantal Pellegrini, Paul Stangel + 4 more2026-03-03💬 cs.CL

Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions

Este estudio demuestra mediante un metaanálisis de 92 modelos que incorporar decisiones de diseño, como la composición de datos y la arquitectura, mejora significativamente la predicción del rendimiento en tareas posteriores en comparación con basarse únicamente en la escala del modelo.

Emmy Liu, Amanda Bertsch, Lintang Sutawika + 9 more2026-03-03💬 cs.CL

Large Language Models in Bioinformatics: A Survey

Esta encuesta ofrece una revisión sistemática de cómo los Modelos de Lenguaje Grande están revolucionando la bioinformática mediante el análisis avanzado de datos genómicos y proteicos, abordando al mismo tiempo sus desafíos actuales y explorando futuras direcciones hacia la medicina de precisión.

Zhenyu Wang, Zikang Wang, Jiyue Jiang + 3 more2026-03-03🧬 q-bio

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

El paper presenta LLaVE, un marco de aprendizaje contrastivo ponderado por la dificultad que entrena modelos de incrustación multimodal capaces de superar el estado del arte en múltiples tareas de recuperación y agrupamiento, logrando un rendimiento superior con modelos más pequeños y demostrando una fuerte generalización cero-shot.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

El artículo presenta Vision-R1, un modelo de lenguaje multimodal que mejora las capacidades de razonamiento mediante el aprendizaje por refuerzo, utilizando un conjunto de datos de cadena de pensamiento generado automáticamente y una estrategia de supresión progresiva del pensamiento para alcanzar un rendimiento competitivo en benchmarks matemáticos multimodales.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Este artículo establece teóricamente y valida empíricamente que la predicción del siguiente token en los modelos de lenguaje permite aprender conceptos interpretables por humanos, demostrando que sus representaciones se aproximan al logaritmo de las probabilidades posteriores de variables latentes discretas.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Foundational Individual Mobility Prediction Model based on Open-Source Large Language Models

Este artículo presenta MoBLLM, un modelo fundacional de predicción de movilidad individual basado en modelos de lenguaje grandes de código abierto y técnicas de ajuste eficiente de parámetros, que supera a los modelos existentes en precisión, robustez y transferibilidad entre diferentes contextos espaciales y temporales sin requerir costosos recursos computacionales.

Zhenlin Qin, Leizhen Wang, Yancheng Ling + 2 more2026-03-03💬 cs.CL

Chain of Correction for Full-text Speech Recognition with Large Language Models

Este artículo propone la Cadena de Corrección (CoC), un método basado en un formato de chat multivuelta que utiliza modelos de lenguaje grandes para corregir de manera segmentada y contextual los errores de la transcripción completa de reconocimiento automático de voz, demostrando un rendimiento superior frente a sistemas existentes.

Zhiyuan Tang, Dong Wang, Zhikai Zhou + 3 more2026-03-03💬 cs.CL

AnesSuite: A Comprehensive Benchmark and Dataset Suite for Anesthesiology Reasoning in LLMs

Este trabajo presenta AnesSuite, el primer conjunto de datos y evaluación integral para el razonamiento en anestesiología en modelos de lenguaje, junto con Morpheus, una colección de modelos de referencia que demuestra mejoras significativas en esta especialidad y en dominios médicos generales tras un entrenamiento limitado.

Xiang Feng, Wentao Jiang, Zengmao Wang + 5 more2026-03-03💬 cs.CL

DRA-GRPO: Your GRPO Needs to Know Diverse Reasoning Paths for Mathematical Reasoning

El artículo presenta DRA-GRPO, un marco teórico que mejora el razonamiento matemático en modelos de lenguaje mediante la calibración de recompensas basada en la diversidad semántica para evitar la colapso de políticas y lograr un rendimiento superior con datos y costos reducidos.

Xiwen Chen, Wenhui Zhu, Peijie Qiu + 7 more2026-03-03💬 cs.CL

When Large Language Models are More PersuasiveThan Incentivized Humans, and Why

Este estudio demuestra que la superioridad persuasiva de los modelos de lenguaje grande sobre humanos incentivados es contextual, dependiendo de si el intento es veraz o engañoso, del modelo específico utilizado y de la interacción repetida, atribuyendo estos efectos a una mayor convicción expresada por las IA.

Philipp Schoenegger, Francesco Salvi, Jiacheng Liu + 37 more2026-03-03💬 cs.CL

mCLM: A Modular Chemical Language Model that Generates Functional and Makeable Molecules

El artículo presenta mCLM, un modelo de lenguaje químico modular que tokeniza las moléculas mediante bloques de construcción funcionales compatibles con la síntesis automatizada, logrando así generar nuevas moléculas con propiedades mejoradas y una viabilidad de síntesis superior a la de otros métodos de inteligencia artificial generativa.

Carl Edwards, Chi Han, Gawon Lee + 11 more2026-03-03🧬 q-bio

Dynamic Token Reweighting for Robust Vision-Language Models

Este artículo presenta DTR, una defensa innovadora en tiempo de inferencia que mitiga los ataques de jailbreak multimodales en modelos de visión y lenguaje mediante la reponderación dinámica de tokens visuales y la optimización de sus cachés de clave-valor, mejorando la robustez sin comprometer el rendimiento general.

Tanqiu Jiang, Jiacheng Liang, Rongyi Zhu + 3 more2026-03-03💬 cs.CL

Chain-of-Lure: A Universal Jailbreak Attack Framework using Unconstrained Synthetic Narratives

Este artículo presenta "Chain-of-Lure", un marco de ataque universal que utiliza narrativas sintéticas no restringidas y optimización por un modelo LLM auxiliar para eludir las restricciones de seguridad de otros modelos de lenguaje mediante la transferencia de misiones y preguntas engañosas progresivas, demostrando su alta eficacia en entornos de caja negra y proponiendo estrategias de defensa.

Wenhan Chang, Tianqing Zhu, Yu Zhao + 3 more2026-03-03💬 cs.CL

NFT: Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

Este trabajo presenta la Ajuste Fino Consciente de lo Negativo (NFT), un enfoque de aprendizaje supervisado que permite a los modelos de lenguaje mejorar autónomamente en razonamiento matemático mediante el aprovechamiento de sus propios errores, logrando un rendimiento comparable o superior a los métodos de aprendizaje por refuerzo y demostrando teóricamente la equivalencia entre ambos paradigmas en entornos de entrenamiento estrictamente en política.

Huayu Chen, Kaiwen Zheng, Qinsheng Zhang + 8 more2026-03-03💬 cs.CL

SQUiD: Synthesizing Relational Databases from Unstructured Text

El artículo presenta SQUiD, un marco neurosimbólico que utiliza modelos de lenguaje grandes para sintetizar automáticamente bases de datos relacionales a partir de texto no estructurado, superando consistentemente a los métodos existentes.

Mushtari Sadia, Zhenning Yang, Yunming Xiao + 2 more2026-03-03💬 cs.CL

Learning to Reason without External Rewards

El artículo presenta Intuitor, un método de aprendizaje por refuerzo que utiliza la auto-certidumbre del modelo como señal de recompensa intrínseca, permitiendo a los grandes modelos de lenguaje aprender razonamiento complejo de forma no supervisada y generalizar mejor a tareas fuera de dominio sin depender de recompensas externas costosas.

Xuandong Zhao, Zhewei Kang, Aosong Feng + 2 more2026-03-03💬 cs.CL

RPM: Reasoning-Level Personalization for Black-Box Large Language Models

Este trabajo presenta RPM, un marco innovador que supera las limitaciones de la personalización a nivel de respuesta en modelos de lenguaje grandes de caja negra al descubrir y aplicar automáticamente estructuras de razonamiento específicas del usuario basadas en sus datos conductuales para guiar inferencias más personalizadas e interpretables.

Jieyong Kim, Tongyoung Kim, Soojin Yoon + 2 more2026-03-03💬 cs.CL

Augmenting Research Ideation with Data: An Empirical Investigation in Social Science

Este estudio demuestra que enriquecer la generación de ideas de investigación en ciencias sociales con datos relevantes y validación automatizada mejora significativamente la viabilidad y calidad de las propuestas, sirviendo además como una herramienta eficaz para inspirar a los investigadores humanos.

Xiao Liu, Xinyi Dong, Xinyang Gao + 2 more2026-03-03💬 cs.CL

← Anterior Siguiente →