Position: Vector Prompt Interfaces Should Be Exposed to Enable Customization of Large Language Models

Este artículo de posición sostiene que los proveedores de modelos de lenguaje grandes deben exponer entradas de prompts vectoriales en sus interfaces públicas para habilitar una personalización escalable y estable, respaldando esta propuesta con evidencia de que supera a los prompts de texto y no incrementa significativamente los riesgos de seguridad en escenarios de inferencia.

Liangwei Yang, Shiyu Wang, Haolin Chen + 12 more2026-03-05✓ Author reviewed 💬 cs.CL

The Company You Keep: How LLMs Respond to Dark Triad Traits

Este estudio examina cómo los Grandes Modelos de Lenguaje (LLMs) responden a rasgos de la Tríada Oscura en las interacciones de los usuarios, revelando que, aunque predominan las respuestas correctivas, algunos modelos pueden reforzar comportamientos dañinos dependiendo de la gravedad y el modelo específico, lo que subraya la necesidad de diseñar sistemas conversacionales más seguros.

Zeyi Lu, Angelica Henestrosa, Pavel Chizhov + 1 more2026-03-05💬 cs.CL

World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

Este estudio demuestra que la capacidad de recuperar variables geográficas y temporales mediante sondas lineales en modelos de lenguaje no prueba necesariamente la existencia de representaciones internas complejas, ya que dicha estructura espacial y temporal ya está latente en las estadísticas de co-ocurrencia de los textos estáticos.

Elan Barenholtz2026-03-05🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 12: Graph-Based Retrieval and Reflective Prompting for Abductive Event Reasoning

El sistema AILS-NTUA, ganador de la SemEval-2026 Tarea 12 con una precisión del 95 %, combina recuperación basada en grafos, razonamiento abductivo con LLM optimizado mediante evolución de prompts reflexivos y verificación de consistencia, revelando además sesgos inductivos compartidos en el razonamiento causal multietiqueta.

Nikolas Karafyllis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-05💬 cs.CL

Pointer-CAD: Unifying B-Rep and Command Sequences via Pointer-based Edges & Faces Selection

El artículo presenta Pointer-CAD, un marco de generación de modelos CAD basado en LLM que unifica las representaciones B-Rep y las secuencias de comandos mediante la selección de entidades geométricas mediante punteros, logrando así una mayor precisión topológica y una reducción significativa de errores de cuantización en comparación con métodos anteriores.

Dacheng Qi, Chenyu Wang, Jingwei Xu + 6 more2026-03-05💬 cs.CL

Dual-Modality Multi-Stage Adversarial Safety Training: Robustifying Multimodal Web Agents Against Cross-Modal Attacks

El artículo propone DMAST, un marco de entrenamiento de seguridad adversarial multimodal que utiliza un juego de suma cero y un proceso de tres etapas para robustecer a los agentes web frente a ataques de inyección cruzada, logrando una mayor eficiencia en tareas y una defensa superior frente a métodos existentes.

Haoyu Liu, Dingcheng Li, Lukas Rutishauser + 1 more2026-03-05🤖 cs.AI

ττ-Knowledge: Evaluating Conversational Agents over Unstructured Knowledge

El artículo presenta τ\tau-Knowledge, un nuevo marco de evaluación que extiende τ\tau-Bench para medir el rendimiento de agentes conversacionales en entornos de conocimiento no estructurado mediante el dominio τ\tau-Banking, donde se demuestra que incluso los modelos más avanzados tienen dificultades para integrar eficazmente la recuperación de documentos con la ejecución de herramientas en flujos de trabajo complejos.

Quan Shi, Alexandra Zytek, Pedram Razavi + 2 more2026-03-05🤖 cs.AI

Thought Flow Nets: From Single Predictions to Trains of Model Thought

Este artículo presenta las "Redes de Flujo de Pensamiento", un método inspirado en la dialéctica hegeliana que permite a los modelos iterar y corregir sus predicciones mediante un mecanismo de autocorrección, logrando así un rendimiento superior y una percepción más natural e inteligente tanto en tareas de respuesta a preguntas como en la interacción con usuarios humanos.

Hendrik Schuff, Heike Adel, Ngoc Thang Vu2026-03-04🤖 cs.LG

Is Attention always needed? A Case Study on Language Identification from Speech

Este estudio presenta un modelo de identificación de lenguaje basado en redes neuronales convolutivas recurrentes (CRNN) que, al utilizar coeficientes cepstrales de frecuencia mel (MFCC), logra una precisión superior al 98% en trece idiomas indios y demuestra una alta robustez ante el ruido y escalabilidad, cuestionando la necesidad de mecanismos de atención en comparación con enfoques de última generación.

Atanu Mandal, Santanu Pal, Indranil Dutta + 2 more2026-03-04⚡ eess

Reproduction and Replication of an Adversarial Stylometry Experiment

Este artículo reproduce y replica un estudio seminal sobre la estilometría adversaria, concluyendo que, aunque se confirma la dificultad de mantener el anonimato, la efectividad de las defensas estudiadas podría estar sobreestimada debido a la falta de un grupo de control en la investigación original, y destaca que el método automático de traducción de ida y vuelta merece un nuevo examen por reducir la eficacia de las técnicas de atribución de autoría.

Haining Wang, Patrick Juola, Allen Riddell2026-03-04💬 cs.CL

Focal Inferential Infusion Coupled with Tractable Density Discrimination for Implicit Hate Detection

El artículo presenta FiADD, un nuevo marco que mejora la detección de discurso de odio implícito al alinear las formas superficiales y significativas del texto mientras aumenta la distancia entre clusters de etiquetas, logrando mejoras significativas en tareas de clasificación de odio y demostrando su generalización en la detección de sarcasmo, ironía y postura.

Sarah Masud, Ashutosh Bajpai, Tanmoy Chakraborty2026-03-04💬 cs.CL