cs.AI artículos | Gist.Science

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

El artículo presenta "Amnesia", un ataque adversarial ligero que manipula las activaciones internas de los modelos de lenguaje grandes (LLM) de peso abierto para eludir sus mecanismos de seguridad y generar contenido dañino sin necesidad de entrenamiento adicional.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Digging Deeper: Learning Multi-Level Concept Hierarchies

El artículo presenta Multi-Level Concept Splitting (MLCS) y Deep-HiCEMs, métodos que permiten descubrir y representar jerarquías de conceptos multinivel a partir de supervisión de alto nivel, superando las limitaciones de los modelos anteriores para lograr intervenciones interpretables y mejoras en el rendimiento.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

El artículo presenta KernelSkill, un marco de trabajo multiagente que mejora la optimización de kernels de GPU mediante el uso de habilidades de expertos guiadas por conocimiento y una arquitectura de memoria dual, logrando aceleraciones significativas y una tasa de éxito del 100% en comparación con métodos anteriores basados en LLM.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

El artículo presenta ES-dLLM, un marco de inferencia sin entrenamiento que acelera los modelos de difusión de lenguaje grande (dLLM) mediante el salto temprano de tokens en capas iniciales basado en la variación de representaciones intermedias y puntuaciones de confianza, logrando aceleraciones de hasta 16,8 veces sin comprometer la calidad de generación.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Este artículo propone un ataque de perturbación multi-flujo que explota las vulnerabilidades de los modelos de lenguaje con modo de pensamiento al intercalar múltiples tareas simultáneas, logrando altas tasas de éxito en evadir mecanismos de seguridad y provocar el colapso del proceso de razonamiento en modelos avanzados.

Fan Yang2026-03-12🤖 cs.AI

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

El artículo propone un estándar de ejecución consciente de la supervivencia (SAE) para sistemas de trading criptográfico con agentes tipo OpenClaw, que mitiga los riesgos de ejecución no autorizada mediante invariantes de última milla y métricas de brecha de delegación, logrando reducciones drásticas en la pérdida máxima y el riesgo de cola en pruebas con datos reales de Binance.

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

El artículo presenta Equivariant Asynchronous Diffusion (EAD), un modelo de difusión novedoso que combina horarios de desruido asíncronos y sincrónicos mediante un mecanismo de programación dinámica para superar las limitaciones de los métodos existentes y lograr un rendimiento superior en la generación de conformaciones moleculares 3D.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

El artículo presenta CSRO, un marco innovador que sustituye los oráculos de aprendizaje por refuerzo tradicionales por modelos de lenguaje grandes para generar políticas multiagente interpretables y codificadas en código humano legible, logrando un rendimiento competitivo mientras facilita la comprensión y depuración de las estrategias.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

El artículo propone un paradigma de "dispersión suave" basado en un proxy de bits significativos más altos integrado en una instrucción RISC-V personalizada que, al omitir multiplicaciones insignificantes, reduce drásticamente las operaciones MAC y el consumo de energía en redes neuronales convolucionales sin pérdida de precisión, superando significativamente a los métodos tradicionales de dispersión rígida.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

El artículo presenta CLIPO, un enfoque que integra aprendizaje contrastivo en la optimización de políticas para generalizar el Aprendizaje por Refuerzo con Recompensas Verificables (RLVR), mejorando así la robustez y la generalización de los modelos de lenguaje al corregir inconsistencias en los pasos intermedios del razonamiento que el RLVR tradicional ignora.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

Este artículo demuestra que el fenómeno "Lost in the Middle", caracterizado por un rendimiento en forma de U en los modelos de lenguaje, es una propiedad geométrica inherente a la arquitectura de los transformadores causales que ya está presente en la inicialización antes de cualquier entrenamiento o codificación posicional, debido a la interacción entre el enmascaramiento causal y las conexiones residuales.

Borun D Chowdhury2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

El artículo presenta AR-VLA, un experto de acción autoregresivo independiente que mantiene una memoria a largo plazo para generar trayectorias de acciones continuas y coherentes, superando las limitaciones de los modelos VLA reactivos actuales al abordar la desincronización entre el razonamiento lento y el control rápido mediante un mecanismo de reanclaje.

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

El artículo propone un sistema que automatiza la mejora de productos de datos mediante agentes de IA especializados en un bucle de optimización continua, el cual equilibra la automatización con la supervisión humana para transformar los datos en activos observables y refinables.

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI

The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory

Este artículo presenta una nueva visión unificada de la asimetría entre generación y reconocimiento en la teoría de lenguajes formales, identificando seis dimensiones divergentes (incluyendo dos nuevas: direccionalidad y temporalidad) para desmitificar la noción de que la generación es siempre fácil y el análisis siempre difícil, y conectando estas diferencias con el marco de la sorpresa en el procesamiento del lenguaje natural y las arquitecturas de los modelos de lenguaje grandes.

Romain Peyrichou2026-03-12💬 cs.CL

Social Knowledge for Cross-Domain User Preference Modeling

Este trabajo demuestra que es posible representar y predecir las preferencias de los usuarios a través de diferentes dominios temáticos proyectándolos en un espacio de incrustación social aprendido de la red de Twitter, lo que permite una personalización efectiva en escenarios de cero disparos y revela correlaciones entre factores sociodemográficos y preferencias transversales.

Nir Lotan, Adir Solomon, Ido Guy, Einat Minkov2026-03-12🤖 cs.AI

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

El artículo presenta "Mashup Learning", un método que acelera el ajuste fino de modelos de lenguaje al combinar checkpoints históricos relevantes mediante fusión de modelos, logrando una mayor precisión y una convergencia más rápida con menos pasos de entrenamiento en comparación con el entrenamiento desde cero.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

Compatibility at a Cost: Systematic Discovery and Exploitation of MCP Clause-Compliance Vulnerabilities

Este trabajo presenta el primer marco sistemático para descubrir y explotar vulnerabilidades en las implementaciones de SDK del Protocolo de Contexto de Modelo (MCP) que surgen del relajamiento de cláusulas para garantizar la compatibilidad, utilizando un generador de representación intermedia universal y análisis estático guiado por LLM para identificar ataques de abuso de compatibilidad como inyección de prompts silenciosa y denegación de servicio.

Nanzi Yang, Weiheng Bai, Kangjie Lu2026-03-12🤖 cs.AI

MCP-in-SoS: Risk assessment framework for open-source MCP servers

Este artículo presenta un marco de evaluación de riesgos para servidores MCP de código abierto que, mediante análisis de código estático y mapeo a taxonomías de amenazas, identifica vulnerabilidades explotables y propone un sistema de puntuación para garantizar despliegues de agentes de IA más seguros.

Pratyay Kumar, Miguel Antonio Guirao Aguilera, Srikathyayani Srikanteswara, Satyajayant Misra, Abu Saleh Md Tayeen2026-03-12🤖 cs.AI

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

El artículo presenta la Cancelación Adaptativa de Activaciones (AAC), un marco de inferencia en tiempo real que mitiga las alucinaciones en modelos de lenguaje grandes suprimiendo selectivamente las activaciones neuronales asociadas a errores fácticos sin requerir ajuste fino ni degradar la capacidad general del modelo.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Delta-K: Boosting Multi-Instance Generation via Cross-Attention Augmentation

Delta-K es un marco de inferencia plug-and-play que mejora la generación de múltiples instancias en modelos de difusión al inyectar claves semánticas diferenciales extraídas por modelos de visión y lenguaje en el espacio de atención cruzada, logrando así una alineación composicional superior sin necesidad de entrenamiento adicional ni modificaciones arquitectónicas.

Zitong Wang, Zijun Shen, Haohao Xu, Zhengjie Luo, Weibin Wu2026-03-12🤖 cs.AI

← Anterior Siguiente →