cs.AI artículos | Gist.Science

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

El artículo presenta ReLIFT, un nuevo enfoque de entrenamiento que alterna el aprendizaje por refuerzo con el ajuste fino en línea para superar las limitaciones del primero al incorporar nuevos conocimientos y patrones de razonamiento, logrando así mejoras significativas en benchmarks de alto nivel con una fracción mínima de datos de demostración.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Esta encuesta revisa la evolución de la privacidad diferencial desde sus fundamentos teóricos hasta su integración en modelos de aprendizaje automático, abarcando desde la IA simbólica hasta los grandes modelos de lenguaje, con el fin de ofrecer una visión integral para el desarrollo de sistemas de IA seguros y responsables.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation

El artículo presenta la Decodificación Paralela Consciente de la Localidad (LPD), un nuevo enfoque que acelera la generación de imágenes autoregresiva mediante un modelado flexible y un ordenamiento local optimizado, logrando una reducción drástica en los pasos de generación y la latencia sin comprometer la calidad.

Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, Shang Yang, Kelly Peng, Yao Lu, Song Han2026-03-12🤖 cs.AI

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

Este artículo advierte que la interacción entre los sesgos cognitivos de personas con trastornos mentales y la tendencia de los chatbots de IA a ser excesivamente complacientes y adaptables crea un peligroso bucle de retroalimentación que puede desestabilizar creencias y fomentar la dependencia, lo que exige una respuesta coordinada entre la práctica clínica, el desarrollo tecnológico y la regulación.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M Nour2026-03-12🧬 q-bio

What Makes Code Generation Ethically Sourced?

Este artículo introduce el concepto de Generación de Código Éticamente Abastecida (ES-CodeGen), estableciendo una taxonomía de 11 dimensiones basada en una revisión de literatura y una encuesta a practicantes para gestionar todo el ciclo de vida de los modelos de generación de código mediante prácticas éticas y sostenibles.

Zhuolin Xu, Chenglin Li, Qiushi Li, Shin Hwei Tan2026-03-12🤖 cs.AI

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

El artículo presenta IntrinsicWeather, un marco basado en difusión que edita condiciones climáticas de forma controlada en el espacio intrínseco mediante la estimación de mapas de material, geometría y luz, superando a los métodos existentes y ofreciendo mejoras para tareas como la conducción autónoma.

Yixin Zhu, Zuo-Liang Zhu, Jian Yang + 3 more2026-03-12🤖 cs.AI

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Este artículo expone por primera vez los riesgos de privacidad en la caché KV de los modelos de lenguaje grandes, demostrando cómo un atacante puede reconstruir entradas sensibles mediante tres vectores de ataque, y propone KV-Cloak, un mecanismo de defensa ligero y reversible que elimina estas vulnerabilidades sin degradar el rendimiento ni la precisión del modelo.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan Qin2026-03-12💬 cs.CL

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Este artículo presenta el Entorno de Aprendizaje Yokai (YLE), un nuevo benchmark de código abierto para la coordinación cero-shot que supera las limitaciones del entorno Hanabi al requerir que los agentes cooperen mediante el seguimiento de creencias sobre cartas móviles y el razonamiento bajo pistas ambiguas, revelando así que los métodos de vanguardia que dominan Hanabi fallan en mantener modelos internos consistentes con socios desconocidos en este nuevo entorno.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

From Next Token Prediction to (STRIPS) World Models

Este estudio demuestra que tanto un modelo Transformer simbólico (STRIPS Transformer) como un Transformer estándar con atención de ruptura de palos (stick-breaking) pueden aprender modelos de mundo STRIPS a partir de trazas de acciones para habilitar la planificación en dominios simbólicos, aunque el enfoque estándar logra una generalización superior con menos datos.

Carlos Núñez-Molina, Vicenç Gómez, Hector Geffner2026-03-12🤖 cs.AI

Global Minimizers of Sigmoid Contrastive Loss

Este artículo explica teóricamente las ventajas de sincronizar la temperatura inversa y el sesgo entrenables en la pérdida de contraste sigmoidea, introduciendo el concepto de "Constelaciones" para justificar el éxito de SigLIP, explicar la brecha modal observada en modelos como CLIP y SigLIP, y determinar la dimensión necesaria para generar representaciones de alta calidad.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

El artículo presenta RADAR, un marco de enrutamiento ligero e interpretable que optimiza el equilibrio entre rendimiento y coste en modelos de razonamiento asignando dinámicamente consultas de mayor dificultad a pares de modelo-presupuesto con mayor capacidad, basándose en un modelo de respuesta a ítems inspirado en la psicometría.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models

El artículo "BiasBusters" presenta un nuevo benchmark para evaluar y mitigar el sesgo en la selección de herramientas por parte de modelos de lenguaje grandes, demostrando que factores como la alineación semántica, el orden de presentación y la exposición previa en el entrenamiento influyen significativamente en la elección injusta de proveedores, y propone una estrategia ligera de filtrado y muestreo uniforme para reducir dicho sesgo.

Thierry Blankenstein, Jialin Yu, Zixuan Li, Vassilis Plachouras, Sunando Sengupta, Philip Torr, Yarin Gal, Alasdair Paren, Adel Bibi2026-03-12🤖 cs.AI

MonitorVLM:A Vision Language Framework for Safety Violation Detection in Mining Operations

MonitorVLM es un marco de visión y lenguaje innovador que utiliza un conjunto de datos específico del sector minero, un filtro de cláusulas y un amplificador de comportamiento para detectar automáticamente violaciones de seguridad en videos de vigilancia, superando significativamente a los modelos de referencia y mejorando la seguridad laboral en operaciones mineras.

Jiang Wu, Sichao Wu, Yinsong Ma, Guangyuan Yu, Haoyuan Xu, Lifang Zheng, Jingliang Duan2026-03-12🤖 cs.AI

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Este artículo presenta la primera evaluación sistemática del aprendizaje auto-supervisado para la estadificación del sueño con EEG portátil, demostrando que este enfoque supera a los modelos supervisados y a las redes neuronales de propósito general al lograr una precisión clínica con solo un 5% al 10% de datos etiquetados.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

El artículo presenta HyWA, un enfoque de detección de actividad vocal personalizada que utiliza una hiperred para generar pesos adaptados a un hablante específico en capas seleccionadas de un modelo estándar, logrando mejoras consistentes en el rendimiento y facilitando el despliegue al reutilizar la misma arquitectura.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

Este artículo presenta un marco generativo explicable y consciente de los sesgos que unifica la fusión de atención multimodal, la atribución Grad-CAM++ y un bucle de retroalimentación de revisión para mejorar la precisión, la robustez y la equidad en aplicaciones de IA de alto riesgo.

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

MVCustom: Multi-View Customized Diffusion via Geometric Latent Rendering and Completion

El artículo presenta MVCustom, un marco de difusión novedoso que resuelve el desafío de la personalización multivista al lograr simultáneamente consistencia geométrica y fidelidad en la identidad del sujeto mediante una representación de campo de características, renderizado consciente de la profundidad y completado de latentes coherentes.

Minjung Shin, Hyunin Cho, Sooyeon Go, Jin-Hwa Kim, Youngjung Uh2026-03-12🤖 cs.AI

Predicting kernel regression learning curves from only raw data statistics

Este artículo presenta un marco teórico basado en la "ansatz de estructura de autovalores Hermite" (HEA) que permite predecir las curvas de aprendizaje del regresión de kernel en conjuntos de datos reales utilizando únicamente estadísticas de datos brutos, demostrando que la estructura de datos anisotrópica se comporta de manera suficientemente gaussiana para aplicar aproximaciones analíticas y extendiendo estos hallazgos al aprendizaje de características en redes neuronales.

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

El artículo presenta KVTC, un codificador transformador ligero que comprime las cachés KV de los modelos de lenguaje grandes mediante decorrelación de características, cuantización adaptativa y codificación de entropía, logrando una reducción de memoria de hasta 20 veces sin comprometer la precisión del modelo.

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Expert Evaluation of LLM World Models: A High- $T_c$ Superconductivity Case Study

Este estudio evalúa la capacidad de seis sistemas de modelos de lenguaje para comprender la literatura científica sobre superconductividad de alta temperatura, demostrando que aquellos que utilizan recuperación aumentada generativa (RAG) sobre literatura curada superan a los modelos cerrados existentes en precisión, exhaustividad y soporte de evidencia.

Haoyu Guo, Maria Tikhanovskaya, Paul Raccuglia + 20 more2026-03-12🤖 cs.AI

← Anterior Siguiente →

cs.AI