cs.AI artículos | Gist.Science

DAP: A Discrete-token Autoregressive Planner for Autonomous Driving

DAP es un planificador autoregresivo basado en tokens discretos que, mediante la predicción conjunta de semántica BEV y trayectorias del vehículo junto con un ajuste fino por aprendizaje por refuerzo, logra un rendimiento superior en la conducción autónoma con una arquitectura compacta y escalable.

Bowen Ye, Bin Zhang, Hang Zhao2026-03-06💻 cs

CCSD: Cross-Modal Compositional Self-Distillation for Robust Brain Tumor Segmentation with Missing Modalities

El artículo propone CCSD, un marco de auto-distilación compositiva multimodal que mejora la segmentación robusta de tumores cerebrales ante la ausencia de modalidades de MRI mediante una arquitectura compartida-específica y estrategias de distilación jerárquica y progresiva.

Dongqing Xie, Yonghuang Wu, Zisheng Ai + 4 more2026-03-06💻 cs

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

El artículo presenta FlashCache, un marco de compresión de caché KV multimodal que utiliza un enfoque guiado por el dominio de la frecuencia para identificar y preservar las salidas atípicas (outliers), logrando una reducción significativa de la memoria y una aceleración en la inferencia sin comprometer el rendimiento de los modelos.

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs

MambaTAD: When State-Space Models Meet Long-Range Temporal Action Detection

El artículo presenta MambaTAD, un modelo de detección de acciones temporales que integra modelos de espacio de estados con dos innovaciones clave, el módulo DMBSS y una cabeza de fusión de características globales, para superar los desafíos de la detección de acciones de larga duración en videos sin recortar.

Hui Lu, Yi Yu, Shijian Lu + 4 more2026-03-06💻 cs

CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery

Este trabajo presenta "CycleChemist", un marco de aprendizaje automático dual que integra el modelo de datos OPV2D, predictores de rendimiento y un generador de materiales (MatGPT) para acelerar el descubrimiento y diseño de materiales orgánicos fotovoltaicos de alto rendimiento.

Hou Hei Lam, Jiangjie Qiu, Xiuyuan Hu + 5 more2026-03-06🔬 cond-mat.mtrl-sci

Towards Trustworthy Legal AI through LLM Agents and Formal Reasoning

El artículo presenta L4L, un marco centrado en solucionadores que integra agentes de LLM con verificación formal basada en SMT para garantizar que las decisiones legales sean lógicas, verificables y alineadas con las leyes estatutarias.

Linze Chen, Yufan Cai, Zhe Hou + 1 more2026-03-06💻 cs

Steering Awareness: Models Can Be Trained to Detect Activation Steering

El estudio demuestra que los modelos de lenguaje pueden ser entrenados para detectar la inyección de vectores de dirección (activación steering) y el concepto asociado, lo que desafía la suposición de que esta intervención es indetectable y revela que dicha capacidad de detección no mejora, sino que incluso puede aumentar, la susceptibilidad del modelo a ser manipulado.

Joshua Fonseca Rivera, David Demitri Africa2026-03-06💻 cs

DPAC: Distribution-Preserving Adversarial Control for Diffusion Sampling

El artículo presenta DPAC, un método de control adversarial para el muestreo de difusión que proyecta los gradientes sobre el espacio tangente definido por la geometría de la puntuación generativa para minimizar la divergencia KL en el espacio de trayectorias, preservando así la calidad de las muestras y mejorando métricas como el FID sin comprometer la tasa de éxito del ataque.

Han-Jin Lee, Han-Ju Lee, Jin-Seong Kim + 1 more2026-03-06💻 cs

Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding

El artículo presenta FlexQP, un solver de programación cuadrática siempre factible basado en relajación $\ell_1$ , y su versión acelerada Deep FlexQP mediante desdoblamiento profundo, la cual supera a los métodos existentes en velocidad y éxito al resolver problemas de optimización no lineal y filtros de seguridad predictiva.

Alex Oshin, Rahul Vodeb Ghosh, Augustinos D. Saravanos + 1 more2026-03-06🔢 math

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

El artículo presenta Guided Flow Policy (GFP), un enfoque de aprendizaje por refuerzo offline que combina un actor distilado con un flujo de políticas guiado para priorizar la clonación de acciones de alto valor, logrando así un rendimiento superior en múltiples benchmarks al superar las limitaciones de la regularización conductual tradicional.

Franki Nguimatsia Tiofack, Théotime Le Hellard, Fabian Schramm + 2 more2026-03-06💻 cs

Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order

Este artículo demuestra que en el entrenamiento post-RL de un Transformer para resolver acertijos tipo Zebra, la combinación de una recompensa de tarea con una señal de ordenamiento canónico mediante un enfoque de recompensas mixtas y escalado *bootstrapped* mejora el rendimiento en comparación con la optimización basada únicamente en la tarea, incluso cuando el modelo se entrena con secuencias de soluciones aleatorizadas.

Prakhar Gupta, Vaibhav Gupta2026-03-06💻 cs

Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup and Frame-Level Attention

Este artículo propone un marco de aprendizaje multi-pérdida que integra una mezcla adaptativa a la energía y un módulo de atención a nivel de cuadro para mejorar el reconocimiento de emociones en el habla, logrando un rendimiento superior en cuatro conjuntos de datos estándar.

Cong Wang, Yizhong Geng, Yuhua Wen + 7 more2026-03-06💻 cs

Sparse Attention Post-Training for Mechanistic Interpretability

Este trabajo presenta un método de post-entrenamiento que logra una atención extremadamente dispersa en modelos de transformadores (reduciendo sus conexiones a aproximadamente el 0,4%) sin sacrificar el rendimiento, revelando circuitos más simples y organizados que facilitan la interpretabilidad mecánica al exponer la redundancia computacional inherente.

Florent Draye, Anson Lei, Hsiao-Ru Pan + 2 more2026-03-06💻 cs

ClinNoteAgents: An LLM Multi-Agent System for Predicting and Interpreting Heart Failure 30-Day Readmission from Clinical Notes

El artículo presenta ClinNoteAgents, un sistema multiagente basado en modelos de lenguaje grande que transforma notas clínicas no estructuradas en representaciones estructuradas y resúmenes interpretables para predecir con alta precisión las readmisiones por insuficiencia cardíaca en 30 días, ofreciendo una solución escalable que reduce la dependencia de campos estructurados y anotación manual.

Rongjia Zhou, Chengzhuo Li, Carl Yang + 1 more2026-03-06💻 cs

Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

El paper presenta InternGeometry, un agente de lenguaje grande que supera el rendimiento de los medallistas olímpicos en problemas de geometría mediante un mecanismo de memoria dinámica y el aprendizaje por refuerzo de aumento de complejidad (CBRL), logrando resolver 44 de 50 problemas de la Olimpiada Internacional de Matemáticas con solo 13.000 ejemplos de entrenamiento.

Haiteng Zhao, Junhao Shen, Yiming Zhang + 7 more2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

El artículo presenta ReFusion, un modelo de difusión enmascarada que integra la reorganización de secuencias en un marco de atención causal para habilitar la decodificación paralela a nivel de bloques, logrando así una aceleración significativa y un rendimiento superior al de los modelos autoregresivos tradicionales mediante la reutilización completa de la caché KV y la reducción de la complejidad de aprendizaje.

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs

HydroGEM: A Self Supervised Zero Shot Hybrid TCN Transformer Foundation Model for Continental Scale Streamflow Quality Control

El artículo presenta HydroGEM, un modelo fundacional híbrido de TCN y Transformer con aprendizaje auto-supervisado que escala la detección y reconstrucción de anomalías en el flujo de ríos a nivel continental, superando a los métodos existentes y demostrando una generalización efectiva entre EE. UU. y Canadá.

Ijaz Ul Haq, Byung Suk Lee, Julia N. Perdrial + 1 more2026-03-06💻 cs

RePo: Language Models with Context Re-Positioning

El artículo presenta RePo, un mecanismo innovador que mejora el aprendizaje en contexto de los modelos de lenguaje reorganizando dinámicamente las posiciones de los tokens para reducir la carga cognitiva extrínseca y optimizar la atención hacia información relevante, logrando así un mejor rendimiento en tareas con contextos ruidosos, estructurados o extensos.

Huayang Li, Tianyu Zhao, Deng Cai + 1 more2026-03-06💻 cs

MCP-SafetyBench: A Benchmark for Safety Evaluation of Large Language Models with Real-World MCP Servers

El artículo presenta MCP-SafetyBench, un nuevo benchmark integral basado en servidores MCP reales que evalúa la seguridad de los modelos de lenguaje grandes frente a 20 tipos de ataques en entornos multi-turno y multiherramienta, revelando que todos los modelos actuales son vulnerables y presentan una compensación entre seguridad y utilidad.

Xuanjun Zong, Zhiqi Shen, Lei Wang + 2 more2026-03-06💻 cs

FluenceFormer: Transformer-Driven Multi-Beam Fluence Map Regression for Radiotherapy Planning

El artículo presenta FluenceFormer, un marco basado en transformadores que utiliza un diseño de dos etapas y una pérdida informada por física para predecir mapas de fluencia en planificación de radioterapia, logrando una mayor precisión estructural y conservación de energía que los métodos anteriores.

Ujunwa Mgboh, Rafi Ibn Sultan, Joshua Kim + 2 more2026-03-06💻 cs

← Anterior Siguiente →