cs.AI artículos | Gist.Science

Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling

El artículo presenta Timer-S1, un modelo fundacional de series temporales a escala de miles de millones de parámetros que utiliza una arquitectura MoE y un enfoque de predicción de tokens en serie para superar los cuellos de botella de escalabilidad y lograr un rendimiento de vanguardia en pronósticos a largo plazo.

Yong Liu, Xingjian Su, Shiyu Wang + 7 more2026-03-06💻 cs

LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation

Este artículo presenta "LAW & ORDER", un enfoque que utiliza adaptadores de red para el ponderamiento espacial adaptativo, mejorando significativamente tanto la síntesis de imágenes médicas mediante difusión como la segmentación eficiente de lesiones, logrando avances sustanciales en métricas de calidad generativa y precisión de segmentación en conjuntos de datos de pólipos y tumores renales.

Anugunj Naman, Ayushman Singh, Gaibo Zhang + 1 more2026-03-06💻 cs

Comparative Evaluation of Traditional Methods and Deep Learning for Brain Glioma Imaging. Review Paper

Esta revisión compara los métodos tradicionales con el aprendizaje profundo para la segmentación y clasificación de gliomas cerebrales en imágenes de resonancia magnética, concluyendo que las arquitecturas de redes neuronales convolucionales superan a las técnicas tradicionales en estas tareas.

Kiranmayee Janardhan, Vinay Martin DSa Prabhu, T. Christy Bobby2026-03-06💻 cs

Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm

El artículo propone CSV, un marco innovador que reduce la complejidad de las invocaciones a modelos de lenguaje grande (LLM) para el filtrado semántico a sublineal mediante agrupamiento, muestreo y votación, logrando una drástica disminución en el número de llamadas sin comprometer la precisión.

Nan Hou, Kangfei Zhao, Jiadong Xie + 1 more2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Este trabajo presenta la Reconstrucción Contrastiva de Difusión (DCR), un método que integra señales contrastivas derivadas de imágenes reconstruidas dentro del proceso de difusión para equilibrar la capacidad discriminativa y la percepción de detalles en las representaciones visuales de CLIP, superando así las limitaciones de enfoques anteriores.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

Attention's Gravitational Field:A Power-Law Interpretation of Positional Correlation

Este artículo introduce el concepto de Campo Gravitacional de Atención (AGF) para decodificar las relaciones posicionales en los modelos de lenguaje grandes, demostrando que su alineación con la Ley de Gravitación Universal de Newton permite optimizar la arquitectura del modelo y lograr una mayor precisión y estabilidad.

Edward Zhang2026-03-06💻 cs

Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation

Este trabajo presenta Meta-D, una arquitectura que aprovecha los metadatos categóricos de los escáneres para guiar la extracción de características y mejorar tanto la detección de tumores cerebrales como la segmentación ante la ausencia de modalidades de imagen, logrando aumentos significativos en las métricas de rendimiento y una reducción de parámetros.

SangHyuk Kim, Daniel Haehn, Sumientra Rampersad2026-03-06💻 cs

EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

El artículo presenta EchoGuard, un marco de inteligencia artificial agéntica que utiliza un grafo de conocimiento como memoria episódica y semántica para detectar patrones de comunicación manipuladora en diálogos longitudinales y guiar a los usuarios hacia el auto-descubrimiento mediante preguntas socráticas.

Ratna Kandala, Niva Manchanda, Akshata Kishore Moharir + 1 more2026-03-06🤖 cs.AI

LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks

Este artículo presenta AIS-TGNN, un marco que combina redes de atención gráfica temporal con un modelo de lenguaje grande para predecir la congestión portuaria y generar explicaciones en lenguaje natural verificables, logrando un alto rendimiento predictivo y una consistencia direccional del 99,6% en los datos del puerto de Los Ángeles y Long Beach.

Zhiming Xue, Yujue Wang2026-03-06🤖 cs.AI

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Este artículo investiga las fortalezas y debilidades de los datos para la asistencia abierta en entornos corporificados, demostrando mediante un modelo multimodal fine-tuned en el dominio sintético de Overcooked que la generalización efectiva a comportamientos y configuraciones no vistos requiere conjuntos de datos diversos que abarquen la fundamentación multimodal, la inferencia de defectos y la exposición a múltiples escenarios.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

VISA: Value Injection via Shielded Adaptation for Personalized LLM Alignment

El artículo presenta VISA, un marco de adaptación en bucle cerrado que utiliza optimización de políticas para inyectar valores humanos de manera precisa en modelos de lenguaje grandes sin sacrificar su coherencia semántica ni sus capacidades generales, superando así las limitaciones de los métodos de ajuste fino tradicionales.

Jiawei Chen, Tianzhuo Yang, Guoxi Zhang + 3 more2026-03-06🤖 cs.AI

Multilevel Training for Kolmogorov Arnold Networks

Este artículo presenta un enfoque de entrenamiento multinivel para redes Kolmogorov-Arnold (KANs) que, al aprovechar su estructura basada en splines y establecer una equivalencia con MLPs, logra aceleraciones de entrenamiento de varios órdenes de magnitud y mejoras significativas en precisión, especialmente en redes neuronales informadas por física.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning

El artículo presenta SCoUT, un marco de aprendizaje por refuerzo multiagente que mejora la coordinación en entornos parcialmente observables mediante la agrupación temporal de agentes y el uso de ventajas contrafactuales para optimizar de forma escalable cuándo y con quién comunicarse.

Manav Vora, Gokul Puthumanaillam, Hiroyasu Tsukamoto + 1 more2026-03-06🤖 cs.AI

Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models

Este artículo presenta el marco de referencia DBC, un sistema de gobernanza en tiempo de inferencia basado en una taxonomía de 150 controles que reduce significativamente la exposición al riesgo en modelos de lenguaje grandes y mejora el cumplimiento normativo en comparación con los métodos tradicionales de moderación.

G. Madan Mohan, Veena Kiran Nambiar, Kiranmayee Janardhan2026-03-06🤖 cs.AI

An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production

Este artículo presenta un enfoque pionero para la adquisición simultánea de video de resonancia magnética en tiempo real, EEG y EMG superficial, junto con un pipeline de supresión de artefactos, con el fin de capturar integralmente la actividad cerebral, muscular y articular durante la producción del habla.

Jihwan Lee, Parsa Razmara, Kevin Huang + 16 more2026-03-06🤖 cs.AI

On Multi-Step Theorem Prediction via Non-Parametric Structural Priors

Este trabajo aborda el desafío de la predicción de teoremas multi-paso mediante un enfoque libre de entrenamiento que utiliza Grafos de Precedencia de Teoremas para imponer restricciones topológicas explícitas, logrando una precisión del 89,29% en el benchmark FormalGeo7k y superando significativamente a los métodos de aprendizaje en contexto estándar.

Junbo Zhao, Ting Zhang, Can Li + 3 more2026-03-06🤖 cs.AI

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

El artículo presenta ReCouPLe, un marco ligero que utiliza razonamientos en lenguaje natural para aprender recompensas robustas y causalmente consistentes a partir de preferencias, permitiendo la transferencia de conocimiento a nuevas tareas y superando a los métodos existentes en precisión y rendimiento bajo cambios de distribución.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation

K-Gen es un marco multimodal interpretable que utiliza modelos de lenguaje grandes para generar trayectorias realistas y diversas en la conducción autónoma mediante la predicción de puntos clave guiados por el razonamiento y la descripción visual del entorno, superando a los métodos existentes en los conjuntos de datos WOMD y nuPlan.

Mingxuan Mu, Guo Yang, Lei Chen + 2 more2026-03-06🤖 cs.AI

SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms

El marco SEA-TS presenta un agente autoevolutivo que genera y optimiza autónomamente algoritmos de pronóstico de series temporales mediante búsqueda MCTS, revisión de código y razonamiento global, logrando mejoras significativas en precisión y descubriendo patrones arquitectónicos novedosos que superan a los métodos manuales y de vanguardia.

Longkun Xu, Xiaochun Zhang, Qiantu Tuo + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Este estudio demuestra que es posible predecir con un 80,4% de precisión el tipo de lanzamiento de béisbol analizando únicamente la cinemática 3D del cuerpo del lanzador, revelando que la mecánica del torso y la muñeca son los factores más determinantes y estableciendo un límite empírico para la información que puede obtenerse antes de que la pelota sea lanzada.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

← Anterior Siguiente →