cs.LG artículos | Gist.Science

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Este estudio presenta un marco de entrenamiento centrado en datos de alta calidad y verificación de dificultad que, mediante destilación y ajuste fino, permite que el modelo ODA-Fin-RL-8B supere a los modelos financieros de código abierto más avanzados en diversas tareas financieras.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

LightMedSeg es una arquitectura de segmentación médica 3D ligera y eficiente que integra priores anatómicos y mecanismos de modulación adaptativa para lograr una precisión comparable a los modelos basados en transformadores, pero con una fracción de los parámetros y costos computacionales.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Este artículo propone y valida un método mejorado de regresión rango-rango condicional (CRRR) mediante modelos de transformación condicional profundos (DCTM) y cross-fitting para estimar la movilidad intergeneracional con mayor precisión en escenarios no lineales y con resultados discretos, demostrando su eficacia tanto en simulaciones como en aplicaciones empíricas sobre ingresos en EE. UU. y movilidad educativa en la India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

El artículo presenta PT-RAG, un marco novedoso de generación aumentada por recuperación que utiliza un proceso de dos etapas con recuperación diferenciable y consciente del tipo celular para superar las limitaciones de generalización de los enfoques actuales y predecir con mayor precisión las respuestas celulares a las perturbaciones genéticas.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

El artículo presenta WeDas, un marco que mejora a los agentes de investigación profunda al integrar las características estructurales de la distribución de contenido web y utilizar un mecanismo de sondeo para alinear dinámicamente las intenciones de razonamiento con los resultados de búsqueda, superando así las limitaciones de los enfoques actuales.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Este estudio presenta el marco LF2L, un enfoque de aprendizaje federado horizontal con fusión de pérdidas que integra datos heterogéneos de Taiwan y EE. UU. para predecir eficazmente el cáncer secundario primario preservando la privacidad y superando a los métodos tradicionales.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Este artículo propone dos métodos de aprendizaje simbólico, SyNF y SyTF, que generan ecuaciones algebraicas interpretables para pronosticar series temporales caóticas con una precisión competitiva frente a modelos de caja negra, permitiendo así una comprensión transparente de las dinámicas subyacentes en aplicaciones como la incidencia de dengue y el índice Niño 3.4.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Este artículo propone un marco de aprendizaje por refuerzo multiobjetivo adaptativo que integra la predicción individualizada de ausencias con un mecanismo de coevolución de políticas para optimizar dinámicamente las decisiones de doble reserva en clínicas ambulatorias, mejorando así la eficiencia operativa y la equidad en la atención.

Ninda Nurseha Amalina, Heungjo An2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

El artículo presenta los Mapas de Flujo Variacionales (VFMs), un marco que permite la generación condicional de imágenes de alta calidad en un solo paso mediante el aprendizaje de una distribución de ruido inicial adaptada a la observación, superando así las limitaciones de los modelos iterativos tradicionales.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

Fast and Flexible Audio Bandwidth Extension via Vocos

Este trabajo presenta un modelo de extensión de ancho de banda basado en Vocos que genera contenido de alta frecuencia faltante para audio de 8-48 kHz mediante un único red neuronal y un refinador ligero, logrando una calidad competitiva con un rendimiento en tiempo real extremo en GPU y CPU.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Este artículo propone un marco basado en la Transformada de Fourier Generalizada para descubrir subgrupos continuos de simetría mediante la detección de patrones de dispersión espectral inducidos por la invariancia, ofreciendo una alternativa interpretable a los métodos tradicionales de optimización de generadores.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

El artículo presenta AutoResearch-RL, un marco de aprendizaje por refuerzo que permite a un agente autónomo descubrir y optimizar arquitecturas neuronales y hiperparámetros de forma perpetua sin supervisión humana, logrando resultados competitivos frente a configuraciones manuales tras cientos de iteraciones.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Este artículo presenta un nuevo marco de predicción de rendimientos de cultivos a nivel de condado que combina una arquitectura de modelo multi-escala con una estrategia de adaptación basada en recuperación para superar las limitaciones de generalización espacial y temporal de los métodos existentes.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

El artículo presenta StructSAM, un marco de fusión y recuperación de tokens que preserva la estructura y el espectro para optimizar los modelos Segment Anything (SAM) mediante la reducción de costos computacionales sin sacrificar significativamente la precisión en la segmentación de bordes.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Este artículo presenta un marco teórico y empírico para entrenar políticas robustas en entornos parcialmente observables mediante un POMDP adversario que selecciona distribuciones latentes iniciales, demostrando que la exposición estructurada a estas distribuciones reduce significativamente las brechas de robustez y valida principios diagnósticos con garantías finitas.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Este artículo explora la propuesta inusual de asignar a una inteligencia artificial avanzada el objetivo principal de ser apagada para mitigar el riesgo de que se resista a ser desactivada, analizando las condiciones bajo las cuales esta estrategia podría ser viable.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

El artículo presenta ShakyPrepend, un nuevo algoritmo de aprendizaje multi-grupo que utiliza herramientas inspiradas en la privacidad diferencial para mejorar los garantías teóricas y adaptarse a la estructura de grupos y la heterogeneidad espacial en entornos prácticos.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

El marco de Transición de Jerarquía de Normas (NHT) explica que el aprendizaje tardío de representaciones estructuradas y el fenómeno de "grokking" en redes neuronales surgen de la lenta traversía, impulsada por la regularización, desde soluciones de alto nivel basadas en atajos hacia representaciones de menor nivel, donde el retraso en esta transición crece logarítmicamente con la relación entre las normas de los atajos y las estructuras.

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Este artículo presenta un método de detección de interferencias para redes 5G basado en la Máquina Tsetlin Convolucional (CTM) que, al operar directamente sobre señales de sincronización, ofrece una solución interpretable y eficiente en hardware con un entrenamiento 9,5 veces más rápido y un uso de memoria 14 veces menor que las redes neuronales convolucionales, validada experimentalmente en un entorno de prueba real y proyectada para su implementación en FPGAs.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

Este artículo presenta el Mecanismo de Conceptos (M-CBM), un nuevo enfoque para Modelos de Cuello de Botella Conceptual que extrae y nombra conceptos directamente de un modelo de caja negra mediante Autoencoders Dispersos y LLMs multimodales, logrando así un rendimiento superior y explicaciones más concisas que los métodos anteriores al controlar rigurosamente la fuga de información.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

← Anterior Siguiente →