cs.LG artículos | Gist.Science

Quantifying Memorization and Privacy Risks in Genomic Language Models

Este artículo presenta un marco de evaluación de privacidad multi-vectorial diseñado para cuantificar y auditar los riesgos de memorización en modelos de lenguaje genómico, demostrando que estos sistemas pueden memorizar secuencias sensibles y que se requiere una auditoría combinada para evaluar dicha vulnerabilidad de manera integral.

Alexander Nemecek, Wenbiao Li, Xiaoqian Jiang, Jaideep Vaidya, Erman Ayday2026-03-11🤖 cs.LG

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Este artículo propone un enfoque totalmente diferenciable para descubrir boletos de lotería fuertes (SLT) mediante el uso de puertas de Bernoulli relajadas continuamente, lo que permite optimizar la esparsidad de redes neuronales sobreparametrizadas sin entrenamiento de pesos y lograr hasta un 90% de reducción de parámetros con mínima pérdida de precisión.

Itamar Tsayag, Ofir Lindenbaum2026-03-11🤖 cs.AI

Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning

El artículo presenta MedCBR, un marco de razonamiento basado en conceptos que integra guías clínicas y modelos de lenguaje-visión para mejorar la interpretabilidad y el rendimiento diagnóstico en imágenes médicas mediante la generación de narrativas clínicas estructuradas.

Mohamed Harmanani, Bining Long, Zhuoxin Guo, Paul F. R. Wilson, Amirhossein Sabour, Minh Nguyen Nhat To, Gabor Fichtinger, Purang Abolmaesumi, Parvin Mousavi2026-03-11🤖 cs.LG

Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

Este artículo propone un marco de aprendizaje por refuerzo jerárquico asistido por gemelo digital que optimiza conjuntamente la política de ajuste de inclinación de antenas y la estrategia de recolección de datos en redes móviles, logrando reducir la latencia de recopilación de datos físicos hasta un 28,01% en comparación con métodos existentes.

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe Chen2026-03-11🤖 cs.LG

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

El sistema Guardian presenta un marco de decisión interpretable que combina cadenas de Markov, aprendizaje por refuerzo y validación mediante modelos de lenguaje grandes para generar planes de búsqueda óptimos y dinámicos para casos de niños desaparecidos durante las primeras 72 horas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

El artículo presenta BiCLIP, un marco sencillo y eficiente que mejora la adaptación de dominios en modelos de visión y lenguaje mediante una transformación geométrica canónica aprendida a partir de pocas muestras, logrando resultados de vanguardia en múltiples benchmarks.

Pranav Mantini, Shishir K. Shah2026-03-11🤖 cs.AI

Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel

El artículo presenta ULFS-KDPE, un estimador de plug-in sesgado basado en un modelo desfavorable universal dentro de un espacio de Hilbert de núcleo reproductor (RKHS), que permite estimar parámetros diferenciables en modelos no paramétricos alcanzando la eficiencia semiparamétrica sin necesidad de derivar ni evaluar explícitamente las funciones de influencia eficiente.

Haiyi Chen, Yang Liu, Ivana Malenica2026-03-11🤖 cs.LG

Towards Reliable Simulation-based Inference

Esta tesis aborda la fiabilidad de la inferencia basada en simulaciones mediante el desarrollo de criterios para diagnosticar la sobreconfianza en aproximaciones de aprendizaje automático y la propuesta de técnicas como el "balancing" y redes neuronales bayesianas para mitigar este problema y obtener conclusiones estadísticas mejor calibradas.

Arnaud Delaunoy2026-03-11🤖 cs.LG

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

El artículo presenta a Guardian, un sistema de tubería multi-LLM que utiliza modelos especializados y un mecanismo de consenso, junto con ajuste fino QLoRA, para extraer y procesar información de manera auditable y coordinada durante las primeras 72 horas críticas de investigaciones de personas desaparecidas.

Joshua Castillo, Ravi Mukkamala2026-03-11🤖 cs.AI

A Survey of Reinforcement Learning For Economics

Esta encuesta introduce los métodos de aprendizaje por refuerzo a los economistas como una extensión basada en muestras de la programación dinámica que permite resolver modelos de alta dimensión y complejos, al tiempo que advierte sobre sus limitaciones prácticas como la ineficiencia en el uso de datos y la dependencia de simuladores precisos.

Pranjal Rawat2026-03-11🤖 cs.LG

The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference

El artículo introduce la desigualdad $qs$ , un criterio que demuestra cómo la fragmentación de la reutilización de memoria en los modelos de Mezcla de Expertos (MoE) genera una doble penalización en la inferencia de contexto largo, volviéndolos estructuralmente menos eficientes que sus contrapartes densas de calidad equivalente.

Vignesh Adhinarayanan, Nuwan Jayasena2026-03-11🤖 cs.LG

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

El artículo presenta Semantic Level of Detail (SLoD), un marco que utiliza la difusión del núcleo de calor en variedades hiperbólicas para establecer una operación de zoom continua que controla la resolución semántica, identifica automáticamente los límites entre niveles de abstracción mediante brechas espectrales y demuestra su eficacia para descubrir jerarquías significativas en grafos de conocimiento reales como WordNet.

Edward Izgorodin2026-03-11🤖 cs.AI

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

El artículo presenta MAcPNN, un paradigma de aprendizaje mutuo inspirado en la teoría sociocultural de Vygotsky que utiliza redes neuronales progresivas continuas (cPNN) en dispositivos IoT autónomos para mejorar el rendimiento en flujos de datos mediante la colaboración selectiva ante cambios de concepto, reduciendo así la necesidad de comunicación constante en comparación con el aprendizaje federado.

Federico Giannini, Emanuele Della Valle2026-03-11🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

El artículo presenta un enfoque axiomático para procesos de decisión de Markov robustos en espacios de Borel que, mediante conjuntos de ambigüedad basados en distancias empíricas, garantiza la convergencia y ofrece cotas de rendimiento fuera de muestra con alta probabilidad para tamaños de muestra finitos, superando así las limitaciones de los MDPs empíricos tradicionales.

Sivaramakrishnan Ramani2026-03-11✓ Author reviewed ⓘ🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

El artículo presenta MAPLE, un nuevo paradigma de entrenamiento que integra modelos de recompensa de proceso médico con el aprendizaje por refuerzo en tiempo de prueba para superar las limitaciones del voto mayoritario y mejorar el razonamiento clínico mediante una supervisión alineada con expertos.

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning Guo2026-03-11🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

Este libro reinterpreta la inteligencia artificial generativa desde la estadística, utilizando el *flow matching* como marco central para transformar tareas como la imputación de datos y el análisis causal en problemas de inferencia estadística rigurosa mediante la estimación de distribuciones de probabilidad y el mantenimiento de la validez inferencial.

Shinto Eguchi2026-03-11🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

El artículo propone Normalized Flow Matching (NFM), un método que mejora el entrenamiento de modelos generadores de flujo mediante la destilación de acoplamientos adaptativos de modelos de flujo normalizado preentrenados, logrando un rendimiento superior tanto a los flujos entrenados con acoplamientos independientes u óptimos como al propio modelo docente.

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei Zhai2026-03-11🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

Este trabajo propone una medida de planitud exacta y arquitectónicamente fiel para redes neuronales convolucionales, derivada de una expresión en forma cerrada del trazo de la Hessiana, que permite estimar con mayor precisión el rendimiento de generalización y guiar decisiones de diseño y entrenamiento.

Rahman Taleghani, Maryam Mohammadi, Francesco Marchetti2026-03-11🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

El artículo presenta CALIPER, un método agnóstico a modelos y detectores que utiliza únicamente datos para determinar cuándo la cantidad de información post-desplazamiento es suficiente para reentrenar un predictor de manera estable, cerrando así la brecha entre la detección de desplazamiento y la adaptación basada en datos en el aprendizaje en flujo.

Ren Fujiwara, Yasuko Matsubara, Yasushi Sakurai2026-03-11🤖 cs.LG

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

El marco EPIC aborda los desafíos de la implementación centralizada del aprendizaje automático científico en entornos distribuidos mediante un enfoque de codificación local ligera y decodificación consciente de la física, logrando reducciones significativas en la latencia y el consumo de energía mientras mejora la fidelidad de reconstrucción en tareas como la inversión de onda completa.

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei Yang2026-03-11🤖 cs.LG

← Anterior Siguiente →

cs.LG