cs.LG artículos | Gist.Science

Astromer 2

El artículo presenta Astromer 2, un modelo fundacional mejorado para el análisis de curvas de luz que, tras ser preentrenado de forma auto-supervisada en 1.5 millones de curvas, supera significativamente a su predecesor y a modelos anteriores en tareas de clasificación con datos limitados, logrando una mejora del 15% en el conjunto de datos ATLAS gracias a sus robustas representaciones embebidas.

Cristobal Donoso-Oliva, Ignacio Becker, Pavlos Protopapas + 3 more2026-03-11🔭 astro-ph

When Machine Learning Gets Personal: Evaluating Prediction and Explanation

Este artículo propone un marco unificado para evaluar cómo la personalización de modelos de aprendizaje automático afecta de manera divergente tanto a la precisión predictiva como a la explicabilidad, derivando límites teóricos para detectar estos efectos en conjuntos de datos reales y destacando la necesidad de diseñar sistemas que permitan una evaluación conjunta y viable de ambos aspectos.

Louisa Cornelis, Guillermo Bernárdez, Haewon Jeong, Nina Miolane2026-03-11🤖 cs.LG

On the Impact of the Utility in Semivalue-based Data Valuation

Este artículo introduce la "firma espacial" de un conjunto de datos como una herramienta geométrica para evaluar y garantizar la robustez de la valoración de datos basada en semivalores frente a cambios en la función de utilidad, ofreciendo una métrica práctica para que los profesionales comprendan cómo estas variaciones afectan los resultados.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick Loiseau2026-03-11🤖 cs.AI

A Distributional Treatment of Real2Sim2Real for Object-Centric Agent Adaptation in Vision-Driven Deformable Linear Object Manipulation

Este artículo presenta un marco integrado de Real2Sim2Real para la manipulación de objetos lineales deformables que utiliza inferencia libre de verosimilitud para estimar distribuciones posteriores de parámetros físicos y entrenar políticas visuomotoras en simulación, logrando un rendimiento exitoso en el mundo real sin ajuste adicional.

Georgios Kamaras, Subramanian Ramamoorthy2026-03-11🤖 cs.LG

Improving clustering quality evaluation in noisy Gaussian mixtures

El artículo presenta el método de Reescalado de Importancia de Características (FIR), una técnica teóricamente fundamentada que mejora la evaluación de la calidad del agrupamiento en mezclas gaussianas ruidosas al ajustar las contribuciones de las características según su dispersión, lo que aumenta la correlación entre los índices de validez y la verdad fundamental incluso en entornos con características irrelevantes o alto ruido.

Renato Cordeiro de Amorim, Vladimir Makarenkov2026-03-11🤖 cs.LG

Functional Unit: A New Perspective on Materials Science Research Paradigms

Este artículo presenta el concepto de "unidades funcionales" como un puente esencial para integrar la comprensión tradicional de la relación estructura-propiedad con los nuevos paradigmas impulsados por la inteligencia artificial en la investigación de materiales.

Caichao Ye, Tao Feng, Weishu Liu + 1 more2026-03-11🔬 cond-mat.mtrl-sci

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

El artículo presenta HyConEx, un clasificador basado en hiperredes diseñado para datos tabulares que, de forma única, genera simultáneamente predicciones de clase y explicaciones contrafactuales locales en una sola red neuronal.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek Smieja2026-03-11🤖 cs.AI

Experiments with Optimal Model Trees

Este artículo presenta formulaciones de programación lineal entera mixta para construir árboles de modelos óptimos globalmente con máquinas de vectores de soporte lineales en las hojas, demostrando empíricamente que estos árboles alcanzan una precisión competitiva con estructuras mucho más pequeñas y interpretables en comparación con los métodos de crecimiento codicioso y otros algoritmos estándar.

Sabino Francesco Roselli, Eibe Frank2026-03-11🤖 cs.LG

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Este artículo propone un marco de evaluación de clasificación binaria basado en la teoría de la decisión y el uso de reglas de puntuación propias como la puntuación Brier, respaldado por una herramienta práctica en Python y una variante técnica mejorada, para superar la dependencia actual de métricas de umbral fijo en la literatura de aprendizaje automático.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. Wilson2026-03-11🤖 cs.AI

Concept Drift Guided LayerNorm Tuning for Efficient Multimodal Metaphor Identification

Este artículo presenta CDGLT, un marco eficiente y de alto rendimiento para la identificación de metáforas multimodales que utiliza el ajuste de Concept Drift y LayerNorm para superar las limitaciones de los métodos existentes y reducir los costos computacionales.

Wenhao Qian, Zhenzhen Hu, Zijie Song, Jia Li2026-03-11🤖 cs.LG

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

El artículo presenta SGPO, un marco de optimización de políticas que mitiga la limitación de GRPO de no aprender de grupos de respuestas incorrectas al introducir diversidad mediante un modelo juez paso a paso, logrando así mejorar el rendimiento de modelos de razonamiento al permitirles aprender de sus errores sin requerir soluciones correctas.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi Lin2026-03-11🤖 cs.AI

The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM

Este artículo presenta el GM-RBM, un modelo generativo que extiende los RBM tradicionales mediante unidades latentes categóricas de q estados (modelo de Potts), demostrando que esta arquitectura discreta mejora el rendimiento en tareas de memoria estructurada y razonamiento analógico en comparación con modelos de latentes continuos o binarios de capacidad equivalente.

Nikhil Kapasi, Mohamed Elfouly, William Whitehead, Luke Theogarajan2026-03-11🤖 cs.LG

JULI: Jailbreak Large Language Models by Self-Introspection

El artículo presenta JULI, un método que logra el jailbreak de modelos de lenguaje grandes mediante la manipulación de las probabilidades de registro de tokens utilizando un pequeño módulo llamado BiasNet, permitiendo atacar eficazmente modelos propietarios en configuración de caja negra sin necesidad de acceder a sus pesos internos.

Jesson Wang, Zhanhao Hu, David Wagner2026-03-11🤖 cs.LG

Discovering Symbolic Differential Equations with Symmetry Invariants

Este trabajo propone un método para descubrir ecuaciones diferenciales simbólicas a partir de datos utilizando invariantes de simetría como entidades atómicas, lo que garantiza que las ecuaciones halladas respeten las leyes físicas y mejore la precisión y eficiencia de las técnicas existentes.

Jianke Yang, Manu Bhat, Bryan Hu, Yadi Cao, Nima Dehmamy, Robin Walters, Rose Yu2026-03-11🤖 cs.LG

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

El artículo presenta UltraEdit, un método de edición de modelos de lenguaje sin entrenamiento, sujeto ni memoria que logra actualizaciones rápidas y escalables con bajo consumo de recursos, superando a los enfoques anteriores y validándose mediante un nuevo conjunto de datos masivo llamado UltraEditBench.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Este artículo presenta una metodología sistemática para evaluar modelos de lenguaje grandes en dispositivos de borde, demostrando que los modelos grandes altamente cuantizados superan a los modelos más pequeños de alta precisión y ofreciendo directrices para optimizar su rendimiento bajo restricciones de recursos.

Qingyu Song, Rui Liu, Wei Lin, Peiyu Liao, Wenqian Zhao, Yiwen Wang, Shoubo Hu, Yining Jiang, Mochun Long, Hui-Ling Zhen, Ning Jiang, Mingxuan Yuan, Qiao Xiang, Hong Xu2026-03-11🤖 cs.LG

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

El artículo presenta Saturn, un marco de aprendizaje por refuerzo basado en problemas de satisfacibilidad booleana (SAT) que supera las limitaciones de escalabilidad, verificabilidad y control de dificultad de las tareas existentes, logrando mejoras significativas en las capacidades de razonamiento de modelos de lenguaje grandes tanto en problemas SAT como en tareas matemáticas y de programación.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong Dong2026-03-11🤖 cs.AI

FrontierCO: Real-World and Large-Scale Evaluation of Machine Learning Solvers for Combinatorial Optimization

El artículo presenta FrontierCO, un benchmark de gran escala y estructura realista para evaluar solvers de optimización combinatoria basados en aprendizaje automático, revelando una brecha de rendimiento persistente frente a los métodos clásicos en instancias masivas y complejas, aunque identificando casos donde los enfoques de ML superan a los tradicionales.

Shengyu Feng, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming Yang2026-03-11🤖 cs.LG

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Este artículo presenta la primera revisión sistemática sobre la integración de modelos fundacionales en la robótica de servicio móvil, analizando cómo estas tecnologías abordan desafíos técnicos clave, habilitan aplicaciones en entornos reales y plantean consideraciones éticas y futuras para el desarrollo de robots autónomos seguros y adaptables.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL

Semi-Supervised Conformal Prediction With Unlabeled Nonconformity Score

El artículo presenta SemiCP, un nuevo marco de predicción conformada semi-supervisado que utiliza puntuaciones de no conformidad basadas en la coincidencia de vecinos más cercanos (NNM) para aprovechar datos no etiquetados y reducir significativamente la brecha de cobertura cuando los datos etiquetados son escasos.

Xuanning Zhou, Zihao Shi, Hao Zeng, Xiaobo Xia, Bingyi Jing, Hongxin Wei2026-03-11🤖 cs.LG

← Anterior Siguiente →