Highly Efficient and Effective LLMs with Multi-Boolean Architectures

Este trabajo propone un marco innovador que representa los modelos de lenguaje grandes con parámetros booleanos multi-núcleo y permite su ajuste fino directo en el dominio booleano sin necesidad de pesos latentes, logrando así una mayor capacidad de representación y una reducción drástica de la complejidad en comparación con las técnicas de cuantización y binarización existentes.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

Este artículo presenta BWFlow, un marco de flujo de emparejamiento para la generación de grafos que supera las limitaciones de los métodos actuales al modelar la evolución conjunta de nodos y arcos mediante campos aleatorios de Markov y transporte óptimo, logrando así trayectorias de probabilidad más suaves, una mejor convergencia en el entrenamiento y una generación más eficiente.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings

El estudio demuestra que los rankings de los principales modelos de lenguaje son extremadamente sensibles a la eliminación de una fracción mínima de datos de preferencia, revelando que las evaluaciones de Chatbot Arena son más vulnerables a estos cambios que las de MT-bench, sin que exista una diferencia sistemática de robustez entre las evaluaciones humanas crowdsourced y las realizadas por modelos de lenguaje.

Jenny Y. Huang, Yunyi Shen, Dennis Wei + 1 more2026-03-06💻 cs

Generalization Below the Edge of Stability: The Role of Data Geometry

Este artículo demuestra teóricamente que la geometría de los datos determina el sesgo implícito en redes neuronales ReLU sobreparametrizadas entrenadas por debajo del umbral de estabilidad, donde distribuciones difíciles de "fragmentar" favorecen la generalización al capturar patrones compartidos, mientras que aquellas fácilmente fragmentables (como las apoyadas en la esfera) conducen a la memorización.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

Machine Learning for Complex Systems Dynamics: Detecting Bifurcations in Dynamical Systems with Deep Neural Networks

Este estudio propone el uso de Redes Neuronales Equilibradas (EINNs) para detectar de manera eficiente umbrales críticos y transiciones abruptas en sistemas dinámicos complejos, invirtiendo el proceso tradicional al inferir parámetros a partir de estados de equilibrio y así identificar regiones de inestabilidad sin necesidad de simulaciones exhaustivas.

Swadesh Pal, Roderick Melnik2026-03-06🔢 math

Dictionary Based Pattern Entropy for Causal Direction Discovery

Este artículo presenta el marco de Entropía de Patrones Basada en Diccionario (DPE), una metodología novedosa que integra la Teoría de la Información Algorítmica y la de Shannon para inferir la dirección causal en secuencias simbólicas mediante la identificación de patrones deterministas que reducen la incertidumbre, demostrando un rendimiento robusto y superior en diversos sistemas sintéticos y datos biológicos.

Harikrishnan N B, Shubham Bhilare, Aditi Kathpalia + 1 more2026-03-06🔢 math

Bayesian Modeling of Collatz Stopping Times: A Probabilistic Machine Learning Perspective

Este estudio analiza los tiempos de parada totales de la conjetura de Collatz mediante un enfoque de aprendizaje automático bayesiano, demostrando que un modelo de regresión binomial negativa jerárquica supera a los generadores mecánicos basados en descomposición de bloques, aunque la incorporación de la estructura modular baja mejora significativamente el ajuste de estos últimos.

Nicolò Bonacorsi, Matteo Bordoni2026-03-06🔢 math