A Semiparametric Nonlinear Mixed Effects Model with Penalized Splines Using Automatic Differentiation

Este artículo presenta un procedimiento de estimación semiparamétrico para modelos de efectos mixtos no lineales que utiliza splines penalizados y diferenciación automática mediante Template Model Builder, logrando un mejor rendimiento inferencial y una menor carga computacional en comparación con métodos existentes, como se demuestra en un estudio sobre el crecimiento de la altura en lactantes.

Matteo D'Alessandro, Magne Thoresen, Øystein SørensenFri, 13 Ma📊 stat

Including historical control data in simultaneous inference for pre-clinical multi-arm studies

Este artículo propone enfoques bayesianos que integran datos de controles históricos mediante intervalos creíbles simultáneos para reducir el tamaño de la muestra del grupo control en estudios de carcinogenicidad a largo plazo, logrando disminuir el uso de animales sin comprometer el control de la tasa de error familiar.

Max Menssen, Carsten Kneuer, Gyamfi Akyianu, Christian Röver, Tim Friede, Frank SchaarschmidtFri, 13 Ma📊 stat

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

Este artículo presenta un algoritmo de aprendizaje social basado en energía libre para el problema de la bandaits, que permite a un agente evaluar y aprovechar la experiencia de otros agentes diversos (incluyendo no expertos) sin conocer sus recompensas, logrando convergencia óptima y un arrepentimiento logarítmico superior a los métodos existentes.

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for mm-Set Semi-Bandit Problem

Este artículo demuestra que la política Follow-the-Perturbed-Leader (FTPL) con distribuciones de Fréchet y Pareto, combinada con una nueva técnica de muestreo geométrico condicional, alcanza óptimos garantizados de "mejor de ambos mundos" (regresión óptima en entornos adversarios y logarítmica en estocásticos) para el problema de semi-brazos de mm-conjuntos, reduciendo además su complejidad computacional de O(d2)O(d^2) a O(md(log(d/m)+1))O(md(\log(d/m)+1)).

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

Este artículo analiza el colapso de modelos en la generación de lenguaje desde una perspectiva teórica del aprendizaje, demostrando que la repetición de salidas generadas por el modelo en el entrenamiento limita fundamentalmente ciertos tipos de generación mientras que sus resultados positivos validan heurísticas prácticas como la limpieza de datos y el filtrado de salidas.

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

Robust Sequential Hypothesis Testing with Generalized Estimating Equations

Este artículo presenta un nuevo enfoque para la prueba de hipótesis secuencial robusta en datos longitudinales y correlacionados en grupos, que utiliza ecuaciones de estimación generalizadas para evaluar un rango más amplio de hipótesis sin depender de supuestos de modelado restrictivos, permitiendo además el manejo de datos incompletos mediante imputación múltiple.

Nathan T. Provost, Abdus S. WahedFri, 13 Ma📊 stat

Causal Representation Learning with Optimal Compression under Complex Treatments

Este artículo propone un nuevo límite de generalización y un estimador teórico para pesos de balanceo óptimos en escenarios de múltiples tratamientos, introduciendo la estrategia de Agregación de Tratamientos y el modelo generativo Multi-Treatment CausalEGM para lograr una precisión superior y una escalabilidad constante que supera a los modelos tradicionales.

Wanting Liang, Haoang Chi, Zhiheng ZhangFri, 13 Ma📊 stat

Distributionally balanced sampling designs

Este artículo propone los Diseños Muestreales Balanceados Distribucionalmente (DBD), una nueva clase de diseños de muestreo probabilístico que maximizan la representatividad al minimizar la discrepancia entre las distribuciones auxiliares de la muestra y la población, logrando así una mejor precisión en estimaciones que métodos existentes, especialmente en aplicaciones de ciencias ambientales con datos costosos.

Anton Grafström, Wilmer PrentiusFri, 13 Ma📊 stat

Bayesian Model Calibration with Integrated Discrepancy: Addressing Inexact Dislocation Dynamics Models

Este trabajo presenta un nuevo enfoque de calibración bayesiana que integra la discrepancia del modelo dentro del simulador mediante procesos gaussianos, demostrando su eficacia al calibrar un modelo de dinámica de dislocaciones discretas frente a observaciones de dinámica molecular y diferenciándolo del método tradicional de Kennedy y O'Hagan.

Liam Myhill, Enrique Martinez Saez, Sez RusscherFri, 13 Ma📊 stat

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

Este artículo presenta la Incrustación Espectral Adyacente Local (LASE), un método que descubre estructuras de baja dimensión local en redes mediante una descomposición espectral ponderada, superando las limitaciones de los enfoques globales al reducir el error de truncamiento y mejorar la reconstrucción y visualización de características locales.

Hannah Sansford, Nick Whiteley, Patrick Rubin-DelanchyFri, 13 Ma📊 stat

On-Average Stability of Multipass Preconditioned SGD and Effective Dimension

Este artículo establece un marco de estabilidad algorítmica promedio para el descenso de gradiente estocástico precondicionado multipaso, demostrando cómo la elección del precondicionador afecta la dimensión efectiva y el riesgo de generalización, y proporcionando límites superiores e inferiores coincidentes que vinculan la curvatura del riesgo poblacional con la geometría del ruido.

Simon Vary, Tyler Farghly, Ilja Kuzborskij, Patrick RebeschiniFri, 13 Ma📊 stat

Low-Rank and Sparse Drift Estimation for High-Dimensional Lévy-Driven Ornstein--Uhlenbeck Processes

Este artículo presenta un estimador convexo que combina penalizaciones de norma nuclear y 1\ell_1 para recuperar la estructura de baja rango y dispersa en la matriz de deriva de procesos de Ornstein-Uhlenbeck de alta dimensión impulsados por ruido de Lévy, demostrando mediante una desigualdad oráculo no asintótica que dicha estructura mejora la dependencia de la dimensión en comparación con los estimadores puramente dispersos.

Marina PalaistiFri, 13 Ma📊 stat

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Este artículo demuestra matemáticamente y mediante experimentos numéricos que las redes de reacciones químicas sin capas ocultas pueden aprender tareas de clasificación más eficiente y con mayor precisión que las redes neuronales de spiking que requieren capas ocultas, ofreciendo una explicación teórica sobre la posible superioridad del aprendizaje en redes bioquímicas celulares frente a las neuronales.

Sophie Jaffard, Ivo F. SbalzariniFri, 13 Ma📊 stat

A Quantitative Characterization of Forgetting in Post-Training

Este trabajo proporciona una caracterización cuantitativa del olvido en el entrenamiento continuo de modelos generativos, demostrando teóricamente que los objetivos de divergencia KL inversa evitan el colapso de la masa de tareas anteriores y limitan el desplazamiento de componentes mediante la superposición de distribuciones, a diferencia de la KL directa que conduce al olvido masivo.

Krishnakumar Balasubramanian, Shiva Prasad KasiviswanathanFri, 13 Ma📊 stat