Integrating Heterogeneous Information in Randomized Experiments: A Unified Calibration Framework

Cet article propose un cadre d'étalonnage unifié pour intégrer de manière cohérente des informations hétérogènes, telles que des données externes ou des prédictions d'apprentissage automatique, dans les expériences randomisées adaptatives, garantissant ainsi une estimation plus précise des effets de traitement sans compromettre la validité asymptotique.

Wei Ma, Zeqi Wu, Zheng ZhangTue, 10 Ma🔢 math

Quadratic form of heavy-tailed self-normalized random vector with applications in α\alpha-heavy Mar\v cenko--Pastur law

Cet article établit la loi asymptotique des formes quadratiques de vecteurs auto-normalisés à queue lourde, démontrant que leur comportement limite est gouverné par la distribution des termes diagonaux et l'indice de stabilité α\alpha, ce qui permet de caractériser la loi de Marčenko–Pastur α\alpha-lourde pour les matrices de corrélation d'échantillons et de prouver l'absence d'atomes dans sa loi spectrale.

Zhaorui Dong, Johannes Heiny, Jianfeng YaoTue, 10 Ma🔢 math

Maximal Ancillarity, Semiparametric Efficiency, and the Elimination of Nuisances

Cet article résout le problème de l'unicité des sous-σ-champs ancillaires maximaux en adoptant une perspective asymptotique de type Hájek-Le Cam, démontrant que les procédures semi-paramétriquement efficaces peuvent être rendues mesurables par rapport à des sous-σ-champs ancillaires localement maximaux qui éliminent les paramètres de nuisance sans les estimer, tout en atteignant les bornes d'efficacité grâce à des rangs et signes résiduels « du centre vers l'extérieur » dans le cadre des expériences localement asymptotiquement normales.

Marc Hallin, Bas J. M. Werker, Bo ZhouTue, 10 Ma🔢 math

Dirichlet kernel density estimation on the simplex with missing data

Cet article propose et analyse un estimateur de densité non paramétrique basé sur un noyau de Dirichlet adaptatif et un pondération par probabilité inverse pour estimer la densité de données compositionnelles sur le simplexe en présence de données manquantes, démontrant ainsi sa supériorité par rapport aux méthodes de transformation log-ratio et son applicabilité à des données réelles de composition leucocytaire.

Hanen Daayeb, Wissem Jedidi, Salah Khardani, Guanjie Lyu, Frédéric OuimetTue, 10 Ma🔢 math

Group-Sparse Smoothing for Longitudinal Models with Time-Varying Coefficients

Cet article propose TV-Select, un cadre unifié basé sur une pénalisation double (Lasso de groupe et lissage) pour identifier simultanément les variables pertinentes et déterminer si leurs effets dans les modèles longitudinaux sont constants ou variables dans le temps, surmontant ainsi les limites des modèles linéaires mixtes et des modèles à coefficients variables.

Yu Lu, Tianni Zhang, Yuyao Wang, Mengfei RanTue, 10 Ma🔢 math

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Cette article propose une analyse théorique et empirique des méthodes d'inférence parallèle pour les grands modèles de langage en les modélisant comme des algorithmes de filtrage particulaire, révélant à la fois des garanties de précision non asymptotiques et des limites fondamentales inhérentes à ces approches.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay KrishnamurthyTue, 10 Ma🤖 cs.LG

Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems

Ce papier établit des critères pour déterminer l'identifiabilité du signe des effets causaux dans des systèmes dynamiques stochastiques linéaires stationnaires à temps continu, en relaxant l'hypothèse d'une matrice de diffusion connue et en se concentrant sur la détermination du signe des coefficients de dérive à partir de la matrice de covariance observationnelle.

Gijs van Seeventer, Saber SalehkaleybarTue, 10 Ma🤖 cs.LG

Size-Location Correlation for Set-Valued Processes: Theory, Estimation, and Laws of Large Numbers under ρ\rho-Mixing

Cet article propose un cadre variationnel fondé sur la décomposition paire-impair des fonctions de support pour analyser la corrélation entre la taille et la localisation des processus à valeurs ensemblistes, permettant d'établir des lois des grands nombres sous mélange ρ\rho et de définir des indices de dépendance géométriquement interprétables et invariants par translation.

Tuyen Luc TriTue, 10 Ma🔢 math

Limiting Spectral Distribution of moderately large Kendall's correlation matrix and its application

Cet article établit la distribution spectrale limite des matrices de corrélation de Kendall dans un régime de haute dimension modérée avec des observations indépendantes mais non nécessairement identiquement distribuées, démontrant comment l'hétérogénéité distributionnelle influence le spectre et proposant un outil graphique pour détecter les dépendances tout en évitant les fausses détections causées par le non-respect de cette hétérogénéité.

Raunak Shevade, Monika BhattacharjeeTue, 10 Ma🔢 math

Minimax estimation for Varying Coefficient Model via Laguerre Series

Cet article propose un estimateur basé sur les séries de Laguerre pour les modèles à coefficients variables qui atteint des taux de convergence minimax optimaux, tout en établissant la normalité asymptotique et en permettant la construction d'intervalles de confiance et de tests d'hypothèses, comme le démontrent des études de simulation et une application sur données réelles.

Rida Benhaddou, Khalid Chokri, Jackson PinschenatTue, 10 Ma🔢 math

Bayesian inference of planted matchings: Local posterior approximation and infinite-volume limit

Cet article établit que l'inférence bayésienne d'un couplage planté entre deux ensembles de points corrélés en dimension un admet une approximation locale et une limite infinie bien définie pour le couplage partiel grâce à la décroissance des corrélations, tandis que le cas du couplage exact nécessite un tri global et une indexation spécifique basée sur un flot pour définir sa limite asymptotique.

Zhou Fan, Timothy L. H. Wee, Kaylee Y. YangTue, 10 Ma🔢 math

Asymptotics of cut distributions and robust modular inference using Posterior Bootstrap

Cet article étudie les distributions coupées sous un angle asymptotique en établissant un théorème de Bernstein-von Mises et une approximation de Laplace, puis propose un algorithme basé sur le Posterior Bootstrap pour obtenir des régions de crédibilité avec une couverture fréquentiste asymptotique nominale, offrant ainsi une inférence modulaire robuste face aux erreurs de spécification du modèle.

Emilia Pompe, Pierre E. Jacob, Mikołaj J. KasprzakThu, 12 Ma📊 stat