stat.ME 편의 논문 | Gist.Science

AgroDesign: A Design-Aware Statistical Inference Framework for Agricultural Experiments in Python

이 논문은 농업 실험의 설계 semantics 를 계산에 통합하여 수동적 모델링 선택을 최소화하고 추론의 정확성과 재현성을 향상시키는 새로운 파이썬 프레임워크인 'AgroDesign'을 제안합니다.

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

본 논문은 제한된 데이터와 다양한 운영 조건 하에서 위성 전자기기의 온궤도 신뢰성 예측 정확도를 향상시키기 위해, Wiener 과정 기반의 고장 모델과 공간적 상관관계를 통합한 적응형 능동 학습 프레임워크를 제안합니다.

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Distribution-free screening of spatially variable genes in spatial transcriptomics

이 논문은 공간 전사체 데이터의 고차원성과 3 차원 구조를 고려하여 새로운 준-우도비 통계량인 MM-test 와 Knockoff 절차를 결합한 분포 무관 공간 변이 유전자 선별 방법을 제안하고, 이를 통해 기존 방법보다 우수한 성능과 이론적 보장을 입증했습니다.

Changhu Wang, Qiyun Huang, Zihao Chen, Jin Liu, Ruibin XiWed, 11 Ma📊 stat

Contrastive Bayesian Inference for Unnormalized Models

이 논문은 정형화 상수를 평가할 필요 없이 노이즈 대비 추정 (NCE) 과 Pólya-Gamma 데이터 증강을 결합하여 비정규화 모델에 대한 완전한 베이지안 추론 프레임워크를 제안하고, 이를 통해 시간 변화 밀도 모델 및 희소 토러스 그래프 모델에서 정확한 점 추정과 원칙적인 불확실성 정량화를 가능하게 합니다.

Naruki Sonobe, Shonosuke Sugasawa, Daichi Mochihashi, Takeru MatsudaWed, 11 Ma📊 stat

Anomaly detection using surprisals

이 논문은 복잡한 다변량 데이터의 이상 탐지를 단일 변수 '서프라이설' 분포의 꼬리 확률 추정 문제로 환원시키는 통합 프레임워크를 제안하고, 경험적 추정과 극값 이론 기반의 두 가지 강건한 방법을 통해 모델 오지정 하에서도 효과적인 이상 탐지가 가능함을 보여줍니다.

Rob J Hyndman, David T. FrazierWed, 11 Ma📊 stat

MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation

이 논문은 과분산 및 복잡한 평균 - 분산 관계를 가진 데이터를 위해 트위디와 음이항 분포를 기반으로 한 전통적 및 볼록 NMF 를 위한 통합 MM 알고리즘 프레임워크를 개발하고, R 패키지 `nmfgenr` 을 통해 구현하여 다양한 실증 데이터를 통해 그 유효성을 입증합니다.

Elisabeth Sommer James, Asger Hobolth, Marta PelizzolaWed, 11 Ma🤖 cs.LG

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

이 논문은 제조 시스템의 이질적 데이터 소스를 효과적으로 활용하기 위해 다중 태스크 학습과 다중 정밀도 모델링을 통합한 계층적 가우시안 프로세스 기반 대리 모델링 프레임워크를 제안하고, 기존 방법 대비 예측 정확도를 크게 향상시키는 것을 입증합니다.

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui ShaoWed, 11 Ma🤖 cs.LG

A Bayesian adaptive enrichment design using aggregate historical data to inform individualized treatment recommendations

이 논문은 외부 연구의 요약된 역사적 데이터를 정규화된 파워 사전분포를 통해 활용하여, 개별 치료 효과를 추정하고 적응적 풍부화 임상시험의 효율성을 높이는 베이지안 적응적 풍부화 설계를 제안합니다.

Lara Maleyeff, Shirin Golchi, Erica E. M. MoodieWed, 11 Ma📊 stat

Nuisance Function Tuning and Sample Splitting for Optimally Estimating a Doubly Robust Functional

이 논문은 이중 강건 함수를 추정할 때, 낮은 정칙성 조건에서도 최소극대 수렴 속도를 달성하기 위해 nuisance 함수의 과소/과소 평활화 조정과 샘플 분할 전략을 신중하게 결합해야 함을 이론적으로 증명하고 시뮬레이션으로 입증합니다.

Sean McGrath, Rajarshi MukherjeeTue, 10 Ma🔢 math

Geodesic slice sampling on the sphere

이 논문은 구면 (sphere) 상의 확률 분포를 효율적으로 표본 추출하기 위해 조정 파라미터가 필요 없는 축소 기반 및 이상적인 측지선 슬라이드 샘플링 알고리즘을 제안하고, 그 역전성, 균일한 에르고드성, 그리고 기존 방법론 대비 우수한 성능을 수치 실험을 통해 입증합니다.

Michael Habeck, Mareike Hasenpflug, Shantanu Kodgirwar, Daniel RudolfTue, 10 Ma🔢 math

Estimating Treatment Effects under Algorithmic Interference: A Structured Neural Networks Approach

이 논문은 양측 시장 플랫폼의 알고리즘 간섭으로 인한 편향을 해결하기 위해 경쟁적 할당 메커니즘을 명시적으로 모델링하는 구조화된 반모수적 프레임워크와 이중 머신 러닝 기반의 편향 보정 추정량을 제안하여, 기존 추정법보다 정확한 전역 처리 효과를 추정할 수 있음을 입증합니다.

Ruohan Zhan, Shichao Han, Yuchen Hu, Zhenling JiangTue, 10 Ma🤖 cs.LG

Adaptive Transfer Clustering: A Unified Framework

이 논문은 주 데이터와 보조 데이터 간의 잠재적 군집 구조 차이를 자동으로 보정하여 편향 - 분산 최적화를 통해 전이 학습 기반 군집화의 효율성을 극대화하는 '적응형 전이 군집화 (ATC)' 프레임워크를 제안하고, 가우시안 혼합 모델 하에서의 이론적 최적성과 다양한 실험을 통한 유효성을 입증합니다.

Yuqi Gu, Zhongyuan Lyu, Kaizheng WangTue, 10 Ma🤖 cs.LG

Doubly-Robust Functional Average Treatment Effect Estimation

이 논문은 관측 연구에서 함수형 결과를 위한 이중 강건성 (double robustness) 을 갖춘 새로운 방법론인 DR-FoS 를 제안하여, 결과 또는 처치 할당 모델 중 하나가 오설정되더라도 일관된 함수형 평균 처치 효과 (FATE) 추정이 가능하고 전체 함수 영역에 걸쳐 유효한 동시 신뢰대를 보장함을 보여줍니다.

Lorenzo Testa, Tobia Boschi, Francesca Chiaromonte, Edward H. Kennedy, Matthew ReimherrTue, 10 Ma🔢 math

Fast confidence bounds for the false discovery proportion over a path of hypotheses

이 논문은 Durand 등 (2020) 의 숲 구조를 기반으로 하는 가설 경로에 대한 거짓 발견 비율 (FDP) 의 사후 상한선을 기존 $O(|\mathcal K|m^2)$ 에서 $O(|\mathcal K|m)$ 으로 줄여 빠르게 계산할 수 있는 새로운 알고리즘을 제안합니다.

Guillermo Durand (LMO, CELESTE)Tue, 10 Ma🔢 math

StablePCA: Distributionally Robust Learning of Shared Representations from Multi-Source Data

이 논문은 다중 소스 고차원 데이터에서 전이 가능한 구조를 추출하고 체계적 편향을 완화하기 위해, 볼록 완화와 미러-프록스 알고리즘을 통해 비볼록 최적화 문제를 해결하는 분포 강건한 공유 표현 학습 프레임워크인 StablePCA 를 제안합니다.

Zhenyu Wang, Molei Liu, Jing Lei, Francis Bach, Zijian GuoTue, 10 Ma🤖 cs.LG

The Poisson tensor completion parametric estimator

이 논문은 다변량 분포의 빈도 히스토그램을 공간 비균질 포아송 과정으로 간주하여 저랭크 포아송 텐서 분해를 통해 빈도수가 적거나 없는 빈까지 평균 측도를 완성하는 새로운 '포아송 텐서 완성 (PTC)' 추정자를 제안하고, 이는 노름 집중 현상으로 인해 기존 히스토그램 기반 추정자보다 서가우시안 확률 분포에서 훨씬 우수한 성능을 보인다고 주장합니다.

Daniel M. Dunlavy, Richard B. Lehoucq, Carolyn D. Mayer, Arvind PrasadanTue, 10 Ma🔢 math

Correlation of divergency: c-delta. Being different in a similar way or not

이 논문은 두 그룹 내의 값들이 서로 어떻게 다른지 그 패턴의 유사성을 정량화하기 위해 기존 상관관계 계수와 구별되는 새로운 통계 지표인 'c-delta(발산 상관 계수)'를 제안하고 그 수학적 형식과 다양한 적용 가능성을 논의합니다.

Johan F. HoornTue, 10 Ma⚛️ quant-ph

Sigmoid-FTRL: Design-Based Adaptive Neyman Allocation for AIPW Estimators

이 논문은 AIPW 추정량을 위한 비볼록 최적화 문제를 해결하기 위해 시그모이드-FTRL 알고리즘을 제안하고, 네이먼 후회 (Neyman Regret) 의 최소최대 수렴 속도를 증명하며 점근적으로 유효한 신뢰구간을 구성하는 방법을 제시합니다.

Fangyi Chen, Shu Ge, Jian Qian, Christopher HarshawTue, 10 Ma🔢 math

Conformal Tradeoffs: Guarantees Beyond Coverage

이 논문은 분포 독립적 기준이 부재한 상황에서 분할 합동 예측 (split conformal prediction) 의 운영적 성과 (기여 빈도, 유보, 오류 노출 등) 를 보장하기 위해 소표본 베타 보정 (SSBC) 과 검증 및 감사 (Calibrate-and-Audit) 프레임워크를 제안하며, 이를 통해 운영 목표 간의 트레이드오프를 시각화하고 유한 시간 창에서의 불확실성을 정량화하는 방법을 제시합니다.

Petrus H. ZwartTue, 10 Ma🤖 cs.LG

Order-Induced Variance in the Moving-Range Sigma Estimator: A Total-Variance Decomposition

이 논문은 이동범위 (MR) 를 이용한 시그마 추정량이 데이터 순서에 의존한다는 점을 규명하고, 총분산을 값의 분산과 인접성 분산으로 분해하여 정규 분포 하에서 인접성 효과가 추정 효율 손실의 주된 원인임을 증명합니다.

Andrew T. KarlTue, 10 Ma🔢 math

← 이전 다음 →