Evaluating Gender Wage Inequality in Academia using Causal Inference Methods for Observational Data
이 논문은 12,039 명의 UNC 시스템 tenure-track 교수 데이터를 활용하여 성별에 따른 임금 격차를 추정하기 위해 성향점수 매칭과 인과적 숲 (causal forests) 같은 현대적 인과추론 방법을 적용한 결과, 동등한 조건에서 여성 교수가 남성 동료보다 약 6% 적은 급여를 받는 구조적 불평등이 존재함을 밝혔습니다.
목표: 평균 처리 효과 (ATE), 처리된 집단의 평균 처리 효과 (ATT), 조건부 평균 처리 효과 (CATE) 추정.
3.2 모수적 방법 (Parametric Methods)
성별에 대한 propensity score(성별이 될 확률) 를 로지스틱 회귀로 추정하고, 이를 기반으로 다음 세 가지 접근법을 적용하여 결과를 상호 검증했습니다.
Propensity Score Matching (PSM) + 회귀 보정:
성별이 비슷한 교수를 매칭 (Nearest-neighbor, caliper 0.2) 한 후, 잔여 불균형을 보정하기 위해 회귀 분석을 수행.
추정 대상: ATT (여성 교수 집단에 대한 효과).
Inverse Probability Treatment Weighting (IPTW) + 회귀 보정:
propensity score 의 역수로 가중치를 부여하여 가상의 인구를 생성.
추정 대상: ATE (전체 인구에 대한 효과).
Propensity Score를 포함한 회귀 보정:
처리 변수와 추정된 propensity score 를 모두 공변량으로 포함하는 회귀 모델.
Propensity Score 모델: 대학 코드, 학과 코드, 연구 생산성 (i10-index) 간의 3 차 상호작용, 직급과 재직 연수 간의 상호작용 등을 포함하여 복잡한 학술계 구조를 반영.
3.3 비모수적 방법 (Non-Parametric Method): Causal Forest
기법: Athey 와 Imbens (2016) 가 개발한 Causal Forest (Double Machine Learning 기반).
특징:
선형성 가정을 완화하고 고차원 비선형 상호작용을 자동으로 포착.
CATE (Conditional Average Treatment Effect) 추정: 개별 교수의 특성 (직급, 분야, 생산성 등) 에 따라 성별 임금 격차가 어떻게 달라지는지 분석.
Honest Estimation: 샘플 분할 (splitting) 을 통해 과적합 (overfitting) 을 방지하고 편향을 줄임.
4. 주요 결과 (Key Results)
4.1 기술적 분석 및 기본 회귀
조정 전 (Raw): 남성 평균 급여 \134,169, 여성 \118,460 → 11.71% 의 임금 격차.
OLS 회귀 (공변량 통제 후): 직급, 분야, 경력, 생산성을 통제해도 여성 교수의 급여는 남성보다 약 6.44% ~ 7.12% 낮음 (통계적 유의성 확보). 이는 관측 가능한 특성으로 설명되지 않는 구조적 불평등이 존재함을 시사.
4.2 인과 추론 결과 (Causal Estimates)
모든 방법론에서 일관되게 약 6% 의 성별 임금 격차가 존재함이 확인되었습니다.
방법론
추정 계수 (β)
추정된 임금 격차 (%)
비고
PSM (ATT)
-0.0297
6.61%
여성 교수 집단에 초점
IPTW (ATE)
-0.0276
6.17%
전체 인구 초점
회귀 보정
-0.0290
6.45%
Causal Forest
-0.0267
5.96%
이질성 고려
결론: 조정 전 11.71% 의 격차 중 약 5% 포인트는 직급, 경력, 생산성 등 관측 변수로 설명되지만, 약 6% 의 격차는 설명되지 않는 구조적 차별로 남습니다.
4.3 이질성 분석 (Heterogeneity Analysis - Causal Forest)
학문 분야별 차이:의학 및 보건과학 (Medical and Health Sciences, MHS) 분야에서 성별 임금 격차가 가장 심각함 (약 7%). 반면, 자연과학/사회과학은 약 5.5%, 인문/비즈니스/공학은 약 6% 수준.
연구 생산성과의 상호작용: MHS 분야에서는 연구 생산성이 중간 수준일 때 성별 격차가 가장 커지는 경향이 보임. 다른 분야에서는 생산성에 따른 격차 변화가 상대적으로 안정적.
경력 단계: 대부분의 분야에서 경력에 따른 격차 변화는 일정하지만, MHS 는 경력과 함께 격차가 유지되거나 심화되는 경향을 보임.
5. 주요 기여 및 의의 (Contributions & Significance)
인과적 증거 제공: 단순한 연관성 분석을 넘어, 현대적 인과 추론 기법 (PSM, IPTW, Causal Forest) 을 적용하여 성별 임금 격차의 인과적 크기를 보다 엄밀하게 추정했습니다.
이질성 규명: 평균 효과 (ATE) 만으로는 놓칠 수 있는 세부 패턴을 발견했습니다. 특히 의학/보건 분야에서의 심각한 불평등과 연구 생산성 수준에 따른 격차의 변화를 규명했습니다.
재현 가능한 프레임워크: 공개 급여 데이터, Google Scholar 메타데이터, 인과 추론 코드를 통합한 재현 가능한 워크플로우를 GitHub 에 공개하여 다른 학술 시스템의 형평성 감사 (equity audit) 에 활용 가능하도록 함.
정책적 시사점:
단순한 임금 인상이 아닌, 학문 분야별 (특히 의학계) 및 경력 단계별 맞춤형 개입이 필요함.
연구 성과 평가 지표 (인용 수 등) 가 인문사회과학 등 특정 분야에서는 적절하지 않을 수 있음을 지적.
정기적인 형평성 감사와 투명한 급여 기준 마련의 필요성 강조.
6. 한계점 (Limitations)
생산성 측정: Google Scholar 기반의 i10-index 만 사용되어 교육, 멘토링, 대학 서비스 등 비연구적 기여는 반영되지 않음.
단면 데이터: 2022 년 한 해의 데이터로, 시간에 따른 격차의 변화를 추적하지 못함.
일반화 가능성: 공립 대학 시스템 (UNC) 에 국한된 결과로, 사립 대학이나 다른 거버넌스 구조를 가진 시스템에는 직접 적용하기 어려울 수 있음.
요약
이 연구는 북캐롤라이나 주립 대학 시스템의 대규모 데이터를 활용하여, 현대적 인과 추론 기법을 통해 학술계의 성별 임금 불평등을 분석했습니다. 그 결과, 직급, 경력, 연구 생산성 등을 완벽하게 통제하더라도 여성 교수는 남성 동료보다 약 6% 더 낮은 급여를 받는 구조적 불평등이 존재함을 입증했습니다. 특히 의학 및 보건 분야에서 이 불평등이 가장 심각하며, 이는 단순한 통계적 편차가 아닌 체계적인 차별의 결과임을 시사합니다.