Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement
이 논문은 분자 속성 예측 모델에서 작업 정렬과 대칭성이 표현의 선형 분리성을 어떻게 결정하는지 규명하기 위해 새로운 분석 기법인 CPD 를 제안하고, 작업 정렬이 아키텍처보다 정보 분리 효율에 더 지배적인 영향을 미친다는 사실을 입증합니다.