Diagnosing Heteroskedasticity and Resolving Multicollinearity Paradoxes in Physicochemical Property Prediction
Este estudo demonstra que modelos de regressão linear falham em prever a lipofilicidade devido à heterocedasticidade severa, enquanto métodos baseados em árvores (como Random Forest e XGBoost) superam essa limitação e revelam, por meio da análise SHAP, que a massa molecular é um preditor crucial anteriormente mascarado pela multicolinearidade.