SC3: The Multi-Solvent Solubility Challenge and Benchmark
Este artigo introduz o SC3, um benchmark de solubilidade multissolvente rigorosamente curado com um limite aleatório recalibrado e métricas de avaliação avançadas, revelando que os modelos atuais de estado da arte permanecem significativamente menos confiáveis do que anteriormente assumido e destacando o papel crítico da incerteza calibrada para melhorias futuras.