FragmentNet: Adaptive Graph Fragmentation for Graph-to-Sequence Molecular Representation Learning
L'article présente FragmentNet, un modèle de graphe vers séquence qui utilise un nouveau tokenizer adaptatif pour décomposer les molécules en fragments chimiquement valides de granularité ajustable, démontrant que le pré-entraînement à ce niveau de fragments améliore considérablement les performances de prédiction des propriétés en aval par rapport aux approches traditionnelles au niveau des atomes ou basées sur des règles rigides.