Apple entre dans la biologie computationnelle avec un nouveau modèle d’IA, SimpleFold, conçu pour rivaliser avec AlphaFold de Google DeepMind. L’objectif : prédire plus efficacement la structure 3D des protéines, tout en réduisant les besoins en puissance de calcul.
Un défi scientifique majeur
Depuis des décennies, déterminer la structure tridimensionnelle d’une protéine à partir de sa séquence d’acides aminés représentait un casse-tête scientifique. Jusqu’à récemment, ces prédictions pouvaient nécessiter des mois, voire des années de calculs. L’arrivée d’AlphaFold, développé par Google DeepMind, a bouleversé le domaine : la tâche peut désormais être accomplie en quelques heures, parfois minutes, ouvrant la voie à la découverte de nouveaux médicaments et matériaux.
Mais cette prouesse a un coût : AlphaFold2, comme RoseTTAFold ou ESMFold, repose sur des architectures extrêmement complexes et gourmandes en ressources. Ces modèles intègrent des mécanismes lourds, tels que les multiple sequence alignments (MSA), les représentations par paires ou les mises à jour triangulaires, qui codifient les connaissances scientifiques actuelles dans le modèle.
SimpleFold : une approche radicalement différente
Apple a choisi une autre voie. Avec SimpleFold, ses chercheurs abandonnent ces mécanismes spécialisés pour adopter les flow matching models, une évolution des modèles de diffusion utilisés en génération d’images et de vidéos.
Plutôt que de supprimer le bruit étape par étape comme dans les modèles classiques, les flow matching models tracent un chemin direct entre le bruit aléatoire et la structure finale, ce qui accélère considérablement le calcul et réduit la consommation d’énergie.
Apple a testé SimpleFold à différentes échelles (100M à 3B de paramètres) sur deux benchmarks de référence, CAMEO22 et CASP14. Ainsi, on apprend que SimpleFold rivalise avec les modèles les plus avancés, atteignant 95 % des performances d’AlphaFold2 et de RoseTTAFold2. Même la version la plus compacte (100M) parvient à dépasser 90 % des performances d’ESMFold, tout en restant bien plus économe en ressources.
Un premier pas vers une IA plus accessible en biologie
Pour Apple, SimpleFold n’est qu’un début. Les chercheurs insistent sur le potentiel du modèle à évoluer avec la taille et les données d’entraînement, et espèrent que cette approche servira de nouveau cadre de référence pour développer des modèles plus rapides, moins coûteux et tout aussi puissants.
Alors qu’AlphaFold a déjà révolutionné la biologie structurelle, l’arrivée d’acteurs comme Cupertino montre que la compétition s’étend désormais bien au-delà des laboratoires académiques et des géants spécialisés de l’IA. L’avenir de la découverte biomédicale pourrait dépendre de cette nouvelle génération de modèles hybrides, capables de combiner précision scientifique et efficacité computationnelle.