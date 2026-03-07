Apple a utilisé l'IA pour améliorer la recherche sur l'App Store, et ça marche
Des chercheurs d'Apple ont mené un test A/B grandeur nature sur l'App Store pour mesurer l'impact d'un modèle de langage sur le classement des résultats de recherche. Résultat : une hausse de 0,24 % du taux de conversion des sessions de recherche, un chiffre minuscule en apparence, mais qui se traduit en dizaines de millions de téléchargements supplémentaires à l'échelle mondiale.
L'étude, publiée en février 2026 sous le titre "Scaling Search Relevance", part d'un constat : quand vous cherchez une app sur l'App Store, le système s'appuie sur deux types de signaux pour classer les résultats. Le premier est comportemental, c'est ce sur quoi les utilisateurs cliquent et téléchargent, et il y en a beaucoup. Le second est textuel, la correspondance entre votre requête et la description de l'app, et là les données de qualité manquent. Produire ces labels de pertinence coûte cher et prend du temps, puisqu'il faut des évaluateurs humains pour les générer un par un.
Apple a donc entraîné un modèle de langage de 3 milliards de paramètres sur les jugements humains existants, puis l'a utilisé pour générer des millions de nouveaux labels. Le tout a été réinjecté dans le système de classement de l'App Store. Et petit détail qui a son importance : ce modèle spécialisé a fait mieux qu'un modèle bien plus gros mais généraliste (comme quoi, la taille ne fait pas tout).
Le gain mesuré lors du test A/B mondial est de +0,24 % sur le taux de conversion, c'est-à-dire la proportion de sessions de recherche qui aboutissent à au moins un téléchargement. Dit comme ça, ce n'est pas grand-chose. Mais avec environ 38 milliards de téléchargements sur l'App Store en 2025, on parle de dizaines de millions d'apps téléchargées en plus chaque année. L'amélioration a été constatée dans 89 % des pays où l'App Store est disponible.
Visiblement là où le gain est le plus important, c'est sur ce qu'on appelle la "longue traîne". En gros, les requêtes peu fréquentes que peu de gens utilisent, pour des besoins un peu trop précis. C'est normal car le système a peu de données comportementales, et classer correctement les résultats est, de fait, plus difficile. C'est là que les labels textuels générés par l'IA font une différence. Pour les développeurs d'apps de niche, c'est une bonne nouvelle : avec des métadonnées bien rédigées, leurs apps ont désormais plus de chances de remonter quand un utilisateur tape la bonne requête.
+0,24 %, dit comme ça, ça n'a l'air de rien. Sauf que sur un store aussi avancé, puissant et massif que l'App Store, c'est en fait énorme. En plus de ça, ça confirme aux développeurs que quoi qu'il en soit, soigner les métadonnées est vraiment important.
