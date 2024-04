Apple ReALM

Entités à l'écran : ce sont des entités actuellement affichées sur l'écran d'un utilisateur.



Entités conversationnelles : ce sont des entités pertinentes pour la conversation. Ces entités peuvent provenir d'une requête précédente de l'utilisateur (par exemple, lorsque l'utilisateur dit « Appeler maman », le contact de Maman serait l'entité pertinente en question), ou de l'assistant virtuel (par exemple, lorsque l'agent fournit à un utilisateur une liste de lieux ou d'alarmes parmi lesquels choisir).



Entités d'arrière-plan : il s'agit d'entités pertinentes provenant de processus d'arrière-plan qui ne font pas nécessairement partie directement de ce que l'utilisateur voit sur son écran ou de son interaction avec l'agent virtuel ; par exemple, une alarme qui commence à sonner ou de la musique qui joue en arrière-plan.

Une IA rivalisant avec ChatGPT 4 (dans certaines conditions)

Nous démontrons de grandes améliorations par rapport à un système existant avec des fonctionnalités similaires sur différents types de références, notre plus petit modèle obtenant des gains absolus de plus de 5 % pour les références à l'écran. Nous nous comparons également aux GPT-3.5 et GPT-4, notre plus petit modèle atteignant des performances comparables à celles du GPT-4, et nos plus grands modèles les surpassant considérablement.



Nous montrons que ReaLM surpasse les approches précédentes et fonctionne à peu près aussi bien que le LLM de pointe actuel, GPT-4, bien qu'il contienne beaucoup moins de paramètres, même pour les références à l'écran, bien qu'il soit purement dans le domaine textuel. Il surpasse également GPT-4 pour les requêtes utilisateur spécifiques à un domaine, faisant ainsi de ReaLM un choix idéal pour un système de résolution de référence pratique pouvant exister sur l'appareil sans compromettre les performances.

(pour Reference Resolution As Language Modeling). Cette nouvelle IA se distingue en permettant de convertir certaines requêtes (par exemple le contenu d'une page web, d'une image ou la prise en charge d'un contexte) en texte afin que la demande soit plus simple à analyser par la suite, et donc permettre à un grand modèle de langage de fournir plus rapidement des réponses plus pertinentes. Voici quelques exemples des données qui seront converties en texte par l'algorithme :Selon les chercheurs,(nom donné aux réponses erronées d'une IA), ce qui permettrait de rivaliser avec ChatGPT 4, le fleuron du leader du secteur, OpenAI, dans certaines conditions.Ce système pourrait donc(qui en a bien besoin, soyons honnêtes),, ce qui collerait avec la sacro-sainte confidentialité des données de la firme. La WWDC 2024 aura lieu du 10 au 14 juin, et sera l'occasion pour Apple de dévoiler officiellement ses plans, entre intégration d'IA concurrente, comme Gemini de Google , et peut-être d'une IA capable de travailler en local, y compris sur des appareils n'ayant pas énormément de RAM (les IA génératives en sont très friandes).