Actualité

IA

Avec Claude Opus 4 et Sonnet 4, Anthropic veut redéfinir le codage et le raisonnement avancé

Par Laurence - Publié le

Après les nombreuses nouveautés de cette semaine, Anthropic n'est pas en reste et dévoile deux nouveaux modèles d’intelligence artificielle : Claude Opus 4 et Claude Sonnet 4.

Présentés comme des références en matière de codage, de raisonnement complexe et d’agents IA, ces derniers veulent incarner une nouvelle génération d’outils à la fois plus puissants, plus précis et mieux intégrés dans les flux de travail des développeurs et des entreprises.


Anthropic Claude Opus 4 Sonnet 4


Claude Opus 4 : le nouveau champion du codage avancé



Présenté comme le modèle le plus performant jamais conçu par Anthropic, Claude Opus 4 est taillé pour les tâches lourdes et complexes, capables de maintenir des performances constantes pendant plusieurs heures, même lorsque les instructions comptent des milliers d’étapes.

D'après les benchmarks, il surpasse tous ses concurrents : 72,5 % sur SWE-bench, un test de référence en ingénierie logicielle et 43,2 % sur Terminal-bench, axé sur l’exécution de commandes complexes en environnement réel.

Avec Claude Opus 4 et Sonnet 4, Anthropic veut redéfinir le codage et le raisonnement avancé


En premier de la classe, Opus 4 excelle dans le codage, mais aussi dans le raisonnement étendu, avec une nouvelle capacité à alterner entre réflexion logique et utilisation d’outils externes. Cela inclut l’accès à des recherches web ou à des fichiers locaux pour étayer ses réponses ou poursuivre une tâche en continu, avec une mémoire contextuelle améliorée.

Anthropic souligne également une réduction des comportements indésirables, comme l’usage abusif de raccourcis ou de failles logiques, souvent observés dans les modèles de génération. Les nouvelles fonctions de résumé devrait également permettre de condenser ses raisonnements compliqués, tout en gardant les faits essentiels en mémoire.

Avec Claude Opus 4 et Sonnet 4, Anthropic veut redéfinir le codage et le raisonnement avancé


Claude Sonnet 4 : l’équilibre entre puissance et efficacité



De son coté, Claude Sonnet 4 a été pensé pour ceux qui recherchent un compromis optimal entre performance et légèreté. Il représente une amélioration significative par rapport à la version 3.7. Il offre une meilleure compréhension des instructions, un codage plus robuste, et une capacité à gérer des tâches complexes -bien que légèrement en deçà d’Opus 4 dans les usages intensifs.

Sonnet 4 intègre les mêmes outils de réflexion étendue, la gestion de la mémoire, et le support de recherche en ligne que son grand frère, ce qui en fait une solution idéale pour les utilisateurs souhaitant allier performance, rapidité d’exécution et coût maîtrisé.

Claude Code : l’agent IA pour les développeurs entre dans la phase publique



Avec ces nouveaux modèles, Anthropic annonce également la mise à disposition généralisée de Claude Code, son agent intelligent conçu spécifiquement pour les développeurs. Intégré nativement à VS Code et aux IDE de JetBrains, Claude Code peut -dans le désordre- corriger des bogues, répondre à des questions sur le code existant, modifier des fichiers automatiquement ou encore gérer des tâches en arrière-plan via GitHub Actions. L’outil vit directement dans le terminal, offrant une interface fluide pour des scénarios de développement complexes et des flux DevOps intégrés.

Disponibilité et intégration dans les clouds



À compter d’aujourd’hui, Claude Opus 4 et Sonnet 4 sont disponibles pour tous les utilisateurs des plans Pro, Max, Team et Enterprise de Claude. Sonnet 4 est également accessible gratuitement pour les utilisateurs standards, une stratégie qui pourrait démocratiser l’accès aux capacités avancées de la plateforme.

Les deux modèles sont également disponibles via l’API d’Anthropic, ainsi que sur Amazon Bedrock et Google Cloud Vertex AI, offrant aux développeurs une flexibilité d’intégration dans des environnements cloud variés.

Avec Claude Opus 4 et Sonnet 4, Anthropic franchit un nouveau cap technologique, tout en accélérant le développement d’une IA plus utile, plus fiable et plus adaptée aux cas d’usage professionnels. Le duo de modèles s’inscrit dans une tendance forte : celle d’une intelligence artificielle plus outillée, plus autonome, et profondément intégrée dans les outils de production. Une concurrence de plus en plus sérieuse face à OpenAI, Google ou Mistral.