Jeudi 16 avril 2026, Anthropic a publié Opus 4.7. Trois mois après 4.6, deux mois après les premières plaintes publiques sur sa dégradation silencieuse. J’ai passé la soirée à lire la release notes et les retours des premiers testeurs. Voici ce que j’en retiens, sans lunettes roses ni hype artificielle.
Le contexte que la communication officielle élude
Opus 4.7 arrive après plusieurs semaines de grogne publique. Sur Reddit, Twitter, Hacker News, de nombreux utilisateurs de 4.6 signalaient depuis février une qualité en baisse sur certaines tâches. Anthropic n’a jamais officialisé cette dérive. La release d’aujourd’hui est présentée comme une avancée, pas comme une réponse à un problème. C’est un choix de communication à noter quand on lit les benchmarks 4.6 vs 4.7 : la baseline de comparaison n’a pas été stable.
Autre point éludé : le jour même du lancement, Axios a publié un article révélant qu’Anthropic concède en interne qu’un modèle non publié, nom de code Mythos, dépasse Opus 4.7 sur plusieurs benchmarks. Pourquoi ne pas avoir sorti Mythos ? La communication officielle est muette. Les hypothèses varient : coût d’inférence, questions de sécurité, cycle de release plus progressif. L’utilisateur doit retenir que 4.7 n’est pas “le meilleur modèle qu’Anthropic peut produire”, c’est “le meilleur qu’Anthropic veut sortir maintenant”.
Les vrais gains sur le papier
La release a de vraies avancées, indépendamment du discours qui l’entoure.
Adaptive thinking comme seul mode supporté est un pari produit assumé. Fini les budgets manuels de thinking tokens, qui étaient en pratique mal calibrés par 80 % des utilisateurs. Le modèle ajuste désormais la profondeur de raisonnement de façon autonome. Sur mes deux mois avec 4.6, j’ai mesuré que mes budgets manuels étaient souvent soit trop bas (sorties pauvres) soit trop hauts (coût pour rien). Un auto-tuning serré est un vrai progrès.
La fenêtre 1M tokens exploitée plus proprement : sur 4.6, la rétention se dégradait bien avant ce plafond, ce qui en faisait un argument marketing plus qu’un outil utilisable. Les premiers retours sur 4.7 suggèrent une rétention propre plus loin dans la fenêtre. À valider sur un usage prolongé.
/ultrareview pour la chasse aux bugs : la commande fait un audit multi-passes sur un diff. En standard, une revue Claude sortait 2 à 3 remarques utiles sur un fichier type. Selon la doc officielle, /ultrareview creuse bugs, edge cases, failles de sécurité, erreurs de logique avec plus de profondeur. Ça ressemble aux outils d’analyse statique poussés, mais orchestrés par un LLM qui comprend le contexte métier. Si ça tient ce que ça promet, c’est utile pour les modules qui partent en prod.
Les points qui méritent scepticisme
Le “delegated engineer” est un choix discursif, pas une capacité nouvelle. Anthropic invite à traiter Claude comme un délégué plutôt qu’un copilote. Ce cadrage est utile pour certains cas, mais la capacité technique qui le rend possible existait déjà sur 4.6 pour qui savait l’utiliser. On enfonce une porte ouverte en la présentant comme une innovation.
xhigh par défaut a un coût business. Il consomme plus de tokens qu’un réglage high, parfois significativement. Multiplié par une équipe qui ne change pas ses habitudes, la facture mensuelle monte. Sur un pool de 8 développeurs que je suis, on peut anticiper une hausse de 30 à 40 % en lissage. Ça ne remet pas en cause la qualité, mais ça a un effet économique qu’il faut piloter consciemment.
Moins de subagents par défaut : feature ou régression ? Anthropic indique que 4.7 spawn moins de subagents sans instruction explicite. C’est présenté comme une optimisation. Pour les workflows déjà construits sur un pattern operator-subagents, c’est une régression tacite qu’il faut compenser par un prompting plus explicite.
Les gains sur les tâches longues ne suppriment pas la supervision. Le modèle est plus autonome, pas plus infaillible. Une tâche longue partie dans une mauvaise direction en début de session produit au bout d’une heure une sortie longue et cohérente mais à côté du sujet. La supervision est déplacée, pas supprimée.
Mon verdict
Opus 4.7 est une release de progression. Les gains sur /ultrareview, sur adaptive thinking et sur la rétention de contexte sont réels et mesurables. La posture de délégation est utile pour qui a la maturité de la cadrer correctement.
Mais ce n’est pas une rupture conceptuelle. Le discours marketing évoque un saut qualitatif que l’usage ne confirme pas entièrement. Pour qui sort de 4.6 sur des workflows de production, la migration vaut le coup. Pour qui attendait un “AGI coding assistant”, la déception sera proportionnelle aux attentes.
Mes 3 recommandations
Migrer, mais monitorer la consommation sur les deux premières semaines. xhigh par défaut + pas de changement d’habitudes = facture qui grimpe silencieusement.
Tester /ultrareview sur les modules critiques en priorité. C’est là que le rapport temps investi / bugs trouvés est le plus favorable.
Ne pas jeter les workflows de pair programming d’apprentissage pour les juniors. La délégation n’est pas le seul mode d’usage pertinent, elle en est un parmi plusieurs.
FAQ
Vaut-il le coup de migrer dès maintenant ? Pour les équipes actives sur Claude Code, oui. Mais attends si tes workflows sont finement tunés sur 4.6 et si tu n’as pas de créneau pour valider.
Le nouveau modèle Mythos va-t-il sortir bientôt ? Pas de date communiquée. L’article Axios mentionne des discussions internes, pas une feuille de route publique. Ne bâtis pas de décision produit sur cette hypothèse.
/ultrareview est-il utile en CI ?
Pour l’instant, c’est une commande interactive dans Claude Code. Des wrappers maison existent déjà, mais l’intégration CI automatisée n’est pas un produit officiellement supporté.
Je dirige Linkuma, plateforme de netlinking low cost avec plus de 40 000 sites au catalogue et 15 000 clients accompagnés. On benche l’IA générative sur toute la chaîne SEO. Retours concrets sur linkuma.com, promos hebdomadaires sur deals.linkuma.com.
