Aller au contenu
Retour

Comment réduire la facture des LLM sans effort ?

Publié:  at  08:59 AM

J’imagine que, comme moi, vous avez déjà vu votre facture Claude Code ou Cursor dépasser le budget prévu… juste parce que vous avez laissé l’outil tourner sur une tâche complexe pendant quelques minutes (ou heures).

À l’avenir, ce problème tend à s’amplifier à mesure que les outils d’IA s’intègrent partout dans nos usages : écrire du code, explorer un projet, retrouver une info dans un dossier… et j’en passe.

Avec, en plus, l’augmentation des coûts des tokens sur les modèles les plus récents, la facturation liée à l’IA devient un vrai enjeu FinOps pour les prochains mois (voire années).

Alors oui, mais vous pourrez me dire, qu’est ce que je peux y faire à mon échelle ?

La solution est simple : essayer de réduire au maximum le nombre de tokens envoyés au LLM, sans dégrader le contexte (ni l’information utile).

Pour cela, j’ai trouvé une solution assez magique au moment où je rédige cet article 👇

Elle s’appelle “Rust Token Killer”  ou rtk


Rust Token Killer (ou rtk pour les intimes) est un outil open-source développé et maintenu par des français (cocorico 🇫🇷) qui agit comme proxy aux différentes commandes qu’un agent / IDE IA exécute souvent pour réaliser ses tâches.

Au lieu d’appeler les commandes de base fournies par votre système (comme ls ou find) — conçues pour être lues par un humain — rtk les “wrappe” et remplace la sortie par des alternatives optimisées, moins verbeuses, tout en minimisant la perte d’information.

Oubliez donc ls (~150 tokens)

$ ls .
total 24
drwxr-xr-x@  4 myastr0  staff   128  9 mar 08:50 assets/
drwxr-xr-x@ 17 myastr0  staff   544  9 mar 18:19 components/
-rw-r--r--@  1 myastr0  staff  1338  9 mar 18:38 config.ts
-rw-r--r--@  1 myastr0  staff  1001  9 mar 19:31 constants.ts
-rw-r--r--@  1 myastr0  staff   847  9 mar 18:34 content.config.ts
drwxr-xr-x@  3 myastr0  staff    96  9 mar 18:34 data/
drwxr-xr-x@  9 myastr0  staff   288  9 mar 08:50 i18n/
drwxr-xr-x@  5 myastr0  staff   160  9 mar 18:34 layouts/
drwxr-xr-x@  5 myastr0  staff   160  9 mar 08:50 pages/
drwxr-xr-x@  4 myastr0  staff   128  9 mar 08:50 styles/
drwxr-xr-x@ 13 myastr0  staff   416  9 mar 18:34 utils

et dites bonjour à rtk ls (#~35 tokens -80%)

$ rtk ls .
assets/
components/
data/
i18n/
layouts/
pages/
styles/
utils/
config.ts  1.3K
constants.ts  1001B
content.config.ts  847B

📊 3 files, 8 dirs (3 .ts)

Les sorties produites par rtk sont bien moins verbeuses, mais restent exploitables par un LLM pour des usages classiques d’exploration de fichiers et d’enrichissement de contexte.

Super, ça affiche moins de texte… mais comment mesurer ce que j’économise ? 📊


Là où rtk m’a vraiment convaincu, c’est sur le suivi. Avec la commande rtk gain, j’ai un rapport détaillé de ce que j’économise (en tokens).

Ci-dessous le rapport de ma semaine passée 👇

$ rtk gain


📊 RTK Token Savings
════════════════════════════════════════

Total commands:    2,927
Input tokens:      11.6M
Output tokens:     1.4M
Tokens saved:      10.3M (89.2%)

By Command:
────────────────────────────────────────
Command               Count      Saved     Avg%
rtk find                324       6.8M    78.3%
rtk git status          215       1.4M    80.8%
rtk grep                227     786.7K    49.5%
rtk cargo test           16      50.1K    91.8%

Si ce rapport n’est pas assez parlant, voici une mise en perspective basée sur les tarifs officiels de l’API Anthropic (Claude, mars 2026).

Ce que ça représente concrètement 💰


Les 10,3 M de tokens économisés par rtk correspondent ici à du contexte en entrée. En utilisant les prix par million de tokens ((MTok)) de la documentation Anthropic pour les modèles récents :

ModèleInput (USD/MTok)Output (USD/MTok)Économie sur 10,3 M tokens (USD)
Claude Opus 4.65 $25 $51,50 $
Claude Sonnet 4.63 $15 $30,90 $

En annualisant (× 52), on arrive à environ 2 680 $ d’économie par an avec Opus 4.6 — le chiffre parle de lui-même.


Donc, sans changer de modèle ni de fournisseur, avec rtk on peut viser de ~1 600 $ à ~2 700 $ d’économie par an (ordre de grandeur, selon le modèle) rien que sur un poste. À l’échelle d’une équipe (ex. 30 devs), l’ordre de grandeur devient vite significatif.

Alors, prêt à faire un max d’économie ? 🚀


Pour ça, rien de plus simple : installez et configurez rtk (je vous laisse suivre le README officiel), et vous voilà prêt à voir vos factures diminuer à vue d’œil ! 😉


Merci de m’avoir lu jusqu’ici 🙇‍♂️

Si vous avez des retours sur cet article (ou s’il vous a plu), n’hésitez pas à m’envoyer un message sur Bluesky, à le partager sur LinkedIn, ou ailleurs.


Partager cet article sur: