Skip to main content

benchmark

benchmark

Catalogue généré le 2026-05-11

En une phrase

Mesure les performances d'une page web (temps de chargement, Core Web Vitals, taille des fichiers) pour détecter quand ta nouvelle PR fait ramer le site sans que personne s'en aperçoive.

Quand l'utiliser

  • Tu veux établir une mesure de référence (baseline) avant de modifier quelque chose qui peut impacter la perf.
  • Tu veux comparer la perf actuelle d'une page à sa baseline et voir les régressions.
  • Tu veux savoir quelles sont les ressources les plus lentes à charger sur une page.
  • Tu veux vérifier que ton bundle JavaScript ne dépasse pas un budget perf (par exemple 500 KB).
  • Tu veux suivre les tendances perf sur plusieurs semaines pour repérer les dérives lentes.

Comment l'invoquer

  • Slash command : /benchmark <url> (options : --baseline, --quick, --pages <liste>, --diff, --trend)
  • Voice triggers : « speed test » · « check performance »
  • Phrases déclencheurs (texte) : "performance", "benchmark", "page speed", "lighthouse", "web vitals", "bundle size", "load time"
  • Auto-invocation : Sur demande explicite.

Description détaillée

Le skill benchmark joue le rôle d'un ingénieur perf qui sait que les sites ne deviennent pas lents d'un seul coup : ils meurent à petit feu, 50 ms ici, 20 KB là, et un jour la page met 8 secondes à charger et personne ne sait quand ça a commencé. Sa mission : mesurer, enregistrer une baseline, comparer, alerter dès qu'une régression apparaît.

Il s'appuie sur le démon de navigateur de gstack (browse) et utilise les APIs Performance du navigateur pour collecter des mesures précises : TTFB (temps avant le premier octet), FCP (First Contentful Paint), LCP (Largest Contentful Paint), DOM Interactive, DOM Complete, Full Load, plus l'analyse de chaque ressource (taille, durée, type). Il distingue les bundles JS et CSS, compte les requêtes, identifie les ressources tierces lentes (analytics, fonts), et applique des seuils standards : plus de 50 % d'augmentation ou plus de 500 ms en absolu = REGRESSION, plus de 20 % = WARNING.

Quatre modes principaux. --baseline capture la mesure de référence (à lancer avant tes changements). Mode comparaison (par défaut) compare la perf actuelle à la baseline. --quick fait juste un check rapide sans baseline. --trend affiche l'historique des mesures pour repérer les tendances (par exemple : "LCP a doublé en 8 jours"). --diff ne benchmark que les pages affectées par ta branche actuelle. À la fin, il te donne aussi un check de budget perf (FCP < 1,8 s, LCP < 2,5 s, total JS < 500 KB, total CSS < 100 KB, etc.) avec une note A/B/C, et recommande des optimisations concrètes (code splitting, lazy loading, etc.).

Source

  • Plugin : gstack
  • Nom interne : benchmark
  • Fichier : /home/thymon/.claude/skills/gstack/benchmark/SKILL.md