Skip to main content

scrape

scrape

Catalogue généré le 2026-05-11

En une phrase

Récupère les données affichées sur une page web (texte, prix, liste, etc.) et te les rend en JSON propre, sans avoir à écrire de scraper toi-même.

Quand l'utiliser

  • Quand tu veux extraire le contenu d'une page (article, liste de produits, prix, tableau) pour le réutiliser ailleurs.
  • Pour récupérer les infos d'une page que tu n'as pas le droit ou le temps de coder une API contre.
  • Pour comparer le contenu de deux URLs (par exemple ton site avant/après un déploiement).
  • Quand tu poses la question "qu'est-ce qu'il y a sur cette page ?" en cherchant des données précises.

Comment l'invoquer

  • Slash command : /scrape
  • Phrases déclencheurs (texte) : "scrape" / "get data from" / "pull from" / "extract from" / "what's on" a page
  • Auto-invocation : ✅ Oui — Claude propose ce skill quand tu décris une tâche d'extraction de données depuis le web.

Description détaillée

Ce skill est en lecture seule : il navigue vers une page, regarde le contenu, et retourne un JSON structuré. Il ne clique pas sur des boutons, ne remplit pas de formulaires, ne soumet rien — pour ces flux qui modifient l'état d'un site, tu utiliserais /automate à la place.

La première fois que tu lances un scraping avec une nouvelle intention (par exemple "récupère tous les titres d'articles du blog"), le skill prototype le flux en utilisant les primitives du navigateur invisible de gstack. Il analyse la page, repère les éléments à extraire, et retourne le JSON.

Les appels suivants sur la même intention sont automatiquement routés vers une "browser-skill" codifiée (un mini-programme spécialisé qu'il a généré lui-même) qui répond en environ 200 ms. Autrement dit : la première fois c'est lent (le temps de réfléchir à la structure), les fois d'après c'est très rapide.

Ce mécanisme est utile pour des tâches répétitives : tu peux par exemple scraper le statut d'une page de production toutes les heures sans payer le coût d'analyse à chaque fois.

Source

  • Plugin : gstack
  • Nom interne : scrape
  • Fichier : /home/thymon/.claude/skills/gstack/scrape/SKILL.md