[!info] TL;DR : Bookmarklet open source pour faire du scraping de pages web depuis la console JavaScript du navigateur.
artoo.js : scraping rapide en JavaScript dans le navigateur
artoo.js est un bookmarklet open source créé par medialab Sciences Po qui injecte une boîte à outils de scraping (jQuery, helpers, exports) dans n'importe quelle page web pour extraire de la donnée à la volée.
Ce que ça permet
- Injection en un clic d'une lib JS de scraping dans la page
- Helpers pour extraire des données structurées (tables, listes, attributs)
- Export en JSON, CSV, ou copy-paste vers le clipboard
- Spider léger pour suivre des liens et agréger des données multi-pages
- Inclus jQuery automatiquement si absent
- Open source (MIT), customisable, gratuit
- Documentation et exemples sur le site officiel
Pour qui
- Devs et data scientists qui scrapent ponctuellement
- Journalistes data et chercheurs SHS qui collectent à la main
- Growth bricoleurs qui exfiltrent une page sans coder un scraper complet
- Ceux qui veulent un outil léger sans installer Apify ou Puppeteer
Pièges
- Suppose de connaître JS et le DOM pour exploiter pleinement
- Pas adapté au scraping massif ou anti-bot (Cloudflare, captcha)
- Outil ancien (medialab Sciences Po), peu de mises à jour récentes
- Alternatives : Browser DevTools + scripts custom, Puppeteer, Playwright, Apify, Firecrawl
- Pour du volume, partir directement sur un scraper backend
Tags
- Catégorie : 🎯 Sales & Prospection
- Tags : Code, Scraping, Open Source, Free, Dev, Utilitaire