⚙️
Tools Box
Sales
🎯Sales
Freemium

Artoo.js

Bookmarklet open source qui injecte une boîte à outils JS de scraping dans n'importe quelle page.

[!info] TL;DR : Bookmarklet open source pour faire du scraping de pages web depuis la console JavaScript du navigateur.

artoo.js : scraping rapide en JavaScript dans le navigateur

artoo.js est un bookmarklet open source créé par medialab Sciences Po qui injecte une boîte à outils de scraping (jQuery, helpers, exports) dans n'importe quelle page web pour extraire de la donnée à la volée.

Ce que ça permet

  • Injection en un clic d'une lib JS de scraping dans la page
  • Helpers pour extraire des données structurées (tables, listes, attributs)
  • Export en JSON, CSV, ou copy-paste vers le clipboard
  • Spider léger pour suivre des liens et agréger des données multi-pages
  • Inclus jQuery automatiquement si absent
  • Open source (MIT), customisable, gratuit
  • Documentation et exemples sur le site officiel

Pour qui

  • Devs et data scientists qui scrapent ponctuellement
  • Journalistes data et chercheurs SHS qui collectent à la main
  • Growth bricoleurs qui exfiltrent une page sans coder un scraper complet
  • Ceux qui veulent un outil léger sans installer Apify ou Puppeteer

Pièges

  • Suppose de connaître JS et le DOM pour exploiter pleinement
  • Pas adapté au scraping massif ou anti-bot (Cloudflare, captcha)
  • Outil ancien (medialab Sciences Po), peu de mises à jour récentes
  • Alternatives : Browser DevTools + scripts custom, Puppeteer, Playwright, Apify, Firecrawl
  • Pour du volume, partir directement sur un scraper backend

Tags

  • Catégorie : 🎯 Sales & Prospection
  • Tags : Code, Scraping, Open Source, Free, Dev, Utilitaire