Cette formation est autour du plugin chrome Webscraper.io . L'objectif de cette formation c'est d'apprendre les rudiments du scraping au travers une interface facile à prendre en main et surtout sans avoir à coder.
Pourquoi Webscraper.io ?
L'avantage de webscraper c'est qu'il est gratuit et qu'il n'y a pas vraiment de barrières à son utilisation. Même un Business Développer peut apprendre à l'utiliser en un rien de temps.
Autre points importants :
- Il est maintenu par une vraie entreprise
- Il y a beaucoup de contenu sur le sujet
- Il est possible de partager son scraper et de collaborer
- Le selector graph est une arborescence qui simplifie la logique du scraping
- On peut facilement scraper des sites en étant connectés
- On peut scraper des sites qui se chargent en javascript
Programme de la journée:
- Début des cours vers 9h30 du matin
- C'est quoi le scraping
- Les éléments dans webscraper
- Les selecteurs
- Les metadatas
- Le selector graph
- Bien choisir son url de départ
Exemple 1 :
- Créer son premier scraper
- Sélectionner les bonnes balises html
- L'utilité des éléments
- Lancer le scraper
- Récupérer les données
- sauvegarder les données
Exemple 2 :
- Répétition de l'exemple 1
Pause déjeuner
Exemple 3 :
- La pagination
- La sélection des liens
- La récursivité
- Parents/enfants
- Vérifier la récursivité sur le selector graph
- Lancer le scraper
Exemple 4 :
- Répétition de l'exemple 3
- Exemple de REGEX
Exemple 5 :
- Introduction au scraping de site en javascript
- L’animation du JS
- Développer du contenu caché
- Le scroll Down
- La pagination en javascript