Thomas Deruere | Python Portfolio

Web Scrapper Script

About the project:

Ce script Python a pout but de "scraper" le site de librairie en ligne factice books.toscrape.com afin d'en extraire les données tarifaires via un processus ETL (Extract Transform Load) Le site va parcourir l'ensemble des catégories du site, l'ensemble des pages par catégories, puis l'ensemble des livres sur chaque page. Les données extraites sont nettoyées et sauvegardées telles que voulu dans des fichiers CSV et JPG.

Technology used:

Python requests beautifulsoup

See project on gitHub

last updated: nov 2022

Retour à la liste des projets