Preloader Logo

Web Scrapper Script

About the project:

Ce script Python a pout but de "scraper" le site de librairie en ligne factice books.toscrape.com afin d'en extraire les données tarifaires via un processus ETL (Extract Transform Load) Le site va parcourir l'ensemble des catégories du site, l'ensemble des pages par catégories, puis l'ensemble des livres sur chaque page. Les données extraites sont nettoyées et sauvegardées telles que voulu dans des fichiers CSV et JPG.


Technology used:

Python requests beautifulsoup

github See project on gitHub

last updated: nov 2022

Retour à la liste des projets

Copyright © 2024 Thomas Deruère - Powered by Django