Ce script Python a pout but de "scraper" le site de librairie en ligne factice books.toscrape.com afin d'en extraire les données tarifaires via un processus ETL (Extract Transform Load) Le site va parcourir l'ensemble des catégories du site, l'ensemble des pages par catégories, puis l'ensemble des livres sur chaque page. Les données extraites sont nettoyées et sauvegardées telles que voulu dans des fichiers CSV et JPG.
Python requests beautifulsoup
See project on gitHublast updated: nov 2022
Copyright © 2024 Thomas Deruère - Powered by Django