2)
En pompant le contenu et en regardant la taille, mais tu n'es jamais sûr de ne pas avoir raté un morceau. (Et si il y a des pages dynamiques c'est un peu délicat.)
Note qu'il est théoriquement possible de récupérer uniquement les entêtes HTTP pour chaque ressource et de faire la somme des champs Content-length (taille de la ressource).