debian:wget

WGET

wget est un petit outil permettant de télécharger le contenu d'un site depuis la ligne de commande.

Il supporte l'accès via HTTP, HTTPS et FTP . Par exemple pour downloader tous les fichiers pdf d'une url donnée :

 $ mkdir pdf; cd $_; wget -r -nd -np -l3 -A '*.pdf' http://www.exemple.com/pdf/ 

- Ici nous créons un répertoire pdf, nous nous déplaçons dedans avec cd $_ ($_ prend l'argument de la dernière commande ici pdf) et lançons la commande wget avec certaines options :

  1. r (recursive) c'est-à-dire qu'il va aller dans les sous-répertoires existant de votre url </div>
  2. nd (no-directories) ne créé pas les répertoires qu'il pourrait trouver. Tous les fichiers seront directement copiés dans le répertoire courant. </div>
  3. np (no-parent) wget ira juste vérifier dans le répertoire “ pdf ” du site <a href=“http://www.exemple.com”>www.exemple.com</a> et non dans tout le site. </div>
  4. l3 (level-depth) jusqu'a quel niveau de sous-répertoire wget ira chercher les fichiers. Par défaut, cette valeur est à 5 </div>
  5. A '*.pdf' va rechercher tous les fichiers avec l'extension .pdf </div>

Dans notre commande, l'utilisation du point virgule “ ; ” permet d'enchainer plusieurs commandes sur la même ligne. Voyons d'autres utilisation de wget. Pour les options, je vous invite à jeter un oeil à la page de manuel (man wget)

Continuer le téléchargement d'un gros fichier :

Récuperer les 5 premiers fichiers iso des cd Debian :

  $ wget   http://ftp.se.debian.org/debian-iso/current/i386/iso-cd/debian-40r4a-i386-CD-[1-5].iso  

Lancer wget avec une limitation de la bande passante à 90KB/s dans ce cas :

  $ wget   --  limit-rate=90k url	  

Avoir une copie exacte d'un site :

  $ wget   --  mirror   http://www.exemple.com/ 
  • debian/wget.txt
  • Dernière modification : 2022/11/08 16:43
  • de 127.0.0.1