Recherche de site Web

Top 10 des cas d'utilisation de la commande Wget (avec exemples)


Ce guide vous montrera comment utiliser la commande wget à travers 10 exemples couramment utilisés.

Wget est un utilitaire de ligne de commande permettant de télécharger des fichiers depuis le Web, créé par le projet GNU. Le nom est une combinaison de « World Wide Web » et de « get ».

Wget vous permet de télécharger des fichiers à l'aide des protocoles HTTP, HTTPS et FTP. De plus, il vous donne la possibilité de télécharger plusieurs fichiers, de reprendre les téléchargements, de limiter la bande passante, d'effectuer des téléchargements récursifs, de télécharger en arrière-plan, de mettre en miroir un site Web et bien plus encore.

À la fin de ce guide, vous saurez tout ce qu'il y a à savoir sur la commande wget et comment l'utiliser pour télécharger des fichiers depuis Internet.

Installation de Wget

Le package wget est préinstallé sur la plupart des distributions Linux. Cependant, si la commande wget n'est pas installée sur votre système, vous pouvez facilement l'installer à l'aide du gestionnaire de packages.

Installation de Wget sur Ubuntu, Debian et d'autres distributions basées sur Debian

sudo apt install wget

Installation de Wget sur Fedora, RHEL et d'autres distributions basées sur RHEL

sudo dnf install wget

Installation de Wget sur Manjaro, Arch Linux et d'autres distributions basées sur Arch Linux

sudo pacman -S wget

Vous pourrez utiliser la commande wget une fois la configuration terminée. Mais, d’abord, je vais vous montrer les dix exemples de commandes wget les plus utilisés que vous pouvez utiliser dans votre travail quotidien pour vous aider à démarrer.

Syntaxe de la commande Wget

Les expressions de commande wget prennent la syntaxe suivante :

wget [OPTIONS] [URL]
  • [OPTIONS] indique quoi faire avec l'argument [URL] fourni après.
  • [URL] est le fichier ou le répertoire que vous souhaitez télécharger.

1. Téléchargez un fichier à l'aide de Wget

La manière la plus simple d'utiliser wget est de lui fournir l'emplacement d'un fichier à télécharger. Ensuite, lorsqu'aucune option n'est spécifiée, wget télécharge la ressource spécifiée dans le [URL] dans le répertoire courant.

Par exemple, vous pouvez obtenir le fichier image ISO d'installation d'Arch Linux en procédant comme suit :

wget http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

En conséquence, un fichier nommé archlinux-2022.04.05-x86_64.iso est téléchargé dans le répertoire de travail actuel. De plus, vous verrez également des informations telles que la progression du téléchargement, la vitesse, la taille, l'heure et la date.

2. Utilisation de la commande Wget pour renommer le fichier téléchargé

Passez l'option -O suivie du nom préféré pour enregistrer le fichier téléchargé sous un nom différent.

Par exemple, la commande ci-dessous enregistrera le fichier image ISO d'installation d'Arch Linux sous arch-install.iso au lieu de son nom d'origine.

wget -O arch-install.iso http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

3. Téléchargez plusieurs fichiers à l'aide de Wget

Si vous souhaitez utiliser wget pour télécharger plusieurs fichiers à la fois, utilisez l'option -i suivie du chemin d'accès au fichier contenant une liste des URL à télécharger. De plus, chaque URL doit être placée sur sa ligne.

Dans cet exemple, nous récupérerons les images d'installation ISO d'Arch Linux et Debian en utilisant wget. Cependant, nous devrons d’abord créer un document texte et y insérer les URL de téléchargement pour ce faire.

Alors, commençons par créer un fichier avec un nom de notre choix, par exemple urls.txt, et mettons-y les adresses URL nécessaires aux fichiers que nous voulons télécharger.

vim urls.txt

Ensuite, vous devez utiliser l'option -i suivie du nom du fichier pour télécharger tous les fichiers stockés dans notre fichier texte.

wget -i urls.txt

C'est tout. Attendez simplement que le processus soit terminé.

4. Reprendre un téléchargement à l'aide de Wget

Si vous perdez votre connexion Internet, votre téléchargement peut être interrompu. En effet, c’est un phénomène assez courant lors du téléchargement de fichiers volumineux.

Ainsi, au lieu de redémarrer le téléchargement à partir de zéro, utilisez l'option -c pour le continuer :

wget -c http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

Cependant, si le serveur distant ne prend pas en charge la reprise des téléchargements, wget redémarrera le téléchargement et écrasera le fichier existant.

5. Téléchargez des fichiers en arrière-plan à l'aide de Wget

L'ajout de l'option -b à wget enverra le téléchargement en arrière-plan immédiatement après le démarrage du téléchargement. Si aucun fichier de sortie n'est spécifié via l'option -o, la sortie est redirigée vers le fichier wget-log.

wget -b http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

De plus, vous pouvez visualiser les actions effectuées en arrière-plan par wget en visualisant simplement le contenu du fichier wget-log. Par exemple, les dix premières lignes de son contenu sont affichées dans l'image ci-dessus.

6. Limitez la vitesse de téléchargement à l'aide de Wget

Lors du téléchargement d'un fichier volumineux via une connexion Internet lente, il est parfois nécessaire de limiter la vitesse de téléchargement de la commande wget pour éviter qu'elle n'utilise toute votre bande passante.

L'exemple suivant téléchargera l'image ISO d'installation d'Arch Linux et limitera la vitesse de téléchargement à 1 Mo :

wget --limit-rate=1m http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

7. Téléchargez un fichier dans un répertoire spécifique

Par défaut, wget télécharge les fichiers dans le répertoire de travail actuel. Mais bien sûr, wget peut sauvegarder les fichiers téléchargés dans un répertoire prédéfini.

L'option -P est utilisée pour définir le préfixe du répertoire dans lequel tous les fichiers récupérés seront enregistrés.

wget -P /tmp/ http://mirrors.mit.edu/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

La commande ci-dessus téléchargera le fichier ISO dans le répertoire /tmp .

8. Téléchargez des fichiers protégés par mot de passe via HTTP ou FTP à l'aide de Wget

Si le site Web que vous souhaitez télécharger est protégé par mot de passe, les commandes standard wget échoueront, affichant une erreur d'accès refusé lors de la tentative de téléchargement.

Cependant, nous pourrions utiliser l'option ci-dessous pour inclure le nom d'utilisateur et le mot de passe du site Web protégé par mot de passe aux côtés des commandes wget utilisées pour récupérer le fichier.

Par exemple, pour télécharger un fichier à partir d'un serveur HTTP protégé par mot de passe, vous devrez spécifier le nom d'utilisateur et le mot de passe comme dans cet exemple wget :

wget --http-user=username --http-password=password https://www.example.com/filename.tar.gz

Alternativement, pour télécharger un fichier depuis un serveur FTP protégé par mot de passe, la commande wget est :

wget --ftp-user=username --ftp-password=password ftp://ftp.example.com/filename.tar.gz

9. Ignorer la vérification du certificat

Si vous souhaitez utiliser wget pour télécharger un fichier depuis un serveur avec un certificat SSL invalide, par exemple expiré ou non provenant d'un émetteur de confiance, vous pouvez utiliser le --no-check- certificate pour forcer wget à ignorer ces erreurs.

wget --no-check-certificate https://18.7.29.125/archlinux/iso/2022.04.05/archlinux-2022.04.05-x86_64.iso

10. Téléchargez le contenu d'un site Web à l'aide de Wget

La commande wget peut également être utilisée pour télécharger l'intégralité du contenu d'un site Web. Vous pouvez donc utiliser l'option -m pour créer un miroir de site Web.

Cela créera une copie locale complète du site Web en suivant et en téléchargeant tous les liens internes et les ressources du site Web.

wget -m -k -p -P /tmp/web/ https://www.example.com
-m

Rend votre téléchargement récursif.

-k

Tous les liens seront convertis pour une utilisation hors ligne appropriée.

-p

Cela inclura tous les fichiers nécessaires tels que les images, CSS, JS, etc.

-P

Garantit que tout le contenu va dans notre répertoire /tmp/web/ spécifié.

Une fois le processus terminé, vous pourrez ouvrir le site Web téléchargé localement et localiser tous les fichiers dans le répertoire /tmp/web/.

Conclusion

En complétant ce guide, vous avez appris les utilisations les plus courantes de la commande wget. Vous pouvez désormais l'utiliser pour télécharger plusieurs fichiers à la fois, reprendre des téléchargements partiels, mettre en miroir des sites Web et combiner les options wget pour répondre à vos besoins spécifiques.

En plus de cet article, si vous préférez utiliser le client GUI pour télécharger des fichiers plus volumineux qui disposent généralement également d'une option de téléchargement torrent, nous vous recommandons notre guide : « Meilleurs clients torrent que vous pouvez utiliser sur Linux Desktop ».

Pour des informations plus détaillées sur la commande wget , vous pouvez accéder à la page de manuel de la commande.

Articles connexes: