Recherche de site Web

5 meilleurs outils pour rechercher et supprimer les fichiers en double sous Linux


Organiser votre répertoire personnel ou même votre système peut être particulièrement difficile si vous avez l'habitude de télécharger toutes sortes de choses depuis Internet à l'aide de vos gestionnaires de téléchargement.

Souvent, vous constaterez que vous avez téléchargé les mêmes fichiers mp3, pdf et epub (et toutes sortes d'autres extensions de fichiers) et que vous les avez copiés dans différents répertoires. Cela peut encombrer vos répertoires avec toutes sortes de duplications inutiles.

Dans ce didacticiel, vous allez apprendre à rechercher et supprimer les fichiers en double sous Linux à l'aide des outils de ligne de commande rdfind, fdupes et rmlint. , ainsi que l'utilisation d'outils GUI appelés DupeGuru et FSlint.

Attention : faites toujours attention à ce que vous supprimez sur votre système, car cela pourrait entraîner une perte de données indésirable. Si vous utilisez un nouvel outil, essayez-le d'abord dans un répertoire de test où la suppression de fichiers ne posera pas de problème.

1. Rdfind – Rechercher les fichiers en double sous Linux

Rdfind provient de la recherche de données redondantes, qui est un outil de ligne de commande gratuit utilisé pour rechercher des fichiers en double dans ou dans plusieurs répertoires. Il analyse de manière récursive les répertoires et identifie les fichiers ayant un contenu identique, vous permettant de prendre les actions appropriées telles que la suppression ou le déplacement des doublons.

Rdfind utilise un algorithme pour classer les fichiers et détecte lequel des doublons est le fichier d'origine et considère le reste comme des doublons.

Les règles de classement sont :

  • Si A a été trouvé lors de l'analyse d'un argument d'entrée avant B, A est mieux classé.
  • Si A a été trouvé à une profondeur inférieure à B, A est mieux classé.
  • Si A a été trouvé plus tôt que B, A est mieux classé.

La dernière règle est notamment utilisée lorsque deux fichiers se trouvent dans le même répertoire.

Installer Rdfind sur Linux

Pour installer rdfind sous Linux, utilisez la commande suivante selon votre distribution Linux.

sudo apt install rdfind         [On Debian, Ubuntu and Mint]
sudo yum install rdfind         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rdfind  [On Gentoo Linux]
sudo apk add rdfind             [On Alpine Linux]
sudo pacman -S rdfind           [On Arch Linux]
sudo zypper install rdfind      [On OpenSUSE]    

Pour exécuter rdfind sur un répertoire, tapez simplement rdfind et le répertoire cible.

rdfind /home/user

Comme vous pouvez le voir, rdfind enregistrera les résultats dans un fichier appelé results.txt situé dans le même répertoire à partir duquel vous avez exécuté le programme. Le fichier contient tous les fichiers en double trouvés par rdfind. Vous pouvez consulter le fichier et supprimer manuellement les fichiers en double si vous le souhaitez.

Une autre chose que vous pouvez faire est d'utiliser l'option -dryrun qui fournira une liste des doublons sans aucune action :

rdfind -dryrun true /home/user

Lorsque vous trouvez les doublons, vous pouvez choisir de les remplacer par des liens physiques.

rdfind -makehardlinks true /home/user

Et si vous souhaitez supprimer les doublons, vous pouvez exécuter.

rdfind -deleteduplicates true /home/user

Pour vérifier d'autres options utiles de rdfind, vous pouvez utiliser le manuel de rdfind.

man rdfind 

2. Fdupes – Rechercher les fichiers en double sous Linux

Fdupes est un autre programme de ligne de commande qui vous permet d'identifier les fichiers en double sur votre système. Il recherche les répertoires de manière récursive, en comparant la taille et le contenu des fichiers pour identifier les doublons.

Il utilise les méthodes suivantes pour déterminer les fichiers en double :

  • Comparaison des signatures partielles md5sum
  • Comparaison des signatures md5sum complètes
  • vérification de comparaison octet par octet

Tout comme rdfind, il propose des options similaires :

  • Rechercher de manière récursive
  • Exclure les fichiers vides
  • Affiche la taille des fichiers en double
  • Supprimez immédiatement les doublons
  • Exclure les fichiers avec un autre propriétaire

Installer Fdupes sous Linux

Pour installer fdupes sous Linux, utilisez la commande suivante selon votre distribution Linux.

sudo apt install fdupes         [On Debian, Ubuntu and Mint]
sudo yum install fdupes         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fdupes  [On Gentoo Linux]
sudo apk add fdupes             [On Alpine Linux]
sudo pacman -S fdupes           [On Arch Linux]
sudo zypper install fdupes      [On OpenSUSE]    

La syntaxe Fdupes est similaire à rdfind. Tapez simplement la commande suivie du répertoire que vous souhaitez analyser.

fdupes <dir>

Pour rechercher des fichiers de manière récursive, vous devrez spécifier le -r une option comme celle-ci.

fdupes -r <dir>

Vous pouvez également spécifier plusieurs répertoires et spécifier un dir dans lequel effectuer la recherche récursive.

fdupes <dir1> -r <dir2>

Pour que fdupes calcule la taille des fichiers en double, utilisez l'option -S.

fdupes -S <dir>

Pour rassembler des informations résumées sur les fichiers trouvés, utilisez l'option -m.

fdupes -m <dir>

Enfin, si vous souhaitez supprimer tous les doublons, utilisez le -d une option comme celle-ci.

fdupes -d <dir>

Fdupes demandera lequel des fichiers trouvés supprimer. Vous devrez saisir le numéro de dossier :

Une solution fortement déconseillée est d'utiliser l'option -N qui aura pour conséquence de conserver uniquement le premier fichier.

fdupes -dN <dir>

Pour obtenir une liste des options disponibles à utiliser avec fdupes, consultez la page d'aide en exécutant.

fdupes -help

3. Rmlint – Supprimer les fichiers en double

Rmlint est un outil de ligne de commande utilisé pour rechercher et supprimer les fichiers en double et ressemblant à des peluches dans les systèmes Linux. Il permet d'identifier les fichiers ayant un contenu identique, ainsi que diverses formes de redondance ou de peluches, telles que des fichiers vides, des liens symboliques rompus et des fichiers orphelins.

Installer Rmlint sur Linux

Pour installer Rmlint sous Linux, utilisez la commande suivante selon votre distribution Linux.

sudo apt install rmlint         [On Debian, Ubuntu and Mint]
sudo yum install rmlint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rmlint  [On Gentoo Linux]
sudo apk add rmlint             [On Alpine Linux]
sudo pacman -S rmlint           [On Arch Linux]
sudo zypper install rmlint      [On OpenSUSE]    

4. dupeGuru – Rechercher les fichiers en double sous Linux

dupeGuru est un outil open source et multiplateforme qui peut être utilisé pour rechercher des fichiers en double dans un système Linux. L'outil peut analyser les noms de fichiers ou le contenu d'un ou plusieurs dossiers. Il vous permet également de trouver le nom de fichier similaire aux fichiers que vous recherchez.

dupeGuru est disponible en différentes versions pour les plates-formes Windows, Mac et Linux. Sa fonction d'algorithme de correspondance floue rapide vous aide à trouver les fichiers en double en une minute. Il est personnalisable, vous pouvez extraire les fichiers en double exacts que vous souhaitez et effacer les fichiers indésirables du système.

Installer dupeGuru sur Linux

Pour installer dupeGuru sous Linux, utilisez la commande suivante selon votre distribution Linux.

sudo apt install dupeguru         [On Debian, Ubuntu and Mint]
sudo yum install dupeguru         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/dupeguru  [On Gentoo Linux]
sudo apk add dupeguru             [On Alpine Linux]
sudo pacman -S dupeguru           [On Arch Linux]
sudo zypper install dupeguru      [On OpenSUSE]    

5. FSlint – Recherche de fichiers en double pour Linux

FSlint est un utilitaire gratuit utilisé pour rechercher et nettoyer diverses formes de peluches sur un système de fichiers. Il signale également les fichiers en double, les répertoires vides, les fichiers temporaires, les noms (binaires) en double/en conflit, les mauvais liens symboliques et bien d'autres. Il dispose à la fois de modes ligne de commande et GUI.

Cependant, il est important de noter qu'à ma connaissance, en septembre 2022, FSlint a été mis à jour pour la dernière fois en 2013 et peut ne pas être activement maintenu ou compatible avec les distributions Linux plus récentes.

Installer FSlint sur Linux

Pour installer FSlint sous Linux, utilisez la commande suivante selon votre distribution Linux.

sudo apt install fslint         [On Debian, Ubuntu and Mint]
sudo yum install fslint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fslint  [On Gentoo Linux]
sudo apk add fslint             [On Alpine Linux]
sudo pacman -S fslint           [On Arch Linux]
sudo zypper install fslint      [On OpenSUSE]    

Conclusion

Ce sont des outils très utiles pour rechercher des fichiers en double sur votre système Linux, mais vous devez être très prudent lorsque vous supprimez de tels fichiers.

Si vous ne savez pas si vous avez besoin d'un fichier ou non, il serait préférable de créer une sauvegarde de ce fichier et de mémoriser son répertoire avant de le supprimer. Si vous avez des questions ou des commentaires, veuillez les soumettre dans la section commentaires ci-dessous.