Как удалить избыточные данные в Linux с помощью Fdupes

Никто не любит повторяющиеся файлы. Они занимают ненужное место в системе и мешают. К счастью, в Linux есть способ удалить избыточные данные и очистить повторяющиеся файлы с помощью Fdupes.

Установить Fdupes

Инструмент Fdupes — один из лучших инструментов командной строки для дедупликации на платформе Linux. При запуске он может сканировать любой каталог на наличие дубликатов файлов, определять их точное местоположение и превращать дубликаты в символические ссылки — как жесткие, так и программные ссылки. Лучше всего то, что превращая дубликаты в системные ссылки, он уменьшает пространство, сохраняя при этом файлы нетронутыми в одном месте.

Fdupes легко установить и имеет широкую поддержку в большинстве имеющихся дистрибутивов Linux. Фактически, даже FreeBSD имеет доступное программное обеспечение. Чтобы программа заработала, запустите терминал и введите команды, соответствующие вашей операционной системе Linux.

Ubuntu

sudo apt install fdupes

Debian

sudo apt-get install fdupes

Arch Linux

Fdupes находится в Arch Linux через репозиторий «Сообщество». К сожалению, репо «Сообщество» не настроено по умолчанию. Чтобы установить эту программу, вам сначала нужно отредактировать файл Pacman.conf.

  Как играть в Mirror's Edge в Linux

Чтобы отредактировать файл конфигурации, откройте его в текстовом редакторе Nano.

sudo nano /etc/pacman.conf

В файле конфигурации удалите знак «#» перед всем, что связано с «Сообществом». Имейте в виду, что каждый символ «#» должен быть удален, иначе репо не будет работать. По завершении редактирования сохраните его, нажав Ctrl + O, и выйдите, нажав Ctrl + X.

Синхронизируйте новое репозиторий сообщества с Pacman.

sudo pacman -Syy

Теперь, когда исходный код программного обеспечения «Сообщество» успешно синхронизирован, Arch Linux имеет полный доступ к нему. Завершите процесс, установив приложение Fdupes через диспетчер пакетов.

sudo pacman -S fdupes

Fedora

sudo dnf install fdupes

OpenSUSE

sudo zypper install fdupes

Сканировать на наличие дубликатов

Прежде чем Fdupes сможет удалить избыточные файлы, он должен знать, где они находятся. Чтобы найти файлы, вам нужно использовать переключатель r. С переключателем r вы сможете искать в каждой папке на вашем ПК с Linux, а также во всех подпапках, что значительно ускоряет поиск дубликатов.

Следуйте приведенным ниже инструкциям, чтобы узнать, как найти и удалить повторяющиеся файлы в нескольких местах на вашем ПК с Linux.

  9 лучших причин использовать Ubuntu Linux

Дубликаты в домашней папке

Одно из основных мест, где пользователи хранят файлы, — это / home /. Причина, по которой в этой папке хранится множество файлов, заключается в том, что сюда помещается все, что пользователь делает в Linux. В результате со временем файлы накапливаются и часто дублируются. Чтобы найти эти дубликаты, откройте терминал и укажите fdupes в своей домашней папке.

fdupes -r ~/

или, чтобы просканировать другого пользователя на вашем ПК, который в данный момент не вошел в систему, выполните:

fdupes -r /home/username/

После запуска сканирования инструмент вернет полный список дубликатов, которые он найдет в домашнем каталоге. Чтобы сохранить эту информацию, направьте вывод в файл в папке «Документы».

fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt

или же

fdupes -r /home/username/ >> ~/Documents/fdupes-scan-home-user.txt

Дубликаты в корневой файловой системе

Fdupes может сканировать любое место, а не только домашнюю папку. Если вы пытаетесь найти повторяющиеся файлы в корневой файловой системе вашего ПК с Linux, вот что нужно делать.

В терминале измените оболочку с обычного пользователя на учетную запись root. Переход с традиционной учетной записи на Root позволит приложению Fdupes сканировать в местах, недоступных для нормальной настройки.

sudo -s

или же

su -

От имени пользователя root просканируйте корневую файловую систему с помощью Fdupes.

fdupes -r /

В качестве альтернативы просканируйте определенное место, а не всю корневую систему, с помощью:

fdupes -r /location/on/your/pc

Нужно экспортировать результаты сканирования в файл для дальнейшего использования? Запустите эту команду.

fdupes -r / >> /home/username/Documents/fdupes-scan.txt

или же

fdupes -r /location/on/your/pc >> /home/username/Documents/fdupes-scan.txt

Удалить избыточные данные

Сканирование дубликатов файлов — важная часть удаления избыточных данных. Следующим шагом является обработка результатов и устранение дублирования. К счастью, избавиться от избыточных данных невероятно быстро. Лучше всего то, что на самом деле ничего не нужно удалять, поскольку Fdupes поддерживает замену реальных файлов символическими ссылками.

  Как запустить Foobar2000 в Linux

Fdupes поддерживает два типа дедупликации: жесткие ссылки и мягкие ссылки. Для достижения наилучших результатов мы рекомендуем использовать жесткие ссылки, поскольку они неотличимы от реальных файлов. Однако мягкие символические ссылки также работают. Чтобы выполнить дедупликацию, выполните в терминале следующие действия.

Примечание. Не заменяйте дублирующиеся данные в масштабах всей системы, если вы не понимаете возможных рисков!

Замена жесткой ссылки

fdupes -rH /home/username/

или для общесистемных дубликатов:

sudo -s
fdupes -rH /root/file/location

Мягкая ссылка заменить

fdupes -rS /home/username/

или для всей системы:

fdupes -rS /root/file/location