Никто не любит повторяющиеся файлы. Они занимают ненужное место в системе и мешают. К счастью, в Linux есть способ удалить избыточные данные и очистить повторяющиеся файлы с помощью Fdupes.
Оглавление
Установить Fdupes
Инструмент Fdupes — один из лучших инструментов командной строки для дедупликации на платформе Linux. При запуске он может сканировать любой каталог на наличие дубликатов файлов, определять их точное местоположение и превращать дубликаты в символические ссылки — как жесткие, так и программные ссылки. Лучше всего то, что превращая дубликаты в системные ссылки, он уменьшает пространство, сохраняя при этом файлы нетронутыми в одном месте.
Fdupes легко установить и имеет широкую поддержку в большинстве имеющихся дистрибутивов Linux. Фактически, даже FreeBSD имеет доступное программное обеспечение. Чтобы программа заработала, запустите терминал и введите команды, соответствующие вашей операционной системе Linux.
Ubuntu
sudo apt install fdupes
Debian
sudo apt-get install fdupes
Arch Linux
Fdupes находится в Arch Linux через репозиторий «Сообщество». К сожалению, репо «Сообщество» не настроено по умолчанию. Чтобы установить эту программу, вам сначала нужно отредактировать файл Pacman.conf.
Чтобы отредактировать файл конфигурации, откройте его в текстовом редакторе Nano.
sudo nano /etc/pacman.conf
В файле конфигурации удалите знак «#» перед всем, что связано с «Сообществом». Имейте в виду, что каждый символ «#» должен быть удален, иначе репо не будет работать. По завершении редактирования сохраните его, нажав Ctrl + O, и выйдите, нажав Ctrl + X.
Синхронизируйте новое репозиторий сообщества с Pacman.
sudo pacman -Syy
Теперь, когда исходный код программного обеспечения «Сообщество» успешно синхронизирован, Arch Linux имеет полный доступ к нему. Завершите процесс, установив приложение Fdupes через диспетчер пакетов.
sudo pacman -S fdupes
Fedora
sudo dnf install fdupes
OpenSUSE
sudo zypper install fdupes
Сканировать на наличие дубликатов
Прежде чем Fdupes сможет удалить избыточные файлы, он должен знать, где они находятся. Чтобы найти файлы, вам нужно использовать переключатель r. С переключателем r вы сможете искать в каждой папке на вашем ПК с Linux, а также во всех подпапках, что значительно ускоряет поиск дубликатов.
Следуйте приведенным ниже инструкциям, чтобы узнать, как найти и удалить повторяющиеся файлы в нескольких местах на вашем ПК с Linux.
Дубликаты в домашней папке
Одно из основных мест, где пользователи хранят файлы, — это / home /. Причина, по которой в этой папке хранится множество файлов, заключается в том, что сюда помещается все, что пользователь делает в Linux. В результате со временем файлы накапливаются и часто дублируются. Чтобы найти эти дубликаты, откройте терминал и укажите fdupes в своей домашней папке.
fdupes -r ~/
или, чтобы просканировать другого пользователя на вашем ПК, который в данный момент не вошел в систему, выполните:
fdupes -r /home/username/
После запуска сканирования инструмент вернет полный список дубликатов, которые он найдет в домашнем каталоге. Чтобы сохранить эту информацию, направьте вывод в файл в папке «Документы».
fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt
или же
fdupes -r /home/username/ >> ~/Documents/fdupes-scan-home-user.txt
Дубликаты в корневой файловой системе
Fdupes может сканировать любое место, а не только домашнюю папку. Если вы пытаетесь найти повторяющиеся файлы в корневой файловой системе вашего ПК с Linux, вот что нужно делать.
В терминале измените оболочку с обычного пользователя на учетную запись root. Переход с традиционной учетной записи на Root позволит приложению Fdupes сканировать в местах, недоступных для нормальной настройки.
sudo -s
или же
su -
От имени пользователя root просканируйте корневую файловую систему с помощью Fdupes.
fdupes -r /
В качестве альтернативы просканируйте определенное место, а не всю корневую систему, с помощью:
fdupes -r /location/on/your/pc
Нужно экспортировать результаты сканирования в файл для дальнейшего использования? Запустите эту команду.
fdupes -r / >> /home/username/Documents/fdupes-scan.txt
или же
fdupes -r /location/on/your/pc >> /home/username/Documents/fdupes-scan.txt
Удалить избыточные данные
Сканирование дубликатов файлов — важная часть удаления избыточных данных. Следующим шагом является обработка результатов и устранение дублирования. К счастью, избавиться от избыточных данных невероятно быстро. Лучше всего то, что на самом деле ничего не нужно удалять, поскольку Fdupes поддерживает замену реальных файлов символическими ссылками.
Fdupes поддерживает два типа дедупликации: жесткие ссылки и мягкие ссылки. Для достижения наилучших результатов мы рекомендуем использовать жесткие ссылки, поскольку они неотличимы от реальных файлов. Однако мягкие символические ссылки также работают. Чтобы выполнить дедупликацию, выполните в терминале следующие действия.
Примечание. Не заменяйте дублирующиеся данные в масштабах всей системы, если вы не понимаете возможных рисков!
Замена жесткой ссылки
fdupes -rH /home/username/
или для общесистемных дубликатов:
sudo -s fdupes -rH /root/file/location
Мягкая ссылка заменить
fdupes -rS /home/username/
или для всей системы:
fdupes -rS /root/file/location