Скачать сайт c помощью Wget. Как пользоваться Wget?
Все мы что-то скачиваем в интернете, обычно все происходит в пару кликов нажал на кнопку скачать и все, но что если нам нужно скачать сразу несколько файлов или к примеру целый сайт целиком, для этого нам поможет программа Wget.
Wget – мощный инструмент пришедший к нам из мира Linux, подходящий для выполнения различных видов загрузки. Wget является бесплатной программой, что делает ее доступной абсолютно каждому.
Главные плюсы программы Wget :
- Функциональность (позволяет скачивать от одного файла до целого сайта).
- Докачка файлов (Wget поддерживает докачку файла в случае обрыва соединения).
- Распространяется бесплатно.
Небольшим минусом является работа и запуск через консоль.
Установка Wget
Для установки Wget перейдите по ссылке и скачайте архив с установочным exe-файлом. Запустите exe-файл и установите Wget, программа устанавливается в папку C:\Program Files (x86)\GnuWin32 по умолчанию.
После установки программа Wget должна выглядеть так.
Для запуска программы нам понадобится командная строка, запускаем ее через меню пуск или с помощью клавиш Win+R, в открывшемся окне ввести "cmd" и нажать Enter.
После появления командной строки нужно указать местоположение файла wget.exe который находится в папке bin с помощью команды:
path C:\Program Files (x86)\GnuWin32\bin
Теперь можно запустить Wget.
Рассмотрим несколько основных параметров программы Wget:
Вывод команды help со списком опций.
wget -h
Чтобы скачать файл необходимо просто указать ссылку.
wget href="https://Имя Сайта/file.png"
Чтобы продолжить загрузку не полностью загруженного файла добавить параметр "-c".
wget -c href="https://Имя Сайта/file.png"
Если файл требуется сохранить в какую-либо папку, то необходимо указать папку при помощи параметра "-P", допустим папка copy на диске D (D:\copy).
wget -P D:\copy href="https://Имя Сайта/file.png"
Если необходимо скачать сразу несколько файлов с разных сайтов, необходимо создать текстовый файл с ссылками на скачивание к примеру test.txt который находится по адресу D:\dowland\test.txt и добавить параметр "-i".
wget -i D:\dowland\test.txt
Так должен выглядеть список файлов.
Если вы хотите скачать весь сайт целиком, необходимо прописать адрес сайта к примеру https://Имя Сайта с необходимым набором параметров.
wget. -r -l 15 -k -o -p -t 2 href="https://Имя Сайта"
-r, --recursive включение рекурсивной загрузки
-l, --level= ЧИСЛО максимальная глубина рекурсии
(inf и 0 - бесконечность)
-k, --convert-links заменить ссылки в скачиваемых HTML и Css файлах
на локальные
-o, --output-file=ФАЙЛ записывать сообщения в ФАЙЛ
-p, --page-requisites загрузить все картинки и прочие файлы,
необходимые для отображения HTML-страницы
-t, --tries=ЧИСЛО установить количество повторных попыток
(0 без ограничения)
В итоге получим готовую копию сайта, которую можно будет запустить у себя на компьютере. Теперь допустим что нам нужна отдельная статья https://Имя Сайта/article добавляем к предыдущей команде доп. опцию "-np".
wget -r -l 15 -k -o -p -t 2 -np href="https://Имя Сайта/article"
-np, --no-parent не подниматься в родительский каталог
в нашем случае выше https://Имя Сайта/article скачивание не пойдет.
Внимание! Программа WGet чувствительна к регистру.
Мы вкратце рассмотрели несколько функций программы Wget, комбинируя параметрами можно достигнуть различных результатов.