Как загрузить весь веб-сайт для чтения в автономном режиме

Как загрузить весь веб-сайт для чтения в автономном режиме

Хотя в наши дни Wi-Fi доступен повсюду, время от времени вы можете оказаться без него. И когда вы это сделаете, могут быть веб-сайты, которые вы хотели бы сохранить, чтобы у вас был доступ к ним в автономном режиме - возможно, для исследований, развлечений или просто для потомков.





Сохранять отдельные веб-страницы для чтения в автономном режиме довольно просто, но что, если вы хотите загрузить весь веб-сайт? Не волнуйтесь, это проще, чем вы думаете. Но не верьте нам на слово. Вот несколько изящных инструментов, которые можно использовать для загрузки любого веб-сайта для чтения в автономном режиме - без каких-либо проблем.





1. WebCopy

WebCopy от Cyotek берет URL-адрес веб-сайта и сканирует его на наличие ссылок, страниц и мультимедиа. При нахождении страниц он рекурсивно ищет больше ссылок, страниц и мультимедиа, пока не будет обнаружен весь веб-сайт. Затем вы можете использовать параметры конфигурации, чтобы решить, какие части загружать в автономном режиме.





В WebCopy интересно то, что вы можете создать несколько проектов, каждый из которых имеет свои собственные настройки и конфигурации. Это упрощает повторную загрузку множества сайтов в любое время и каждый раз одинаково точно.

Один проект может копировать множество веб-сайтов, поэтому используйте их с упорядоченным планом (например, «технический» проект для копирования технических сайтов).



как сделать exe файл

Как загрузить весь сайт с помощью WebCopy

  1. Установите и запустите приложение.
  2. Перейдите к Файл> Создать для создания нового проекта.
  3. Введите URL-адрес в Веб-сайт поле.
  4. Изменить Сохранить папку поле, в которое вы хотите сохранить сайт.
  5. Поиграйте с Проект> Правила… ( узнать больше о правилах WebCopy ).
  6. Перейдите к Файл> Сохранить как… чтобы сохранить проект.
  7. Нажмите Копировать на панели инструментов, чтобы начать процесс.

После завершения копирования вы можете использовать Полученные результаты Вкладка, чтобы увидеть статус каждой отдельной страницы и / или медиафайла. В Ошибки вкладка показывает все проблемы, которые могли возникнуть, а Пропущено вкладка показывает файлы, которые не были загружены.

Связанный: Лучшие приложения для сохранения статей для чтения в автономном режиме





Но самое главное - это Карта сайта , который показывает полную структуру каталогов веб-сайта, обнаруженную WebCopy.

Чтобы просмотреть веб-сайт в автономном режиме, откройте проводник и перейдите в указанную вами папку для сохранения. Открыть index.html (или иногда index.htm ) в выбранном вами браузере, чтобы начать просмотр.





Скачать: WebCopy для Окна (Бесплатно)

2. HTTrack

HTTrack более известен, чем WebCopy, и, возможно, лучше, потому что он имеет открытый исходный код и доступен на платформах, отличных от Windows. Интерфейс немного неуклюжий и оставляет желать лучшего, однако работает хорошо, так что пусть это вас не отпугнет.

Как и WebCopy, он использует проектный подход, который позволяет копировать несколько веб-сайтов и сохранять их все организованными. Вы можете приостанавливать и возобновлять загрузку, а также обновлять скопированные веб-сайты, повторно загружая старые и новые файлы.

Как загрузить полный сайт с HTTrack

  1. Установите и запустите приложение.
  2. Нажмите Следующий чтобы начать создание нового проекта.
  3. Дайте проекту имя, категорию, базовый путь, затем нажмите Следующий .
  4. Выбирать Загрузить веб-сайты for Action, затем введите URL-адрес каждого веб-сайта в поле Веб-адреса поле, по одному URL в строке. Вы также можете сохранить URL-адреса в файле TXT и импортировать его, что удобно, если вы хотите повторно загрузить те же сайты позже. Нажмите Следующий .
  5. Если хотите, настройте параметры, затем нажмите Заканчивать .

Как только все будет загружено, вы можете просматривать сайт как обычно, перейдя туда, где были загружены файлы, и открыв index.html или index.htm в браузере.

как получить Microsoft Office дешево

Как использовать HTTrack с Linux

Если вы пользователь Ubuntu, вот как вы можете использовать HTTrack для сохранения всего веб-сайта:

  1. Запустить Терминал и введите следующую команду: sudo apt-get install httrack
  2. Он запросит ваш пароль Ubuntu (если вы его установили). Введите его и нажмите Входить . Терминал загрузит инструмент через несколько минут.
  3. Наконец, введите эту команду и нажмите Входить . Для этого примера мы загрузили популярный веб-сайт, Сборы мозгов . httrack https://www.brainpickings.org/
  4. Это загрузит весь веб-сайт для чтения в автономном режиме.

Вы можете заменить здесь URL-адрес веб-сайта на URL-адрес любого веб-сайта, который вы хотите загрузить. Например, если вы хотите загрузить всю Британскую энциклопедию, вам придется настроить свою команду на это:

httrack https://www.britannica.com/

Скачать: HTTrack для Windows и Linux | Android (Бесплатно)

3. SiteSucker

Если вы используете Mac, ваш лучший вариант - SiteSucker . Этот простой инструмент копирует целые веб-сайты, поддерживает ту же структуру, а также включает все соответствующие медиафайлы (например, изображения, PDF-файлы, таблицы стилей).

У него чистый и простой в использовании интерфейс - вы буквально вставляете URL-адрес веб-сайта и нажимаете Входить .

Одной из отличных функций является возможность сохранить загрузку в файл, а затем использовать этот файл для загрузки тех же файлов и структуры снова в будущем (или на другом компьютере). Эта функция также позволяет SiteSucker приостанавливать и возобновлять загрузки.

SiteSucker стоит около 5 долларов и не поставляется с бесплатной версией или бесплатной пробной версией, что является его самым большим недостатком. Для последней версии требуется macOS 11 Big Sur или выше. Старые версии SiteSucker доступны для старых систем Mac, но некоторые функции могут отсутствовать.

Скачать : SiteSucker для iOS | Mac (4,99 доллара США)

Четыре. Wget

Wget - это утилита командной строки, которая может получать все типы файлов по протоколам HTTP и FTP. Поскольку веб-сайты обслуживаются через HTTP, а большинство файлов веб-мультимедиа доступны через HTTP или FTP, это делает Wget отличным инструментом для загрузки целых веб-сайтов.

Связанный: Как скачать книги из Google Книги

Wget входит в состав большинства систем на базе Unix. Хотя Wget обычно используется для загрузки отдельных файлов, его также можно использовать для рекурсивной загрузки всех страниц и файлов, найденных на начальной странице:

как сохранить файл иллюстратора в формате jpeg
wget -r -p https://www.makeuseof.com

В зависимости от размера загрузка всего веб-сайта может занять некоторое время.

Однако некоторые сайты могут обнаруживать и предотвращать то, что вы пытаетесь сделать, потому что копирование веб-сайта может стоить им большой пропускной способности. Чтобы обойти это, вы можете замаскироваться под веб-браузер с помощью строки пользовательского агента:

wget -r -p -U Mozilla https://www.thegeekstuff.com

Если вы хотите быть вежливым, вам также следует ограничить скорость загрузки (чтобы не перегружать полосу пропускания веб-сервера) и делать паузу между каждой загрузкой (чтобы не перегружать веб-сервер слишком большим количеством запросов):

wget -r -p -U Mozilla --wait=10 --limit-rate=35K https://www.thegeekstuff.com

Как использовать Wget на Mac

На Mac вы можете установить Wget с помощью одной команды Homebrew: варить установить wget .

  1. Если у вас еще не установлен Homebrew, загрузите его с помощью этой команды: /usr/bin/ruby -e '$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)'
  2. Затем установите Wget с помощью этой команды: brew install wget
  3. После завершения установки Wget вы можете загрузить веб-сайт с помощью этой команды: wget path/to/local.copy http://www.brainpickings.org/

В Windows вам нужно будет использовать эта перенесенная версия вместо. Загрузите и установите приложение и следуйте инструкциям, чтобы завершить загрузку сайта.

Легко загружать целые сайты

Теперь, когда вы знаете, как загрузить веб-сайт целиком, вас никогда не поймают без чего-либо для чтения, даже если у вас нет доступа в Интернет. Но помните: чем больше размер сайта, тем больше загрузка. Мы не рекомендуем загружать крупные сайты, такие как MUO, потому что вам понадобятся тысячи МБ для хранения всех медиа-файлов, которые мы используем.

Делиться Делиться Твитнуть Эл. адрес Как загрузить полную веб-страницу для чтения в автономном режиме

Используйте эти методы, чтобы сохранять веб-страницы для чтения в автономном режиме и держать любимые веб-страницы под рукой, когда они вам больше всего нужны.

Читать далее
Похожие темы
  • Интернет
  • Резервное копирование данных
  • Автономный просмотр
  • Советы по загрузке
Об авторе Шахта Шаант(Опубликовано 58 статей)

Шаант - штатный писатель в MUO. Получив образование в области компьютерных приложений, он использует свою страсть к письму, чтобы объяснять сложные вещи простым английским языком. Когда он не занимается исследованиями и не пишет, его можно застать за чтением хорошей книги, бегом или гулянием с друзьями.

Ещё от Shaant Minhas

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Нажмите здесь, чтобы подписаться