Tạo bản sao ngoại tuyến của trang web bằng Wget trên Windows và Linux
Đôi khi bạn cần lấy một bản sao có thể duyệt được của một trang web để có thể truy cập ngoại tuyến, cắm thẻ USB hoặc thậm chí tải lên điện thoại thông minh của bạn và đọc khi đang bay hoặc đi du lịch. Trong khi các trình duyệt và hệ điều hành hiện đại có thể dễ dàng lưu một trang web thành PDF, nhưng việc xử lý từng trang có thể gây khó chịu. Đây là wget.
Quảng cáo
Wget là một trình quản lý tải xuống mã nguồn mở. Nó là một ứng dụng console được phát triển chủ yếu cho Linux, nhưng đã được chuyển thành công trên các hệ điều hành khác, bao gồm cả Windows và MacOS.
bạn có thể sử dụng groupme mà không cần số điện thoại không
Nếu bạn không quen thuộc với wget, bạn chắc chắn nên thử nó. Nó rất mạnh mẽ. Nó cho phép tìm nạp các tệp từ các trang web bằng HTTP, HTTPS và FTP, các giao thức Internet mà chúng ta đang sử dụng ngày nay. Hành vi của nó được kiểm soát bởi các đối số dòng lệnh.
Wget hỗ trợ nhiều tùy chọn khác nhau để truy xuất tệp trên các kết nối chậm hoặc không ổn định, bao gồm thử lại, tiếp tục từ nơi nó rời đi, v.v. Nó hỗ trợ tệp 'robots.txt', vì vậy nó có thể hoạt động giống như một trình thu thập thông tin web. Nó chỉ có thể truy xuất các tệp đã sửa đổi, hỗ trợ ký tự đại diện, giới hạn loại tệp và phần mở rộng thông thường.
Wget hỗ trợ truy xuất đệ quy các trang web HTML và máy chủ FTP, cho phép bạn tạo một bản sao trang web. Đây là cách nó có thể được thực hiện.
Trước khi tiếp tục, bạn cần tải ứng dụng wget.
Tải Wget trên Windows
Tôi thường sử dụng mã nhị phân từ các nguồn sau:
Cả hai đều làm công việc của họ.
Nhận Wget trên Linux
Sử dụng trình quản lý gói của bản phân phối của bạn. Một số ví dụ (chạy họ là gốc ):
Debian / Ubuntu / Mint:
apt cài đặt wget
CentOS / Redhat
yum cài đặt wget
Arch Linux
pacman -Sy wget
Void Linux
xbps-install -S wget
Để tạo bản sao ngoại tuyến của trang web bằng Wget,
- Mở dấu nhắc lệnh / thiết bị đầu cuối .
- Trên Windows, nhập đường dẫn đầy đủ đến tệp wget.exe.
- Trên Linux, chỉ gõ wget.
- Bây giờ, hãy nhập các đối số sau để nhận lệnh sau:
wget --mirror --convert-links --adjust-extension --page-precision --no-parent https://site-to-download.com
- Thay thế cái
https://site-to-download.com
với URL của trang web thực tế mà bạn muốn tạo ra.
Bạn xong việc rồi!
Đây là các công tắc chúng tôi sử dụng:
--gương
- áp dụng một số tùy chọn để thực hiện tải xuống đệ quy.--không có cha mẹ
- Không thu thập thông tin thư mục mẹ để chỉ lấy một phần của trang web.--convert-links
- làm cho tất cả các liên kết hoạt động bình thường với bản sao ngoại tuyến.- trang-điều kiện cần
- tải xuống các tệp JS và CSS để giữ lại kiểu trang gốc khi duyệt máy nhân bản cục bộ.--adjust-extension
- thêm các phần mở rộng thích hợp (ví dụ: html, css, js) vào các tệp nếu chúng được truy xuất mà không có chúng.
Đó là nó.