Wéi benotze de wget Linux Command fir Webseiten a Dateien z'änneren

De Wget Utility erlaabt Iech Websäiten, Dateien an Biller aus dem Netz mat der Linux Command Line ze downloaden.

Dir kënnt e Wuert aus engem eegene Kommando benotze fir e Site aus engem Site ze lueden oder eng Input- Datei opzemaachen, fir verschidde Fichieren iwwer verschidde Site ze liesen.

Laut der manuell Websäit wget kann benotzt ginn souguer wann de Benotzer aus dem System ausgeliwwert gouf. Fir dat ze benotzen, brauch Dir de nohup Kommando ze benotzen.

De Wget Utility schreift e Download erof, och wann d'Verbindung e futti geet, an domat zréckgezunn wann et geet wann et méiglech ass wann d'Verbindung zeréckkënnt.

Dir kënnt ganze Websäiten wëlle benotze fir Wëtz an d'Linken ze konvertéieren fir op lokal Quellen ze weisen datt Dir eng Websäit offline gesinn.

D'Features vu wget sinn déi folgend:

Wéi Dir e Web Site wzt

Fir dësen Guide wäert ech Iech weisen, wéi ech meng perséinlech Blog ze downloaden.

wget www.everydaylinuxuser.com

Et ass Wäert, Äre eegene Fichier op Ärer Maschin ze schafen mat dem Befehl mkdir an dann an den Ordner mam cd Kommando ze goen .

Zum Beispill:

mkdir everydaylinuxuser
cd everydaylinuxuser
wget www.everydaylinuxuser.com

D'Resultat ass eng eenzeg index.html Datei. Op senger eegener Säit ass dës Fichier zimlech nëtzlech wéi de Inhalt nach ëmmer vu Google zitt an d'Biller an Stylesheets ginn nach ëmmer op Google gehaal.

Fir déi ganz Säit an all Säiten déi de folgenden Kommando benotze kann:

wget -r www.everydaylinuxuser.com

Dëst luedt déi Säiten recursiv bis zu maximal 5 Niveaue.

5 Niveauen déif kënne net genuch sinn fir alles vum Site ze kréien. Dir kënnt de -l Schalter benotze fir d'Zuel vun Niveauen déi Dir wëllt folgen:

wget -r -l10 www.everydaylinuxuser.com

Wann Dir Loscht hutt, onendlech Rekursioun kënnt Dir déi folgend sinn:

wget -r -l inf www.everydaylinuxuser.com

Dir kënnt och den inf infolge 0 benotze fir datt déi selwecht Saach ass.

Et gëtt ëmmer nach e bësse Problem. Dir kënnt all d'Säiten lokal fannen, awer all d'Links op de Säiten weisen op hir originell Plaz. Et ass also net méiglech lokal ze klickt tëschent den Links op de Säiten.

Dir kënnt dëst Problem erofhuelen andeems de -k Schalter benotzt deen all d'Linken op de Säiten konvertéiert a weist op lokal wéi déi erofgeloossene equivalent wéi folgend:

wget -r -k www.everydaylinuxuser.com

Wann Dir wëllt en komplette Spigel vun enger Websäit kréien, kënnt Dir einfach de folgenden Schalter benotze fir d'Notzung vun der -r -k a -l Schalter ze huelen.

wget -m www.everydaylinuxuser.com

Dofir, wann Dir Är eegene Websäit hutt, kënnt Dir e komplette Backup benotzen mat dësem einfachen Kommando.

Fuerder wéi e Background Command

Dir kënnt wget fir als Hintergrundbefehl lafe loossen, fir datt Dir mat Äre Wierker am Terminalfenster lass geet, während d'Dateien eroflueden.

Fuert einfach de nächste Kommando:

wget -b www.everydaylinuxuser.com

Dir kënnt natierlech d'Schalter verbannen. Fir de Wget-Kommando am Hannergrond ze laafen, während de Site mir mir spigelt, wäerte de nächste Kommando benotzen:

wget -b -m www.everydaylinuxuser.com

Dir kënnt et weider maachen wéi folgend:

wget -bm www.everydaylinuxuser.com

Logged

Wann Dir de Wget-Kommando am Hannergrond leeft, fannt Dir keng vun den normale Messagen, déi se op den Ecran schécken.

Dir kënnt all dës Mailen an eng Logfichier geschéckt kréien, fir datt Dir iergendeng Zäit mat dem Schwangbefehler iwwerpréiwen kann .

Ausgedeelt aus dem Wget-Kommando op eng Log Log Datei aus dem folgendem Kommando benotze:

wget -o / Wee / zu / mylogfile www.everydaylinuxuser.com

D'Reverse ass natierlech natierlech datt Dir Ierch a Logbicher nodenkt a keng Ausgab zum Bildschierm. Fir all Ausgab auszeschléissen de folgende Kommando:

wget -q www.everydaylinuxuser.com

Download From Multiple Sites

Dir kënnt eng Input- Datei opruffen fir vu ville verschiddene Site ze downloaden.

Öffnen e Fichier mat Ärem Lieblingsverréckler oder souguer d' Kaz vum Kommando a fänkt einfach un d'Verëffentleche vun de Siten oder Linken fir ze downloaden vun all Linn vun der Datei.

Dëss Datei speichern an dann de folgenden Witzbefehl ausféieren:

Wget -i / Wee / zu / inputfile

Niewent der Sichaktioun vun Äre eegene Websäit oder vläicht fannen datt eppes ze fannen fir op der Säit ze liesen um Zuch liesen, ass et onwahrscheinlech datt Dir eng ganz Websäit dobäischt wëllt.

Dir sidd méi wahrscheinlech fir eng eenzeg URL mat Biller ze liesen oder vläicht Dateien ze fannen wéi zip Dateie, ISO-Dateien oder Biller.

Dir musst der net an d'Input Datei setzen wann et Zäit ze konsuméieren ass:

Wann Dir wësst datt dës Basis URL ass ëmmer deeselwechte sinn, kënnt Dir déi folgend an der Input Datei spezifizéieren:

Dir kënnt d'Basisbasis als Deel vum Wget-Kommando wéi folgend erginn:

wget -B http://www.myfileserver.com -i / Wee / zu / inputfile

Retry Options

Wann Dir eng Warteschoul vu Dateien opgespaart hutt, an engem Input- Fichier ze liesen an Dir Är Computere ganze Nuecht fir de Fichier ze liesen, da sidd Dir zimlech verärgert wann Dir am Mueren erof kënnt, fir ze feststellen datt et op der éischter Datei fonnt gouf huet d'ganz Nuecht zréckgesat.

Dir kënnt d'Zuel vu Retourë benotze mat der folgender Verännerung:

wget -t 10 -i / Wee / bis / inputfile

Dir wëllt wëllt den obengenannten Kommando benotze mat der -T-Schalter, déi dir e Timeout an de Sekonnen entsprécht:

wget -t 10 -T 10 -i / Wee / bis / inputfile

Dëse Kommando wäert 10 Mol méi probéieren an probéiert 10 Sekonnen fir all Link an der Datei 10 Sekonden ze verbannen.

Et ass och zimlech lästeg, wa Dir deelweis 75% vun enger 4 Gigabyte-Datei op enger luesen Breetbandverbindung nëmme fir Är Verbindung matgedeelt hutt.

Dir kënnt Wëtz benotze fir ze retryéieren, aus deem de Parking erofgestoppt gëtt mat dem folgendem Kommando:

wget -c www.myfileserver.com/file1.zip

Wann Dir e Server hummeréieren, da kënnt de Provider et net zevill ewechkucken a blockéiert oder just wëllt Är Ufroën blockéieren.

Dir kënnt e Wartegkeets a spezifizéieren wéi laang all Wopen widderhëlt:

wget -w 60 -i / path / to / inputfile

Dëse Kommando wäerts 60 Sekonne tëscht all Download. Dëst ass nëtzlech wann Dir vill Fichier vun enger eenzeger Quell erofgelueden hutt.

E puer Websäiten kënnen d'Häk féieren awer a blockéieren Iech trotzdem. Dir kënnt d'Wartegdaach zoufälleg maachen, fir et sou ze maachen wéi Dir kee Programm programméiere wéi folgend:

wget --random-wait -i / path / to / inputfile

Schutzlimiten ze schützen

Vill Internetprovider sinn haut nach weider Limitatioune fir Äre Breetband benotzt, virun allem wann Dir ausserhalb vun enger Stad wunnt.

Dir wëllt e Quotze addéieren, fir datt Dir dës Lizenz Limit net benotzt. Dir kënnt dat op der folgender Manéier maachen:

wget -q 100m -i / Wee / zu / inputfile

Maacht datt de -q Kommando net mat enger eenzeger Datei geschafft gëtt.

Also wann Dir eng Datei erof léisst déi 2 Gigabytes an der Gréisst eroflueden, benotze -Q 1000m net den Dateie Download ze stoppen.

De Kontingent gëtt nëmmen applizéiert wann Dir en recursive Download vun enger Websäit oder wann Dir eng Input Datei benotzt.

Getting Through Security

E puer Site braucht Dir Iech umellen ze kënnen fir op den Inhalt ze kommen deen Dir downloaden wëllt.

Dir kënnt déi folgend Ännerunge benotze fir de Benotzernumm a Passwuert ze spezifizéieren.

wget --user = youruser name --password = yourpassword

Notéiert op e Multi User-System, wann een dee Kommando vum ps läuft, da kënnt Dir Äert Benotzernumm a Passwuert gesinn.

Aner Downloadoptiounen

Par défaut de -r Schalter nees recursiv den Inhalt eroflueden an erlaben Dossieren wéi et geet.

Dir kënnt all d'Dateien eroflueden fir op e puer eenzeg Verwennung ze liesen mat der folgender Verännerung:

wget -nd -r

De Géigenteel dovun ass d'Schafung vun Verëffentlechen ze zwéngen, déi erreechbar sinn mat dem folgendem Kommando:

wget -x -r

Wéi Zertéieren Bestëmmt Certificates

Wann Dir wëllt recursively vun engem Site ze downloaden, awer Dir wëllt nëmmen e spezielle Dateityp z. B. wéi en mp3 oder e Bild wéi e PNG lancéieren, kënnt Dir déi folgend Syntax benotzen:

WET -A "* .mp3" -r

De Réck vun dësem ass fir gewëss Dateien ze ignoréieren. Vläicht wëlls du net féieren executables. An dësem Fall wäerte Dir déi folgend Syntax benotzen:

wget -R "* .exe" -r

Cliget

Et gëtt e Firefox Add-on genannt Cliget. Dir kënnt dëse Benotzer op de folgenden Wee op Firefox ginn.

Gitt https://addons.mozilla.org/en-US/firefox/addon/cliget/ a klickt op de "add to Firefox" Knäppchen.

Klickt d'Install Knäppchen wann et da gëtt. Dir musst Firefox méi erstallt ginn.

Fir Cliget benotzt Dir eng Säit oder Datei déi Dir wëllt a downloaden a klickt. E Kontextmenü gët Cliget genannt an et gëtt Méiglechkeete fir "ze kopéieren an wget" an "Copy to Curl".

Klickt op d'"Copy op Wget" -Option an geäntwert eng terminal Termin an da klickt just a klickt. De passende Wëtzbefehl kënnt an d'Fënster ginn.

Prinzipiell gespaart Dir Iech de Kommando selwer ze testen.

Summary

De Wget Kommando als eng grouss Zuel vu Optiounen a Switches.

Et ass derwäert ze liesen déi manuell Säit fir Wget ze liesen andeems Dir d'folgend an e Klemmfenster tippe:

Mann wiisst