כיצד להשתמש בפקודה wget Linux כדי להוריד דפי אינטרנט וקבצים

השירות wget מאפשר לך להוריד דפי אינטרנט, קבצים ותמונות מהאינטרנט באמצעות שורת הפקודה של Linux.

באפשרותך להשתמש בפקודה אחת של wget בנפרד כדי להוריד מאתר או להגדיר קובץ קלט כדי להוריד קבצים מרובים במספר אתרים.

על פי WG דף ידני ניתן להשתמש גם כאשר המשתמש התנתק מהמערכת. לשם כך תשתמש בפקודת nohup.

השירות wget ינסה שוב להוריד גם כאשר החיבור טיפות, חידוש מהמקום שבו הוא נעלם אם אפשרי כאשר החיבור חוזר.

אתה יכול להוריד אתרי אינטרנט שלמים באמצעות wget ולהמיר את הקישורים כדי להצביע על מקורות מקומיים, כך שתוכל להציג אתר אינטרנט לא מקוון.

התכונות של wget הן כדלקמן:

כיצד להוריד אתר באמצעות wget

עבור מדריך זה, אני אראה לך כיצד להוריד את הבלוג האישי שלי.

wget www.everydaylinuxuser.com

כדאי ליצור תיקיה משלך על המחשב באמצעות הפקודה mkdir ולאחר מכן לעבור לתיקייה באמצעות הפקודה cd .

לדוגמה:

mkdir היומי linuxuser
cd היומי linuxuser
wget www.everydaylinuxuser.com

התוצאה היא קובץ index.html יחיד. בכוחות עצמו, קובץ זה הוא חסר תועלת למדי כמו התוכן הוא נמשך עדיין מ- Google את התמונות ואת גליונות סגנונות עדיין כל שנערך ב- Google.

כדי להוריד את האתר המלא ואת כל הדפים ניתן להשתמש בפקודה הבאה:

wget -r www.everydaylinuxuser.com

זה מוריד את הדפים רקורסיבית עד למקסימום של 5 רמות עמוק.

5 רמות עומק לא יכול להיות מספיק כדי לקבל הכל מהאתר. ניתן להשתמש במתג -l כדי לקבוע את מספר הרמות שברצונכם לעבור אליו באופן הבא:

wget -r -l10 www.everydaylinuxuser.com

אם אתה רוצה רקורסיה אינסופית אתה יכול להשתמש הבאות:

wget -r -l inf www.everydaylinuxuser.com

אתה יכול גם להחליף את inf עם 0 כלומר את אותו הדבר.

יש עוד בעיה אחת. אתה יכול לקבל את כל הדפים באופן מקומי, אבל כל הקישורים בדפים עדיין מצביע על המקום המקורי שלהם. לכן לא ניתן ללחוץ באופן מקומי בין הקישורים על הדפים.

תוכל לעקוף בעיה זו באמצעות מתג -k שממיר את כל הקישורים בדפים להצביע על המקבילה המקורית שהורדת באופן הבא:

wget -r-k www.everydaylinuxuser.com

אם אתה רוצה לקבל מראה מלאה של אתר אינטרנט אתה יכול פשוט להשתמש במתג הבא אשר לוקח משם את הצורך להשתמש -R -k ו -L בוררים.

wget -m www.everydaylinuxuser.com

לכן אם יש לך אתר האינטרנט שלך אתה יכול לעשות גיבוי מלא באמצעות פקודה אחת פשוטה.

הפעל wget כפקודה רקע

אתה יכול לקבל wget לרוץ כפקודה רקע עוזב אותך מסוגל להמשיך עם העבודה שלך בחלון המסוף תוך הורדת קבצים.

כל שעליך לעשות הוא להשתמש בפקודה הבאה:

wget -b www.everydaylinuxuser.com

אתה יכול כמובן לשלב מתגים. כדי להפעיל את הפקודה wget ברקע תוך שיקוף האתר, תשתמש בפקודה הבאה:

wget -b -m www.everydaylinuxuser.com

אתה יכול לפשט את זה עוד יותר כדלקמן:

wget -bm www.everydaylinuxuser.com

רישום

אם אתה מפעיל את הפקודה wget ברקע לא תראה את כל ההודעות הרגילות שהוא שולח למסך.

אתה יכול לקבל את כל ההודעות שנשלחו קובץ יומן, כך שתוכל לבדוק את ההתקדמות בכל עת באמצעות הפקודה הזנב .

כדי להעביר מידע מפקודת wget לקובץ יומן, השתמש בפקודה הבאה:

wget -o / path / to / mylogfile www.everydaylinuxuser.com

ההפך, כמובן, הוא לדרוש שום כניסה בכלל ולא פלט למסך. כדי להשמיט את כל הפלט, השתמש בפקודה הבאה:

wget -q www.everydaylinuxuser.com

הורד מאתרים מרובים

ניתן להגדיר קובץ קלט להורדה מאתרים שונים.

פתח את הקובץ באמצעות העורך האהוב עליך או אפילו את הפקודה חתול ופשוט להתחיל לרשום את האתרים או קישורים להוריד מכל שורה של הקובץ.

שמור את הקובץ ולאחר מכן הפעל את פקודת wget הבאה:

wget -i / נתיב / אל / inputfile

מלבד גיבוי האתר שלך או אולי למצוא משהו להוריד לקרוא על הרכבת, אין זה סביר כי אתה רוצה להוריד אתר שלם.

אתה צפוי להוריד כתובת אתר אחת עם תמונות או אולי להוריד קבצים כגון קבצי zip, קבצי ISO או קבצי תמונה.

עם זאת, אתה לא רוצה להקליד את הפרטים הבאים לתוך קובץ קלט כפי שהוא זמן רב:

אם אתה יודע שכתובת האתר הבסיסית תמיד תהיה זהה, תוכל לציין את הפרטים הבאים בקובץ הקלט:

לאחר מכן תוכל לספק את כתובת האתר הבסיסית כחלק מפקודת wget כדלקמן:

wget -B http://www.myfileserver.com -i / path / to / inputfile

נסה שוב אפשרויות

אם יש לך להגדיר תור של קבצים להוריד בתוך קובץ קלט ואתה משאיר את המחשב פועל כל הלילה כדי להוריד את הקבצים אתה תהיה מוטרד למדי כאשר אתה יורד בבוקר כדי למצוא את זה יש תקוע על הקובץ הראשון כבר מנסה כל הלילה.

באפשרותך לציין את מספר ניסיונות החזרה באמצעות המתג הבא:

wget -t 10 -i / path / אל / inputfile

ייתכן שתרצה להשתמש בפקודה לעיל בשילוב עם מתג -T המאפשר לך לציין פסק זמן בשניות כדלקמן:

wget -t 10 -T 10 -i / נתיב / אל / inputfile

הפקודה לעיל ינסה שוב 10 פעמים ינסה להתחבר במשך 10 שניות עבור כל קישור בקובץ.

זה גם מעצבן למדי כאשר יש לך להוריד חלקית 75% של קובץ 4 ג 'יגה בייט על חיבור פס רחב איטי רק עבור החיבור שלך לנשור.

באפשרותך להשתמש ב- wget כדי לנסות שוב מהמקום שבו הפסיק את ההורדה באמצעות הפקודה הבאה:

wget -c www.myfileserver.com/file1.zip

אם אתה הולם השרת המארח אולי לא אוהב את זה יותר מדי ואולי גם לחסום או פשוט להרוג את הבקשות שלך.

ניתן לציין תקופת המתנה המציינת כמה זמן להמתין בין כל אחזור כדלקמן:

wget -w 60 -i / נתיב / אל / inputfile

הפקודה הנ"ל תחכה 60 שניות בין כל הורדה. אפשרות זו שימושית אם אתה מוריד המון קבצים ממקור יחיד.

כמה האינטרנט המארח עלול לזהות את התדר עם זאת, יהיה לחסום אותך בכל מקרה. אתה יכול לעשות את תקופת ההמתנה אקראי כדי לגרום לזה להיראות כאילו אתה לא משתמש בתוכנית כדלקמן:

wget - random-wait -i / path / to / inputfile

הגנה על מגבלות הורדה

ספקי אינטרנט רבים עדיין להחיל מגבלות הורדה עבור השימוש בפס רחב שלך, במיוחד אם אתה גר מחוץ לעיר.

ייתכן שתרצה להוסיף מכסה כדי שלא תפוצץ את מגבלת ההורדה. תוכל לעשות זאת באופן הבא:

wget -q 100m -i / path / אל / inputfile

שים לב שהפקודה -q לא תעבוד עם קובץ יחיד.

אז אם אתה מוריד קובץ בגודל 2 ג 'יגה בייט, תוך שימוש ב - 1000m לא יפסיק את הורדת הקובץ.

המכסה מיושמת רק בעת הורדה רקורסיבית מאתר או בעת שימוש בקובץ קלט.

לעבור את הביטחון

אתרים מסוימים דורשים ממך להיכנס כדי שתוכל לגשת לתוכן שברצונך להוריד.

באפשרותך להשתמש בבוררים הבאים כדי לציין את שם המשתמש והסיסמה.

wget --user = yourusername --password = yourpassword שלך

הערה על מערכת מרובת משתמשים אם מישהו מפעיל את הפקודה PS הם יוכלו לראות את שם המשתמש והסיסמה שלך.

אפשרויות הורדה אחרות

כברירת מחדל, מתג ה- r יהיה רקורסיבי להוריד את התוכן תיצור ספריות כפי שהוא הולך.

באפשרותך לקבל את כל הקבצים להורדה לתיקיה אחת באמצעות המתג הבא:

wget -nd -r

ההפך מזה הוא לכפות על יצירת ספריות אשר ניתן להשיג באמצעות הפקודה הבאה:

wget -x -r

כיצד להוריד סוגי קבצים מסוימים

אם אתה רוצה להוריד רקורסיבית מאתר אבל אתה רק רוצה להוריד סוג קובץ מסוים כגון MP3 או תמונה כגון png אתה יכול להשתמש בתחביר הבא:

wget -A "* .mp3" -r

ההפך הוא להתעלם קבצים מסוימים. אולי אתה לא רוצה להוריד הרצה. במקרה זה, תשתמש בתחביר הבא:

wget -R "* .exe" -r

קליגט

יש פיירפוקס add-on קרא cliget. ניתן להוסיף את זה ל- Firefox בדרך הבאה.

בקר בכתובת https://addons.mozilla.org/en-US/firefox/addon/cliget/ ולחץ על הלחצן "הוסף ל- Firefox".

לחץ על לחצן ההתקנה כאשר הוא מופיע. יהיה עליך להפעיל מחדש את Firefox.

כדי להשתמש קליגט בקר בדף או קובץ אתה רוצה להוריד קליק ימני. תפריט ההקשר יופיע בשם cliget ויהיו אפשרויות "להעתיק ל wget" ו "להעתיק כדי סלסול".

לחץ על "להעתיק כדי wget" אפשרות לפתוח חלון מסוף ולאחר מכן לחץ לחיצה ימנית ולהדביק. הפקודה wget המתאימה תודבק לחלון.

בעיקרון, זה חוסך לך להקליד את הפקודה בעצמך.

סיכום

הפקודה wget כמספר עצום של אפשרויות ומתגים.

כדאי לקרוא את הדף הידני עבור wget על ידי הקלדת הפריטים הבאים לחלון מסוף:

גבר