Użyłem wget do pobrania plików html, gdzie są przechowywane obrazy w pliku?

10

Firefox ładował się bardzo wolno, więc postanowiłem użyć wget do zapisania plików HTML. Użyłem następującego polecenia,

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Pliki zostały zapisane w moim katalogu domowym.Ale nie wiem, gdzie są przechowywane obrazy.Mam je używać w Anki .

Więc gdzie są przechowywane obrazy?

    
zadawane Registered User 08.11.2013, 15:43
źródło

4 odpowiedzi

25

Wolę używać --page-requisites ( -p for short) zamiast -r tutaj, ponieważ pobiera wszystko, co strona musi wyświetlić, ale nie ma innych stron, i nie muszę myśleć o tym, jakie pliki Chcę.

Właściwie używam zazwyczaj czegoś w stylu

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Oznacza to:

  • -E : dopisz .html do nazwy pliku, jeśli jest to plik HTML, ale nie kończy się na .html lub podobnym
  • -H : Pobierz także pliki z innych hostów
  • -k : po pobraniu przekonwertuj dowolny link, aby wskazywał na pobrane pliki
  • -p : pobierz wszystko, czego strona potrzebuje do prawidłowego przeglądania w trybie offline
odpowiedział Florian Diesch 08.11.2013, 16:52
źródło
2

użycie parametru -r powinno umożliwić wget pobranie całego folderu, w tym obrazów.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
    
odpowiedział vegard torvund 08.11.2013, 15:55
źródło
2

Pobieranie plików obrazu również oddzielnie

Myślę, że to polecenie może cię uruchomić.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Umożliwia określenie lokalizacji do zapisania obrazów i typów plików, które chcesz. Być może pobieranie obrazów jako takich jest łatwiejsze.

Źródło :

  

-r umożliwia pobieranie rekursywne. Zobacz Pobieranie cykliczne, aby uzyskać więcej informacji.

     

-P ustawia prefiks katalogu, w którym zapisywane są wszystkie pliki i katalogi.

     

-A ustawia białą listę do pobierania tylko niektórych typów plików. Łańcuchy i wzory są akceptowane, a oba mogą być używane na liście rozdzielanej przecinkami (jak widać powyżej). Zobacz Typy plików, aby uzyskać więcej informacji.

Kopiowanie plików graficznych z folderu

Zauważyłem, że strona używa plików graficznych PNG. Możesz po prostu skopiować te z folderu. To powinno zostać uruchomione w folderze, w którym zapisałeś stronę.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;
    
odpowiedział don.joey 08.11.2013, 15:55
źródło
1

Wget po prostu pobiera plik HTML strony, a nie obrazy na stronie, ponieważ obrazy w pliku HTML strony są zapisywane jako adresy URL. Aby zrobić to, co chcesz, użyj opcji -R (rekurencyjna), -A z sufiksem pliku obrazu, opcji --no-parent , aby go nie wznieść i opcji --level z 1 .

W szczególności wget -R -A .jpg,.png,.gif --no-parent --level <url>

Jeszcze lepiej, większość przeglądarek ma metody zapisywania stron do przeglądania w trybie offline .

    
odpowiedział Ramchandra Apte 08.11.2013, 15:55
źródło

Przeczytaj inne pytania na temat tagów