Skip to content
This repository was archived by the owner on Apr 27, 2019. It is now read-only.

Latest commit

 

History

History
25 lines (19 loc) · 600 Bytes

File metadata and controls

25 lines (19 loc) · 600 Bytes

archiver

Link crawler pro archivování webů do Wayback Machine.

Fáze 1

Získání URL adres všech stránek projektu Ubuntu.cz.

mvn test
mvn compile exec:java

Pokud chcete získat adresy z vlastních stránek, předejte jejich seznam pomocí -Dexec.args="...".

mvn compile exec:java -Dexec.args="https://example.com/ https://www.example.com/ https://foo.example.com/"

Fáze 2

Nahrání obsahu stránek do archivu Wayback Machine.

for file in ./out/*.txt; do
    bash scripts/archive-to-waybackmachine.sh "$file"
done