wget скачать выборочно

Модератор: /dev/random

Ответить
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

wget скачать выборочно

Сообщение yoricI »

Здравия!
Подскажите пож-ста, почему
wget -A pdf -rH https://croco.uno
не работает?

Пишет:

Код: Выделить всё

--2022-02-04 23:35:26--  https://croco.uno/
Resolving croco.uno... 23.111.109.100
Connecting to croco.uno|23.111.109.100|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘croco.uno/index.html.tmp’

croco.uno/index.html.tmp                   [ <=>                                                                       ]  26,75K  --.-KB/s    in 0,001s  

2022-02-04 23:35:26 (34,6 MB/s) - ‘croco.uno/index.html.tmp’ saved [27389]

Removing croco.uno/index.html.tmp since it should be rejected.

FINISHED --2022-02-04 23:35:26--
Total wall clock time: 0,2s
Downloaded: 1 files, 27K in 0,001s (34,6 MB/s)
И всё. А там полно pdf.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20791
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: wget скачать выборочно

Сообщение Bizdelnick »

Потому что на странице с указанным URL ничего с суффиксом pdf нет.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

Re: wget скачать выборочно

Сообщение yoricI »

Там ссылки типа "https://croco.uno/year/1923", в которых https://afaedba8-5322-444e-95bf-198d0f14d336.selcdn.net/pdf/1923/%D0%9A%D1%80%D0%BE%D0%BA%D0%BE%D0%B4%D0%B8%D0%BB,%201923%20,%20%E2%84%96%2003.pdf. И разве ключи у wget -rH не про это? Подскажите пож-ста, как скачать.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20791
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: wget скачать выборочно

Сообщение Bizdelnick »

yoricI писал:
04.02.2022 20:26
Там ссылки типа "https://croco.uno/year/1923"
Ну вот у этой ссылки нет суффикса pdf, поэтому она игнорируется. Если напрямую указать её wget'у, он скачает страницу и pdf по ссылкам с неё.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

Re: wget скачать выборочно

Сообщение yoricI »

Ну это ещё куда ни шло, всего лишь 90 раз инкрементировать ссылку)) А почему не получаетсчя как-то так:

Код: Выделить всё

https://croco.uno/year/[1922-2008]
Скобки экранировал, не помогает.

Ага, в одну строчку не втиснуть похоже, а жаль(( Но скриптом можно. Типа:

Код: Выделить всё

YEAR=1922
until [$YEAR=2009]; do
wget -A pdf -rH https://croco.uno/year/${YEAR}
((YEAR=$YEAR+1))
done
Добавлено (14:12):
А нет, получилось одной строчкой:

Код: Выделить всё

YEAR=1922; until [ $YEAR = 2009 ] ; do wget -A pdf -rH https://croco.uno/year/$YEAR ; ((YEAR=$YEAR+1)) ; done
Последний раз редактировалось yoricI 07.02.2022 09:27, всего редактировалось 1 раз.
Спасибо сказали:
yrii2121
Сообщения: 10

Re: wget скачать выборочно

Сообщение yrii2121 »

Код: Выделить всё

wget -A.pdf -rH https://croco.uno/year/{1922..2008}
Спасибо сказали:
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

Re: wget скачать выборочно

Сообщение yoricI »

А почему здесь не получается? По одному браузером скачиваются, поют, рабочие то есть.

Код: Выделить всё

wget -A ogg https://archive.org/download/transilvania_bespokoit
Скачивает transilvania_bespokoit.tmp с чешуёй внутри и всё.
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20791
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: wget скачать выборочно

Сообщение Bizdelnick »

Так Вы же не сказали ему рекурсивно качать (-r), вот он по ссылкам и не идёт.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

Re: wget скачать выборочно

Сообщение yoricI »

Действительно, процесс пошёл. Но файлы лежат именно в этом каталоге, правда, судя по web-страничке. Зачем рекурсивно? Он создал на диске такую структуру:

Код: Выделить всё

./archive.org/download/transilvania_bespokoit/
и скачивает в этот каталог. Ну и ещё кое-какие пустые каталоги выше.
Добавлено (17:28):
Наверное, надо было так:

Код: Выделить всё

wget -A ogg https://archive.org/download/transilvania_bespokoit/*
Спасибо сказали:
Аватара пользователя
Bizdelnick
Модератор
Сообщения: 20791
Статус: nulla salus bello
ОС: Debian GNU/Linux

Re: wget скачать выборочно

Сообщение Bizdelnick »

yoricI писал:
18.02.2022 17:07
Но файлы лежат именно в этом каталоге
Это веб, в нём нет каталогов с файлами. Есть странички со ссылками. Рекурсия означает обход ссылок со страницы.
Пишите правильно:
в консоли
вку́пе (с чем-либо)
в общем
вообще
в течение (часа)
новичок
нюанс
по умолчанию
приемлемо
проблема
пробовать
трафик
Спасибо сказали:
Аватара пользователя
yoricI
Сообщения: 2378
ОС: gentoo fluxbox

Re: wget скачать выборочно

Сообщение yoricI »

Скачал wget-ом сайт, не так уж и много, но почему нет index.html и что изначально открывать? Только такие:
wget-downld-index1.jpg
wget-downld-index2.jpg
Спасибо сказали:
Ответить