вопрос по wget (очередь закачки)
Модератор: /dev/random
-
- Сообщения: 428
- Статус: Kernel Killer
вопрос по wget
Всем здрасте.
Такой вопрос, как сделать очередь закачки в wget?
если я делаю wget -i urllist, то он пытается качать сразу все ссылки, а мне нужно, чтобы он переходил к следующей ссылке после того как закачает текущую?
Заранее спасибо.
Такой вопрос, как сделать очередь закачки в wget?
если я делаю wget -i urllist, то он пытается качать сразу все ссылки, а мне нужно, чтобы он переходил к следующей ссылке после того как закачает текущую?
Заранее спасибо.
Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Модератор
- Сообщения: 1786
- Статус: Матёрый линуксоид
- ОС: Debian testing/unstable
Re: вопрос по wget
Как это - "пытается качать сразу все ссылки" ? У меня, почему-то, он качает их по очереди 

Работа: Ubuntu 9.10
Дом: Debian testing/unstable и на всякий случай winxp в virtualbox.
Для разнообразия: моя домашняя страница -http://iportnov.ru
Дом: Debian testing/unstable и на всякий случай winxp в virtualbox.
Для разнообразия: моя домашняя страница -http://iportnov.ru
-
- Сообщения: 37
- ОС: Ubuntu 8.04
Re: вопрос по wget
Если команды разделить '&&', то следующая команда будет выполняться только в случае "успешного" (т.е. без кода ошибки) завершения предыдущей.
Например:
В данном случае сначала будет качаться somefile, если все завершиться успешно, то стартует закачка anyfile.
P.S. Но это конечно же "кривой" способ. Сейчас под рукой нет wget'a, но по-моему, из списка он качает в порядке очереди.
Например:
Код: Выделить всё
wget htpp://somehost/somefile && wget http://anyhost/anyfile
В данном случае сначала будет качаться somefile, если все завершиться успешно, то стартует закачка anyfile.
P.S. Но это конечно же "кривой" способ. Сейчас под рукой нет wget'a, но по-моему, из списка он качает в порядке очереди.
-
- Сообщения: 1104
- ОС: ArchLinux
Re: вопрос по wget
Dimon93rus
А у вас ссылки в файле по одной на строку или все в одной строке? Не знаю что будет, если их все вписать одной строкой, проверять лень. Надо по одной на строку.
А у вас ссылки в файле по одной на строку или все в одной строке? Не знаю что будет, если их все вписать одной строкой, проверять лень. Надо по одной на строку.
Компьютер служит для решения тех проблем, которых до изобретения компьютера не существовало
-
- Сообщения: 23
- ОС: Gentoo
Re: вопрос по wget
еще можно wget link; wget link2; wgеt link3
так будет качать по завершении предыдущей закачки, несмотря на успешность завершения
так будет качать по завершении предыдущей закачки, несмотря на успешность завершения
-
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: вопрос по wget
mifistor писал(а): ↑23.08.2008 11:24Если команды разделить '&&', то следующая команда будет выполняться только в случае "успешного" (т.е. без кода ошибки) завершения предыдущей.
Например:
Код: Выделить всё
wget htpp://somehost/somefile && wget http://anyhost/anyfile
Господа теоретики вгета, да если ему просто в командной строке перечислить УРЛы через пробел, он их качает по очереди а не параллельно.
Внимание, вопрос: зачем вы учите людей пользоваться программой, если сами имеете крайне смутное представление о том, как она работает?
-
- Сообщения: 120
- ОС: LFS, slackware
Re: вопрос по wget
а я делаю просто:
wget link1 link2 link3
и получается так что:
так будет качать по завершении предыдущей закачки, несмотря на успешность завершения
P.S. упс ...извиняюсь меня опередили

-
- Сообщения: 23
- ОС: Gentoo
Re: вопрос по wget
Внимание, вопрос: зачем вы учите людей пользоваться программой, если сами имеете крайне смутное представление о том, как она работает?
Причем тут умение работы с wget. Это основы работы с башем и применимо к любой программе.
-
- Сообщения: 3340
- Статус: It's the GNU Age
- ОС: Debian
Re: вопрос по wget
Причем тут умение работы с wget. Это основы работы с башем и применимо к любой программе.
Угу, а ещё вместо
Код: Выделить всё
wget -c URL1 URL2 URL3
можно посоветовать что-нибудь в духе
Код: Выделить всё
echo -e "URL1\nURL2\nURL3" | xargs wget -c
и говорить, "причём тут wget, это же основы работы с xargs, применительно к любой программе".
-
- Сообщения: 227
- ОС: Gentoo o_O
Re: вопрос по wget
вся прелесть работы в баше это заставить его делать то что самому делать лень, а конструкции вроде
wget url; wget url или wget url && wget url
не есть пример правильной работы в баше, а по большому счёту есть мозахизм чистой воды

если под "пытается качать сразу все ссылки" подразумевается чтото вроде этого:
Код: Выделить всё
navi ~ $ wget -i ЫЫ
--2008-08-25 10:21:54-- http://linuxforum.ru/style_images/1/t_reply.gif%20http://linuxforum.ru/style_images/1/p_up.gif
Распознаётся linuxforum.ru... 88.212.205.226
Устанавливается соединение с linuxforum.ru|88.212.205.226|:80... соединение установлено.
Запрос HTTP послан, ожидается ответ... 404 Not Found
2008-08-25 10:21:54 ОШИБКА 404: Not Found.
то проблема скорей всего в том что ссылки в файле идут через пробел, а не по одной на строку
если надо использовать файл в таком формате то мона сделать так
wget $(cat ЫЫ) #ЫЫ - файл со ссылками через пробел
добавлено: блин ток сейчас дату прочитал, надеюсь ещё актуально

НЕ ПАНИКУЙ © ^_~
-
- Сообщения: 428
- Статус: Kernel Killer
Re: вопрос по wget
--=Civil696=-- писал(а): ↑25.08.2008 10:06вся прелесть работы в баше это заставить его делать то что самому делать лень, а конструкции вроде
wget url; wget url или wget url && wget url
не есть пример правильной работы в баше, а по большому счёту есть мозахизм чистой воды![]()
если под "пытается качать сразу все ссылки" подразумевается чтото вроде этого:
Код: Выделить всё
navi ~ $ wget -i ЫЫ --2008-08-25 10:21:54-- http://linuxforum.ru/style_images/1/t_reply.gif%20http://linuxforum.ru/style_images/1/p_up.gif Распознаётся linuxforum.ru... 88.212.205.226 Устанавливается соединение с linuxforum.ru|88.212.205.226|:80... соединение установлено. Запрос HTTP послан, ожидается ответ... 404 Not Found 2008-08-25 10:21:54 ОШИБКА 404: Not Found.
то проблема скорей всего в том что ссылки в файле идут через пробел, а не по одной на строку
если надо использовать файл в таком формате то мона сделать так
wget $(cat ЫЫ) #ЫЫ - файл со ссылками через пробел
добавлено: блин ток сейчас дату прочитал, надеюсь ещё актуально
Да, актуально (просто был на море

Ссылки в файле расположены по одной в каждой строчке.
Данный случай тестировался на mediazona.ru а там можно качать файлы только по одному, к тому же там не совсем обычные ссылки получаются. Что-то вроде: http://mediazona.ru/8yuitygfshg7wy56tw/file.rar?link=743586
может это тоже влияет, но факт в том что wget не качает если ему скармливать файл

Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Сообщения: 42
- ОС: debian
Re: вопрос по wget
Dimon93rus писал(а): ↑29.08.2008 12:05--=Civil696=-- писал(а): ↑25.08.2008 10:06вся прелесть работы в баше это заставить его делать то что самому делать лень, а конструкции вроде
wget url; wget url или wget url && wget url
не есть пример правильной работы в баше, а по большому счёту есть мозахизм чистой воды![]()
если под "пытается качать сразу все ссылки" подразумевается чтото вроде этого:
Код: Выделить всё
navi ~ $ wget -i ЫЫ --2008-08-25 10:21:54-- http://linuxforum.ru/style_images/1/t_reply.gif%20http://linuxforum.ru/style_images/1/p_up.gif Распознаётся linuxforum.ru... 88.212.205.226 Устанавливается соединение с linuxforum.ru|88.212.205.226|:80... соединение установлено. Запрос HTTP послан, ожидается ответ... 404 Not Found 2008-08-25 10:21:54 ОШИБКА 404: Not Found.
то проблема скорей всего в том что ссылки в файле идут через пробел, а не по одной на строку
если надо использовать файл в таком формате то мона сделать так
wget $(cat ЫЫ) #ЫЫ - файл со ссылками через пробел
добавлено: блин ток сейчас дату прочитал, надеюсь ещё актуально
Да, актуально (просто был на море)
Ссылки в файле расположены по одной в каждой строчке.
Данный случай тестировался на mediazona.ru а там можно качать файлы только по одному, к тому же там не совсем обычные ссылки получаются. Что-то вроде: http://mediazona.ru/8yuitygfshg7wy56tw/file.rar?link=743586
может это тоже влияет, но факт в том что wget не качает если ему скармливать файл
а можно хотя бы посмотреть вывод ошибок и т.п.
а то telepat mode не есть хорошо, да и Вам вряд ли поможет

нет знаний не дающих силу ©
-
- Сообщения: 2579
Re: вопрос по wget
rm_ писал(а): ↑23.08.2008 16:42Господа теоретики вгета, да если ему просто в командной строке перечислить УРЛы через пробел, он их качает по очереди а не параллельно.
Внимание, вопрос: зачем вы учите людей пользоваться программой, если сами имеете крайне смутное представление о том, как она работает?
Прикольно, а я не знал, всегда разделял точкой с запятой.

-
- Сообщения: 428
- Статус: Kernel Killer
Re: вопрос по wget
Вот лог:
Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие
P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
Код:
$ wget -i list
--01:24:07-- http://ex.mediazona.ru/exchange/get/d33ffa...ar?link=4555401
=> `d33ffa41bff7f65156d2defc4aa41975.rar?link=4555401'
Преобразование адреса ex.mediazona.ru... 62.183.39.179
Устанавливается соединение с ex.mediazona.ru|62.183.39.179|:80... соединились.
Запрос HTTP послан, ожидание ответа... 200 OK
Длина: 75 856 622 (72M) [application/x-force-download]
d33ffa41bff7f65156d2defc4aa41975.rar?link=4555401: Invalid argument
Ошибка записи в `d33ffa41bff7f65156d2defc4aa41975.rar?link=4555401' (Invalid argument).
--01:24:19-- http://ex.mediazona.ru/exchange/get/d0f595...ar?link=4555473
=> `d0f5954377ab0b170c9c3bc5b195f4f2.rar?link=4555473'
Устанавливается соединение с ex.mediazona.ru|62.183.39.179|:80... соединились.
Запрос HTTP послан, ожидание ответа... 503 Service Temporarily Unavailable
01:24:19 ОШИБКА 503: Service Temporarily Unavailable.
--01:24:19-- http://ex.mediazona.ru/exchange/get/6f0173...ar?link=4555525
=> `6f0173a644f9d630045d485974815cf9.rar?link=4555525'
Повторное использование соединения с ex.mediazona.ru:80.
Запрос HTTP послан, ожидание ответа... 503 Service Temporarily Unavailable
01:24:20 ОШИБКА 503: Service Temporarily Unavailable.
Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие

P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Модератор
- Сообщения: 1786
- Статус: Матёрый линуксоид
- ОС: Debian testing/unstable
Re: вопрос по wget
Первая ошибка (Invalid argument) - это, похоже, wget не может записать файл с таким именем почему-то. Попробуйте задать имя выходного файла явно.
Работа: Ubuntu 9.10
Дом: Debian testing/unstable и на всякий случай winxp в virtualbox.
Для разнообразия: моя домашняя страница -http://iportnov.ru
Дом: Debian testing/unstable и на всякий случай winxp в virtualbox.
Для разнообразия: моя домашняя страница -http://iportnov.ru
-
- Сообщения: 227
- ОС: Gentoo o_O
Re: вопрос по wget
Сильно сомневаюсь что проблема в приставке ?link=4555473Dimon93rus писал(а): ↑30.08.2008 01:17Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие
P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
Ибо только недавно скачал с коначана 141 страницу вида tag?order=date&page=номер_страницы правда сохраняет он их именно в таком виде, но для меня это было не критично, да и как уже было написано выше можно задать имя файла для сохранения

Мне вот что интересно, а с mediazone вообще качалками качать мона? Не может к примеру при переходе по ссылке из браузера проверяться к примеру кто вы, авторизованный пользователь или какой нибудь, проходящий мимо, дядя с улицы(при помощи cookies или чего то там такого, честно говоря довольно слабо представляю как всё это работает, но это реализуемо, попробуйте к примеру на этом форуме аттач не авторизовавшись скачать)?
НЕ ПАНИКУЙ © ^_~
-
- Сообщения: 428
- Статус: Kernel Killer
Re: вопрос по wget
--=Civil696=-- писал(а): ↑30.08.2008 18:18Сильно сомневаюсь что проблема в приставке ?link=4555473Dimon93rus писал(а): ↑30.08.2008 01:17Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие
P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
Ибо только недавно скачал с коначана 141 страницу вида tag?order=date&page=номер_страницы правда сохраняет он их именно в таком виде, но для меня это было не критично, да и как уже было написано выше можно задать имя файла для сохранения![]()
Мне вот что интересно, а с mediazone вообще качалками качать мона? Не может к примеру при переходе по ссылке из браузера проверяться к примеру кто вы, авторизованный пользователь или какой нибудь, проходящий мимо, дядя с улицы(при помощи cookies или чего то там такого, честно говоря довольно слабо представляю как всё это работает, но это реализуемо, попробуйте к примеру на этом форуме аттач не авторизовавшись скачать)?
Ну там, во-первых, проверяется авторизовались вы или нет, а во-вторых, являетесь ли вы абонентом ЮТК или нет (по ip наверно), и если нет, то тасуйтесь.....

Сейчас поставил на закачку список и назначил выходное имя файла, вроде качает, но как будут называться последующие файлы в списке. Например: была команда: wget -i list -O file, то последующие файлу будут типа file1, file2 и т.д.?
UPD: как-то странно получилось, сначала качался один архив и сохранялся под именем file, а потом начал качаться второй, и сохраняться в файл с таким же именем... но что интересно, так это то, что размер полученного в итоге файла, равен сумме этих двух архивов


Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Сообщения: 120
- ОС: FreeBSD 8.0 RC3
Re: вопрос по wget
А для wget морды нет?((
-
- Сообщения: 120
- ОС: FreeBSD 8.0 RC3
-
- Сообщения: 2629
- Статус: Ленивец
- ОС: Arch/Debian.
-
- Сообщения: 283
- ОС: Debian
Re: вопрос по wget
Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие
А вы случаем не на виндовую файловую систему сохраняете?
Напомню что в таких ФС запрещены имена файлов содержащие следующие символы:
Код: Выделить всё
\/:*?"<>|
remote system type is unix
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: вопрос по wget
А на этот счёт смотрите man wget на предмет пауз (таймаутов) между закачками.Dimon93rus писал(а): ↑30.08.2008 01:17P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Сообщения: 428
- Статус: Kernel Killer
Re: вопрос по wget
pcodr писал(а): ↑04.09.2008 12:31Похоже что ему не нравится приставка типа ?link=4555473, но дело в том, что там все ссылки такие
А вы случаем не на виндовую файловую систему сохраняете?
Напомню что в таких ФС запрещены имена файлов содержащие следующие символы:
Код: Выделить всё
\/:*?"<>|
Вот это я тупанул.....


t.t писал(а): ↑04.09.2008 16:28А на этот счёт смотрите man wget на предмет пауз (таймаутов) между закачками.Dimon93rus писал(а): ↑30.08.2008 01:17P.S. На медиазоне ошибка 503 возникает когда ты уже качаешь один файл, и пытаешься скачать ещё что-нибудь
Да тут тайм ауты не пичём, т.к. от туда можно тянуть только по одному файлу

Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: вопрос по wget
Раз оно ругается ошибкой 503, то очень даже при чём: эта ошибка как раз о том и говорит, что файлы, запрашиваемые подряд, без таймаута, сервер и воспринимает как "не по одному".Dimon93rus писал(а): ↑05.09.2008 12:56Да тут тайм ауты не пичём, т.к. от туда можно тянуть только по одному файлу
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Сообщения: 428
- Статус: Kernel Killer
Re: вопрос по wget
t.t писал(а): ↑05.09.2008 13:43Раз оно ругается ошибкой 503, то очень даже при чём: эта ошибка как раз о том и говорит, что файлы, запрашиваемые подряд, без таймаута, сервер и воспринимает как "не по одному".Dimon93rus писал(а): ↑05.09.2008 12:56Да тут тайм ауты не пичём, т.к. от туда можно тянуть только по одному файлу
Хм, спасибо.... сегодня буду тестить...
А какой примерно поставить таймаут не подскажите?
Хотя, я больше склоняюсь к ошибке описанной pcodr, т.к. когда я качал с ключом -О никаких ошибок не возникало, за исключением сохранения (см. в сообщении №17)....
Ubuntu Server 10.04 x86, Calculate Linux 11.6 x86
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
Re: вопрос по wget
Больше похоже, что эти две ошибки не связаны между собой, т.к. одна из них на стороне сервера, а другая, напротив, чисто локальная. Но если не возникает, то тогда и таймаут не нужен, конечно.Dimon93rus писал(а): ↑05.09.2008 13:56Хотя, я больше склоняюсь к ошибке описанной pcodr, т.к. когда я качал с ключом -О никаких ошибок не возникало, за исключением сохранения (см. в сообщении №17)....
А это только опытным путём. Я именно с этого сайта никогда ничего не качал, потому не скажу. В некоторых случаях даже --random-wait может понадобиться.
¡иɯʎdʞ ин ʞɐʞ 'ɐнɔɐdʞǝdu qнεиж
-
- Бывший модератор
- Сообщения: 2062
- Статус: No Place for RTFM Here…
- ОС: Mac OS X
Re: вопрос по wget
Всю ссылку попробуйте взять в кавычки (двойные или одинарные, не столь важно). Тогда будет качать.
-
- Бывший модератор
- Сообщения: 7390
- Статус: думающий о вечном
- ОС: Debian, LMDE
-
- Бывший модератор
- Сообщения: 2062
- Статус: No Place for RTFM Here…
- ОС: Mac OS X