« Return to Thread: Python como wget

Re: Python como wget

by Guilherme Chapiewski-2 :: Rate this Message:

Reply to Author | View in Thread

Acabei de ver que ele não funciona direito porque espera que todas as urls
das imagens sejam absolutas :)

Bom, mesmo assim espero que possa te dar alguma idéia.

[ ]s, gc
--
Guilherme Chapiewski
http://gc.blog.br


2009/2/2 Guilherme Chapiewski <guilherme.chapiewski@...>

> Uma vez fiz um programinha para baixar todas as imagens de um site. Ele não
> faz exatamente o que vc quer mas dá uma olhada nele que pode te dar algumas
> idéias:
>
>
> http://github.com/guilhermechapiewski/sandbox/blob/60e040bf7bb345fadaa5649f7cf8301f418a882e/download_all_site_images.py
>
> [ ]s, gc
> --
> Guilherme Chapiewski
> http://gc.blog.br
>
>
> 2009/2/2 Henrique Baggio <hnrqbaggio@...>
>
>>   Olá pessoal,
>>
>> Hoje me deparei com um problema de ter que baixar todos os arquivos de um
>> diretório localizado num servidor (no caso eram rpms de uma distro linux).
>> Queria poder baixar os arquivos usando algo semelhante ao comando wget do
>> linux, com a opção recursiva [1], de forma que o script varresse o
>> diretório
>> e fizesse o download de cada arquivo encontrado.
>>
>> Bem, mas o motivo pra eu usar python é porque eu queria fazer isso de uma
>> máquina rodando Windows, e logicamente, sem wget. =/
>>
>> Procurei um pouco na net sobre alternativas de fazer esse download em
>> python, mas não consegui encontrar muita coisa útil. Tentei usar o módulo
>> urllib, mas não consegui fazê-lo entender a url como um diretório, de
>> forma
>> a listar os arquivos dentro dele. Apenas consegui baixar o conteúdo da
>> página html usada pelo servidor para me mostrar a lista de arquivos.
>>
>> Claro que eu poderia fazer uma gambiarra e procurar os links dos arquivos
>> pelo conteúdo do html, mas gostaria de saber se existe alguma outra
>> alternativa, se a linguagem me permite algo mais alto nível. =]
>>
>> Alguma idéia?
>>
>> [1] http://linux.die.net/man/1/wget
>>
>> Abraços!
>> --
>> Henrique Baggio
>> Computer Engineering - Unicamp
>>
>> Microsoft Innovation Center - Unicamp
>> Software Engineer
>> http://www.lms.ic.unicamp.br
>> http://www.codeplex.com/lmsu
>>
>> [As partes desta mensagem que não continham texto foram removidas]
>>
>>  
>>
>
>
>
>


[As partes desta mensagem que não continham texto foram removidas]

 « Return to Thread: Python como wget