Uma vez fiz um programinha para baixar todas as imagens de um site. Ele não
faz exatamente o que vc quer mas dá uma olhada nele que pode te dar algumas
idéias:
http://github.com/guilhermechapiewski/sandbox/blob/60e040bf7bb345fadaa5649f7cf8301f418a882e/download_all_site_images.py[ ]s, gc
--
Guilherme Chapiewski
http://gc.blog.br2009/2/2 Henrique Baggio <
hnrqbaggio@...>
> Olá pessoal,
> Hoje me deparei com um problema de ter que baixar todos os arquivos de um
> diretório localizado num servidor (no caso eram rpms de uma distro linux).
> Queria poder baixar os arquivos usando algo semelhante ao comando wget do
> linux, com a opção recursiva [1], de forma que o script varresse o
> diretório
> e fizesse o download de cada arquivo encontrado.
>
> Bem, mas o motivo pra eu usar python é porque eu queria fazer isso de uma
> máquina rodando Windows, e logicamente, sem wget. =/
>
> Procurei um pouco na net sobre alternativas de fazer esse download em
> python, mas não consegui encontrar muita coisa útil. Tentei usar o módulo
> urllib, mas não consegui fazê-lo entender a url como um diretório, de forma
> a listar os arquivos dentro dele. Apenas consegui baixar o conteúdo da
> página html usada pelo servidor para me mostrar a lista de arquivos.
>
> Claro que eu poderia fazer uma gambiarra e procurar os links dos arquivos
> pelo conteúdo do html, mas gostaria de saber se existe alguma outra
> alternativa, se a linguagem me permite algo mais alto nível. =]
>
> Alguma idéia?
>
> [1]
http://linux.die.net/man/1/wget>
> Abraços!
> --
> Henrique Baggio
> Computer Engineering - Unicamp
>
> Microsoft Innovation Center - Unicamp
> Software Engineer
>
http://www.lms.ic.unicamp.br>
http://www.codeplex.com/lmsu>
> [As partes desta mensagem que não continham texto foram removidas]
>
>
>
[As partes desta mensagem que não continham texto foram removidas]