de linuxmanr4, 4 años han pasado desde su publicación, escrito en Python.
Enlace corto
http://gw.gd/ReFi
Insertar vínculo
  1. #! /usr/bin/python
  2. # -*- coding: iso-8859-1 -*-
  3. #
  4. __author__='Lorenzo Carbonell'
  5. __date__ ='$10/06/2011'
  6. #
  7. #
  8. # Copyright (C) 2011 Lorenzo Carbonell
  9. # lorenzo.carbonell.cerezo@gmail.com
  10. #
  11. # This program is free software: you can redistribute it and/or modify
  12. # it under the terms of the GNU General Public License as published by
  13. # the Free Software Foundation, either version 3 of the License, or
  14. # (at your option) any later version.
  15. #
  16. # This program is distributed in the hope that it will be useful,
  17. # but WITHOUT ANY WARRANTY; without even the implied warranty of
  18. # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  19. # GNU General Public License for more details.
  20. #
  21. # You should have received a copy of the GNU General Public License
  22. # along with this program.  If not, see <http://www.gnu.org/licenses/>.
  23. #
  24. # Modificaciones para usarlo con wget: Linuxman http://linuxman.blogsome.com
  25. #
  26. import urllib2
  27. import re
  28. import sys
  29. import os
  30. from os.path import basename
  31. from urlparse import urlsplit
  32.  
  33. EXTENSIONS = ['.jpg','.png','.gif','.jpeg']
  34.  
  35. def download_images_from_url(url):
  36.         if not url.lower().startswith('http://') and not url.lower().startswith('https://'):
  37.                 url = 'http://%s'%url
  38.         print 'Downloading from %s...'%url
  39.         urlContent = urllib2.urlopen(url).read()
  40.  
  41.         # Búsqueda del tag img en la página web.
  42.         # HTML image tag: <img src="url" alt="some_text"/>
  43.         imgUrls = re.findall('img .*?src="(.*?)"', urlContent)
  44.  
  45.         # download all images
  46.         for imgUrl in imgUrls:
  47.  
  48.                 # El print me sirvio para identificar los url relativos,
  49.                 # a continuación intenta descargar el archivo con wget.
  50.                 print imgUrl
  51.                 os.system('wget -q -nc ' + imgUrl)
  52.         return 0
  53.  
  54. if __name__ == '__main__':
  55.         args = sys.argv
  56.         if len(args) < 2:
  57.                 print 'I need an url to download images'
  58.                 exit(-1)
  59.         print args[1]
  60.         download_images_from_url(args[1])
  61.         exit(0)

Respuestas a idw: Script para descargar imágenes de un sitio rss

Título Nombre Lenguaje cuando
Re: idw: Script para descargar imágenes de un siti Soft Flamingo python 2 años han pasado desde su publicación.