Disfunctions.de

Das Blog der gnadenlosen Fehlfunktionen!

Springerlink.com Downloader

Erstellt von Matthias am Donnerstag 12. Januar 2012

SpringerLink.com Logo AvatarAuf der Webseite Springerlink.com werden für viele Lehr- und Ausbildungsbereiche Bücher und Zeitschriften zur Verfügung gestellt. Leider ist die optische Aufbereitung eher suboptimal und man kann eher schlecht die PDF’s online anschauen. Angenehmer Weise biete die Seite eine Downloadmöglichkeit an, diese zerlegt aber die Bücher/Zeitschriften in einzelne Abschnitte bzw. Kapitel, so kann man nur jeweils ein Kapitel herunterladen, jede Datei hat auch noch den gleichen Namen, was das zusammensuchen bzw. zusammensetzen noch unangenehmer macht. Aber das Internet wäre nicht das Internet, wenn es dafür nicht schon eine schöne Lösung gäbe. Für alle *nix-Artigen Systeme, insbesondere für Ubuntu gibt es ein kleines Skript, mit dem man den ganzen Vorgang automatisiert und hinterher ein fertiges, zusammengesetztes und richtig benanntes PDF erhält, mit welchem man gut arbeiten kann!

Auf github findet man von milianw ein funktionales, schnelles Skript.

Dieses kann man mittels


wget http://github.com/milianw/springer_download/zipball/master

herunterladen und einfach entpacken. Danach kopiert man die Datei „springer_download.py“ aus dem Verzeichnis heraus in sein /home Verzeichnis oder in den bin Ordner.
Bevor man nun starten kann, muss man zumindest unter Ubuntu noch pdftk installieren.


sudo apt-get install pdftk

Nun kann man das Skript ausführen, es arbeitet nach folgendem Schema:


./springer_download.py -l "http://www.springerlink.com/content/$ISBN"

Anstatt von $ISBN muss man die entsprechende ISBN des Buches eingeben, alternativ kann man sich das Buch auch direkt auf Springerlink heraussuchen und den Link einfach innerhalb der “ “ kopieren.

Ausser pdftk benötigt das Programm noch Python 2.4.x/2.6.x und iconv, beides war bei mir schon vorhanden und ist, meines Wissens nach, auf einem Standard Ubuntu bereits installiert.

Ich fand das Skript sehr praktisch, da es auch mit VPN Zugängen und anderem arbeiten kann. SpringerLink ist, so weit ich weiß, vorwiegend für Lehrinstitutionen zugänglich und Studenten können über das VPN der Uni auf Springerlink gehen und sollten automatisch eingeloggt werden. Ansonsten einfach mal auf der Bibliothekswebseite der Uni nachschauen.

Das Skript steht unter der GPLv3 und kann somit relativ frei verwendet und weiterentwickelt werden. Viel Spaß damit.

7 Kommentare zu “Springerlink.com Downloader”


  1. dwio sagt:

    sehr gut! Ich habe bisher immer alle pdfs mit der Firefox-erweiterung DownThemAll heruntergeladen und dann zusammengefügt, so ein script ist aber noch besser! Danke!


  2. Enno sagt:

    Vielen Dank für den interessanten Hinweis auf dieses Skript, das mir sehr nützlich erscheint. Allerdings müsste ich das Skript über einen Proxy benutzen, um auf Springerlink zugreifen zu können. Gibt es da eine Möglichkeit?


  3. Matthias sagt:

    @Enno: Soweit ich weiß, ist Springerlink für Lehranstalten und ähnliches gedacht. Über diese läuft im Normalfall dann auch der Zugriff, entweder man ist im entsprechenden Netz oder loggt sich über VPN dort ein. Ob du Proxys oder VPN oder was auch immer nutzt hängt von der Lehranstalt ab. Bei detaillierten Fragen musst du dich wohl an die Bibliothek der Institution wenden, da dies scheinbar Institutionsabhängig ist.


  4. PhotonX sagt:

    Hmm, irgendwie will das bei mir nicht so richtig:

    [photon-new@photon-desktop milianw-springer_download-73671eb]$ ./springer_download.py -l "http://www.springerlink.com/content/978-3-540-73517-5/"
    File "./springer_download.py", line 92
    print "fetching book information...\n\t%s" % link
    ^
    SyntaxError: invalid syntax


  5. Matthias sagt:

    @PhotonX: Tritt das mit verschiedenen Büchern auch auf? Oder nur mit dem Einen? Hast du die Abhängigkeiten die auf der Webseite angegeben sind beachtet?


  6. cithrix sagt:

    Vielen Dank für den Hinweis. Das Skript werde ich sicher mal gebrauchen können.


  7. PhotonX sagt:

    Hab das Problem gefunden, man muss das Skript mit Python 2 ausführen. 🙂

Kommentar schreiben

XHTML: Sie können diese Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>