Gå til innhold

[Løst] Laste ned samtlige Lunch-striper fra Dagbladet


Anbefalte innlegg

Er det noen som har en lur måte å batch-downloade alle Lunch-stripene fra dagbladet.no?

 

Linken til hver stripe er

www.dagbladet.no/tegneserie/pondusarkiv/serveconfig.php?date=1393974000&strip=lunch

 

Hvor "date" er timestamp-formatet til stripens dato ved midnatt (GMT+1)

 

1393974000 = 2014-03-05T00:00:00+01:00 (5. mars 2014, kl 00:00)

 

 

(Dette er forøvrig til eget bruk, og fordi jeg ikke orker å scanne bladene manuelt)

Lenke til kommentar
Videoannonse
Annonse

wget.

 

for day in {0..7}; do DATE=$(date +%s -d "2014-03-05 + $day day"); wget -b -O lunch-$DATE.gif "www.dagbladet.no/tegneserie/pondusarkiv/serveconfig.php?date=$DATE&strip=lunch"; done
der 2014-03-05 er start-dag og 0..7 er antall dager du vil hente.

 

edit: tuner den nå (dumme redirects). Oppdaterer når den er ferdig.

edit2: der har vi den.

Endret av Lycantrophe
  • Liker 2
Lenke til kommentar

Takk.

Putter jeg dette i en scriptfil ala python eller .bat, eller er jeg på bærtur?

WGet er eit program som du kan laste ned ting frå webserverar.

http://en.wikipedia.org/wiki/Wget

 

Hahaha, Windows. Vel, da suger det å være deg.

Den kunne du vel spart deg for....

 

 

wget fins for Windows også: http://gnuwin32.sourceforge.net/packages/wget.htm

Endret av sogndal94
  • Liker 1
Lenke til kommentar

Jeg har ingen bruk for linux.

 

Alternativene jeg hadde fra før var å lage et PHP-script eller en C#-sak, men jeg er ganske rusten på begge deler.

 

 

Sogndal94: Jeg vet hva wget er, men jeg har aldri brukt det. Når jeg så at det var script i koden til lycanthrope så kan det ikke kjøres direkte i kommandolinjen, men i et miljø som tolker date og for-loopen korrekt.

  • Liker 1
Lenke til kommentar
import datetime
import wget

D = datetime.date( 2014, 03, 05 )
for i in xrange( 0, 7 ):
timestamp = D.strftime( "%s" )
D = D + D.timedelta( days = 1 )
url="www.dagbladet.no/tegneserie/pondusarkiv/serveconfig.php?date="+timestamp+"&strip=lunch"
wget.download( url, "lunch"+timestamp+".gif" )
Noe sånt for python2. Har ikke testet. Jeg lar det være en øvelse til leseren å håndtere argumenter for å forandre startdato og rekkevidde. Endret av Lycantrophe
  • Liker 3
Lenke til kommentar

wget er ikke en standardmodul i python, ville derfor heller brukt urllib som er plattformuavhengig og en del av standardbiblioteket.

import datetime
import urllib

D = datetime.date( 2014, 03, 05 )
for i in xrange( 0, 7 ):
    timestamp = D.strftime( "%s" )
    D = D + D.timedelta( days = 1 )
    url="www.dagbladet.no/tegneserie/pondusarkiv/serveconfig.php?date="+timestamp+"&strip=lunch"
    urllib.urlretrieve( url, "lunch"+timestamp+".gif" )
Endret av etse
  • Liker 1
Lenke til kommentar

 

Kanskje. Men med mine verktøy tok det meg 4 minutter å løse problemet hans, der han måtte lage en forumpost om det.

 

Strengt tatt, så er det vel din kunnskap som lot deg løse problemet på 4 minutter. Det at du bruker vertøykassa linux er vel egentlig irrellevant i denne sammenhengen, ettersom lignende verktøy er tilgjengelig på andre platformer.

  • Liker 2
Lenke til kommentar

 

Idiot.

Kanskje. Men med mine verktøy tok det meg 4 minutter å løse problemet hans, der han måtte lage en forumpost om det.

 

Hjelper lite å ha linux om du ikke kan scripte slike ting uansett. Og kan du scripte hadde det ikke tatt så mye mer tid å bare skrive et python-script som gjør akkurat det samme. Ser virkelig ingen behov for å være klysete bare fordi noen kjører et annet operativsystem enn deg.

  • Liker 3
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...