Gå til innhold

Anbefalte innlegg

Hei,

 

Er det noen her som kan noe om dette?

 

Jeg har lyst til å lære meg mer om dette, og tenkte derfor å ha som prosjekt å skrive noe som går gjennom et nettsted og laster ned alle South Park-subtitles på spansk. Jeg vil altså skrive et program som traverserer er nettsted, følger linker og laster ned filer.

 

Har mest erfaring med Java og C#, men ser lyst på å lære meg noe nytt hvis det trengs.

 

Både korte/lange forklaringer og pekere i riktig retning mottas med stor takk:)

Lenke til kommentar
Videoannonse
Annonse
Er det noen her som kan noe om dette?

Ja kan ta litt om dette,bruker en random link av et søk.

Ja er rask demo og bruker da python.

import urllib
from BeautifulSoup import BeautifulSoup

url = urllib.urlopen('http://www.tvsubtitles.net/tvshow-71-11.html').read()

soup = BeautifulSoup(url)
links = soup.findAll('a', href=True) # find <a> with a defined href attribute
for link in links:
   print link['href']

Her laster jeg ned all linker.

Viss vi ser litt på en del av output data.

episode-7752.html
subtitle-10121.html
subtitle-39614.html
subtitle-29291.html
subtitle-25443.html
subtitle-42283.html
subtitle-121438.html
episode-7751.html
subtitle-10120.html
subtitle-39613.html
subtitle-29290.html
subtitle-25442.html
subtitle-42282.html
subtitle-121437.html

episode-7752 er The List(kan trekke ut tittel)

Vi ser subtitle,her kan man gjøre mere jobb som og kun ta ut subtitle(laste ned)på et bestemt språk.

Her stopper jeg,kan ta med hvordan man laster ned en subtitle link.

from urllib import urlretrieve
urlretrieve('http://www.tvsubtitles.net/download-29291.html', 'sub_rus.zip')

 

Har skevet litt om dette i noen poster før.

https://www.diskusjon.no/index.php?showtopic=1263992

https://www.diskusjon.no/index.php?showtopic=1274881&st=0&p=16472338&fromsearch=1entry16472338

 

Har mest erfaring med Java og C#, men ser lyst på å lære meg noe nytt hvis det trengs.

Se på python et kraftig og mindere verbose språk enn java/C#

Jeg finner python glimrende på mange områder.

Som du ser over kan oppgaven din løses med ikke alt for mange linjer med kode.

 

Vet ikke hvor mye tid du har brukt på C#/java,du burde kansje ha en liten idè hvordan du kan løse dette i de språkene?

Viss ikke kan python kansje være raskere,selv om du stater helt fra bånn av.

 

Edit.

Firebug er et fint hjelpemiddel for og navigere i kildekoden.

Endret av SNIPPSAT
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...