underdark Skrevet 21. februar 2011 Del Skrevet 21. februar 2011 Hei, Er det noen her som kan noe om dette? Jeg har lyst til å lære meg mer om dette, og tenkte derfor å ha som prosjekt å skrive noe som går gjennom et nettsted og laster ned alle South Park-subtitles på spansk. Jeg vil altså skrive et program som traverserer er nettsted, følger linker og laster ned filer. Har mest erfaring med Java og C#, men ser lyst på å lære meg noe nytt hvis det trengs. Både korte/lange forklaringer og pekere i riktig retning mottas med stor takk:) Lenke til kommentar
snippsat Skrevet 22. februar 2011 Del Skrevet 22. februar 2011 (endret) Er det noen her som kan noe om dette? Ja kan ta litt om dette,bruker en random link av et søk. Ja er rask demo og bruker da python. import urllib from BeautifulSoup import BeautifulSoup url = urllib.urlopen('http://www.tvsubtitles.net/tvshow-71-11.html').read() soup = BeautifulSoup(url) links = soup.findAll('a', href=True) # find <a> with a defined href attribute for link in links: print link['href'] Her laster jeg ned all linker. Viss vi ser litt på en del av output data. episode-7752.html subtitle-10121.html subtitle-39614.html subtitle-29291.html subtitle-25443.html subtitle-42283.html subtitle-121438.html episode-7751.html subtitle-10120.html subtitle-39613.html subtitle-29290.html subtitle-25442.html subtitle-42282.html subtitle-121437.html episode-7752 er The List(kan trekke ut tittel) Vi ser subtitle,her kan man gjøre mere jobb som og kun ta ut subtitle(laste ned)på et bestemt språk. Her stopper jeg,kan ta med hvordan man laster ned en subtitle link. from urllib import urlretrieve urlretrieve('http://www.tvsubtitles.net/download-29291.html', 'sub_rus.zip') Har skevet litt om dette i noen poster før. https://www.diskusjon.no/index.php?showtopic=1263992 https://www.diskusjon.no/index.php?showtopic=1274881&st=0&p=16472338&fromsearch=1entry16472338 Har mest erfaring med Java og C#, men ser lyst på å lære meg noe nytt hvis det trengs. Se på python et kraftig og mindere verbose språk enn java/C# Jeg finner python glimrende på mange områder. Som du ser over kan oppgaven din løses med ikke alt for mange linjer med kode. Vet ikke hvor mye tid du har brukt på C#/java,du burde kansje ha en liten idè hvordan du kan løse dette i de språkene? Viss ikke kan python kansje være raskere,selv om du stater helt fra bånn av. Edit. Firebug er et fint hjelpemiddel for og navigere i kildekoden. Endret 22. februar 2011 av SNIPPSAT Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå