meastp Skrevet 7. januar 2007 Del Skrevet 7. januar 2007 Hei! Hvordan går jeg frem for å fjerne html-taggene fra en liste? (her er koden, foreløpig. Henter detaljer om tv-serie® fra tv.com.) Klikk for å se/fjerne innholdet nedenfor import urllib from BeautifulSoup import BeautifulSoup class TVcom: def getEpisodes (self, adr) : self.adr = adr data = urllib.urlopen(self.adr) doc = data.read() soup = BeautifulSoup(''.join(doc)) html = soup.findAll('div', id="episode-guide") self.html = html def getNrName (self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('h1', "f-18 f-666") print data self.NrName = data def getProdnrSent(self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('span', "f-bold") print data self.ProdnrSent = data def getDescr(self) : text = self.html doc = str(text) soup = BeautifulSoup(''.join(doc)) data = soup.findAll('p') #print data self.Descr = data net = TVcom() net.getEpisodes('http://www.tv.com/greys-anatomy/show/24440/episode_guide.html?season=0&tag=season_dropdown;dropdown;3') # print net.getDescr() Lenke til kommentar
Gjest Slettet-8fx0y6VV Skrevet 7. januar 2007 Del Skrevet 7. januar 2007 Her har du noe som kan hjelpe: http://aspn.activestate.com/ASPN/Cookbook/...n/Recipe/440481 Var forresten første treff når jeg søkte "Remove html tags python" @ google Espen Lenke til kommentar
meastp Skrevet 7. januar 2007 Forfatter Del Skrevet 7. januar 2007 Hmm.. også jeg som tilogmed var inne på ASPN og gravde etter dette. Brukte samme søkeord, men i en annen rekkefølge... Ser jo ut som om det kan være løsningen. Takk skal du ha! Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå