Gå til innhold

Fjerne html-tagger fra en liste...


Anbefalte innlegg

Hei!

 

Hvordan går jeg frem for å fjerne html-taggene fra en liste?

 

(her er koden, foreløpig. Henter detaljer om tv-serie® fra tv.com.)

Klikk for å se/fjerne innholdet nedenfor
import urllib
from BeautifulSoup import BeautifulSoup

class TVcom:
def getEpisodes (self, adr) :
 self.adr = adr
 data = urllib.urlopen(self.adr)
 doc = data.read()
 soup = BeautifulSoup(''.join(doc))
 html = soup.findAll('div', id="episode-guide")
 self.html = html
def getNrName (self) :
 text = self.html
 doc = str(text)
 soup = BeautifulSoup(''.join(doc))
 data = soup.findAll('h1', "f-18 f-666")
 print data
 self.NrName = data
def getProdnrSent(self) :
 text = self.html
 doc = str(text)
 soup = BeautifulSoup(''.join(doc))
 data = soup.findAll('span', "f-bold")
 print data
 self.ProdnrSent = data
def getDescr(self) :
 text = self.html
 doc = str(text)
 soup = BeautifulSoup(''.join(doc))
 data = soup.findAll('p')
 #print data
 self.Descr = data

net = TVcom()
net.getEpisodes('http://www.tv.com/greys-anatomy/show/24440/episode_guide.html?season=0&tag=season_dropdown;dropdown;3')
# print net.getDescr()

Lenke til kommentar
Videoannonse
Annonse

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...