Gå til innhold

Tegnsett problemer (curl), løst


Anbefalte innlegg

Laster inn en html side ved hjelp av curl som jeg igjen lager en dom av. men jeg sliter med å få alle tegn riktig.

 

Dersom jeg tar utf8_encode av data jeg får gjennom curl blir det meste riktig, bortsett fra de særnorske tegnene og noen flere. Noen som vet hvordan jeg kan få alle tegn riktig?

 

Før noen foreslår at jeg kan bruke noe annet et curl så nei. Jeg bruker curl for å få cookies riktig.

 

Mener at jeg har fått det til før, men jeg kommer jo selvfølgelig ikke på hvordan :(

Endret av astrox
Lenke til kommentar
Videoannonse
Annonse

Løsning:

 

DOM leter etter informasjon om tegnsett i dokumentet. Den informasjonen inneholdt ikke html siden jeg matet dom med. Måtte derfor legge inn informasjonen på denne måten:

 

$html = str_replace('<head>', '<head><meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />', $html);

 

Fant ingen metode for å tvinge dom til å bruke det tegnsettet, men nå er det ikke så farlig lengere! :)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...