Tjohei Skrevet 14. august 2004 Del Skrevet 14. august 2004 Jeg driver og lager et script i Python som henter ut mail fra en server, men serveren støtter jo naturligvis ikke æ, ø og å. Liten å skrives som =E5, ø skrives som =F8 og æ skrives som =E6. Hvilket charset skal jeg bruke til å få konvertert dette "vanlig" norsk? Jeg har fått til Python koden for å gjøre det, så det trenger jeg ikke hjelp med, men jeg finner ikke hvilket charset jeg skal bruke. De kodene likner jo mye på unicode'n for de samme bokstavene, som skrives \xe5 osv, og hvis jeg prøver å hardkode inn tekststrengen med disse kodene, går det som en drøm med "iso8859-1". Men jeg vet ikke hva jeg skal bruke på =E5 osv. Kan noen hjelpe meg? Lenke til kommentar
int13h Skrevet 14. august 2004 Del Skrevet 14. august 2004 Siden mail i utgangspunktet bare har støtte for 7-bits ASCII er det vanlig å benytte Base64 eller "Quoted Printable" for overføring av ASCII-tegn som går utenom dette. I dette tilfellet er det "Quoted Printable" som er benyttet og fungerer på denne måten at hvert "ugunstig" tegn representeres med et likhetstegn, etterfulgt av to hexadesimale siffer. De hexadesimale siffrene viser til ASCII verdien. F.eks har bokstaven "å" ASCII-verdien 229, som hexadesimalt da blir E5. Kanskje ikke den beste forklaringen, men håper likevel du fikk en vis forståelse for dette. Hvis ikke så er det bare å søke på nett, der vil du finne mye informasjon om "Quoted Printable" og også Base64 dersom dette er av interesse. Lenke til kommentar
Tjohei Skrevet 16. august 2004 Forfatter Del Skrevet 16. august 2004 Takker for svar. Det gir noe bedre forståelse, men jeg er likevel ikke sikker på hvordan jeg skal få det konvertert. Hva slags informasjon trenger jeg for å få teksten over i f.eks. unicode? Jeg må ha et charset, ikke sant? Hvilket charset brukes for å oversette 7-bits Quoted Printable? Lenke til kommentar
int13h Skrevet 18. august 2004 Del Skrevet 18. august 2004 Jeg har desverre liten/ingen kjennskap til Python, men søkte litt på nett og kanskje dette er det du leter etter? Lenke til kommentar
Tjohei Skrevet 19. august 2004 Forfatter Del Skrevet 19. august 2004 Fant utav det (burde sagt fra, sorry ), men det var faktisk akkurat den sida som løste problemet for meg. decodestring() gjorde effektivt om =E5 til å osv. Trengte da ikke noe charset i det hele tatt; det var bare konverteringen fra "quoted-printable" som skulle til. Mulig jeg må sende det innom unicode for at det skal bli failsafe, men... Men uansett, takker for hjelp. Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå