Gå til innhold

=E5, =E6 og =F8 - Hvilket charset?


Anbefalte innlegg

Jeg driver og lager et script i Python som henter ut mail fra en server, men serveren støtter jo naturligvis ikke æ, ø og å. Liten å skrives som =E5, ø skrives som =F8 og æ skrives som =E6. Hvilket charset skal jeg bruke til å få konvertert dette "vanlig" norsk? Jeg har fått til Python koden for å gjøre det, så det trenger jeg ikke hjelp med, men jeg finner ikke hvilket charset jeg skal bruke.

 

De kodene likner jo mye på unicode'n for de samme bokstavene, som skrives \xe5 osv, og hvis jeg prøver å hardkode inn tekststrengen med disse kodene, går det som en drøm med "iso8859-1". Men jeg vet ikke hva jeg skal bruke på =E5 osv.

 

Kan noen hjelpe meg?

Lenke til kommentar
Videoannonse
Annonse

Siden mail i utgangspunktet bare har støtte for 7-bits ASCII er det vanlig å benytte Base64 eller "Quoted Printable" for overføring av ASCII-tegn som går utenom dette. I dette tilfellet er det "Quoted Printable" som er benyttet og fungerer på denne måten at hvert "ugunstig" tegn representeres med et likhetstegn, etterfulgt av to hexadesimale siffer. De hexadesimale siffrene viser til ASCII verdien. F.eks har bokstaven "å" ASCII-verdien 229, som hexadesimalt da blir E5.

 

Kanskje ikke den beste forklaringen, men håper likevel du fikk en vis forståelse for dette. Hvis ikke så er det bare å søke på nett, der vil du finne mye informasjon om "Quoted Printable" og også Base64 dersom dette er av interesse.

Lenke til kommentar

Takker for svar. Det gir noe bedre forståelse, men jeg er likevel ikke sikker på hvordan jeg skal få det konvertert. Hva slags informasjon trenger jeg for å få teksten over i f.eks. unicode? Jeg må ha et charset, ikke sant? Hvilket charset brukes for å oversette 7-bits Quoted Printable?

Lenke til kommentar

Fant utav det (burde sagt fra, sorry :blush: ), men det var faktisk akkurat den sida som løste problemet for meg. decodestring() gjorde effektivt om =E5 til å osv. Trengte da ikke noe charset i det hele tatt; det var bare konverteringen fra "quoted-printable" som skulle til. Mulig jeg må sende det innom unicode for at det skal bli failsafe, men... :hmm: Men uansett, takker for hjelp. :w00t:

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...