Jankee Skrevet 14. november 2005 Del Skrevet 14. november 2005 Sitter med eit lite problem der eg får input-data som skal vere latin-1, men eg har oppdaga at det har komme inn tegn som ikkje er latin-1.Tanken er at alle tegn som ikkje er i latin-1 tegnsettet skal byttes ut med '_'. Er det noko effektiv måte å gjere dette på eller må eg lage ein eigen algoritme for å sjekke kvart tegn for at tegnet er eit Latin-1 tegn, Lenke til kommentar
Torbjørn Skrevet 15. november 2005 Del Skrevet 15. november 2005 Vet du hvilket tegnsett du har på tegnene som kommer inn? Lenke til kommentar
Jankee Skrevet 15. november 2005 Forfatter Del Skrevet 15. november 2005 Når dei kjem inn blir tegna omsatt til latin-1 encode_temp = unicode(orh_navn,'latin-1').encode('latin-1') Tegna skal i utganspunktet vere latin-1, men så testdataene viste var det plutseleg andre ukjente tegn i rekka. tegn: 0x85 Lenke til kommentar
Torbjørn Skrevet 15. november 2005 Del Skrevet 15. november 2005 tjah.. skip hvis tegn > 0x7f og tegn <0xa0 kanskje? Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå