Trenger godt OCR-program med batchfunksjon

Fibonacci · 19. april 2012

Halloi

Eg sit og arbeider med digitalisering av avisarkivet til ei lokalavis. Det er snakk om ca 60.000 avissider scanna inn frå mikrofilm. Filene er i jpeg-format, men skal etter kvart konverterast og samlast i pdf-format.

Det eg slit med å få til er tekstgjenkjenning på avissidene. Har prøvd tesseract og eit par andre *nix-baserte OCR-program, utan å lukkast i å få anna enn kråketeikn og eitt og anna ord ut av det.

Eg lurer på om nokon her har god erfaring med OCR, og kan anbefale eit program som er ganske liberalt men nøyaktig når det gjeld tekstgjenkjenning? Det bør aller helst vere for *nix, men kan til nød vere for windows. I alle fall må det ha batchfunksjon, då det er ganske uaktuelt å gjere arbeidet "manuelt".

Her er eit døme på ei typisk avisside: http://dl.dropbox.co...%2000.26.20.jpg

Test gjerne diverse OCR-program på fila.

Endret 19. april 2012 av Kjell Arne Steinsvik

Fibonacci · 19. april 2012

Beklager feil link i førre innlegg. Her er rette fila: http://dl.dropbox.com/u/457972/19981020_03.jpg

Logg inn

Trenger godt OCR-program med batchfunksjon

Anbefalte innlegg

Fibonacci

Lenke til kommentar

Videoannonse

Fibonacci

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Opprett konto

Logg inn

Populær nå

Hvilke partier vil terminere ACER-avtalen og få Norge av Nordpoolbørsen 1 2

Er USA fortsatt et land å se opp til i verden? 1 2

Hvor fort forsvinner bensinstasjonene? 1 2 3 4 6

Hvem er aktive 0 medlemmer