phanti Skrevet 27. september 2004 Del Skrevet 27. september 2004 (endret) Problemstillingen er som følger: Jeg har et/flere pdf-dokumenter som inneholder ganske strukturerte data (feks spesifisert telefonregning). Jeg er interessert i å gjøre litt statistikk på dette, eller hvertfall forsøke å få pdf-dokumentet over på en mer strukturert form, feks XML. Siden jeg er godt kjent med php, lurer jeg på om det er mulig å åpne pdf->data, hente ut spesifikke linjer med tekst fra pdf-dokumentet med php? (andre språk? python?) Jeg spørr, fordi når Google finner pdf-filer, så klarer den å vise den som en html verson også. Ikke alltid like bra, men den klarer det. Håper jeg klarte å beskrive det litt bedre nå På forhånd takk. edit: gjorde om hele problemstilling. Vet at Acrobat Reader brukes til å lese pdf filer Endret 28. september 2004 av phanti Lenke til kommentar
phun-ky Skrevet 27. september 2004 Del Skrevet 27. september 2004 hvis den som leser siden din har acrobat reader installert (den nyeste) skal bruker kunne lese *.pdf filer rett på, uten bruk av php Lenke til kommentar
phanti Skrevet 28. september 2004 Forfatter Del Skrevet 28. september 2004 Beklager, har ordlagt meg ganske feil, beklager.. Redigerer og forklarer på nytt jeg Lenke til kommentar
Nervetattoo Skrevet 28. september 2004 Del Skrevet 28. september 2004 Ja det går fint. Men du må sørge for at installasjonen av PHP har en pdflib av et slag installert. Søk litt rundt på hva som er den beste, har ikke brukt pdf selv ennå, men det er noen anbefalinger på hvilket bibliotek som er best rundt om kring. Det står også litt i php manualen om pdf bibliotek og litt dokumentering av de. Lenke til kommentar
jorgis Skrevet 28. september 2004 Del Skrevet 28. september 2004 PDFlib klarer bare å skrive PDF-filer. Det er nesten umulig å få lest PDF-filer, men jeg har sett eksempler på at det er mulig. Det er ihvertfall ikke noe bundlet bibliotek i PHP som klarer det. Lenke til kommentar
Nervetattoo Skrevet 28. september 2004 Del Skrevet 28. september 2004 Med pdflib så mente jeg ikke en bestemt pdflib foresten. Bare generelt. Lenke til kommentar
phanti Skrevet 28. september 2004 Forfatter Del Skrevet 28. september 2004 Jeg har søkt en god del rundt om dette, og det virker som det er veldig få serverside språk som gir mulighet for å lese/søke i pdf filer, men det finnes flere programmer som kan det. pdftohtml fungerer ypperlig, er å få både til windows og linux. Er på godfot med en administrator på skolen, så er ikke umulig at jeg får installere det programmet, og da kan jeg jo bare kjøre et cgi script opp mot det. Hadde da vært kjempefint om noen hadde fått det til med php.. Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå