DrDoogie Skrevet 24. juni 2003 Del Skrevet 24. juni 2003 Tenkte jeg skulle hashe noen litt store filer, men har en snikende mistanke om at jeg trenger minst en bit hash for hver byte hvis jeg vil at hashen skal skille mellom, si, kun én bytes forskjell mellom to filer. 1. Er dette rekti'? 2. Er det noe lurt jeg kan gjøre med dictionary? Filstørrelsen er da noen hundre meg i komprimert form...(flac'a wav). Og som nevnt ønsker jeg så liten mulighet for kollisjoner som realistisk mulig - under forutsetningen av at hash'en ikke vokser over 1% av størrelsen til fila den hasher. Antar da at jeg snakker om teapot og ikke md5. Lenke til kommentar
MailMan13 Skrevet 24. juni 2003 Del Skrevet 24. juni 2003 har en snikende mistanke om at jeg trenger minst en bit hash for hver byte hvis jeg vil at hashen skal skille mellom, si, kun én bytes forskjell mellom to filer. Hvordan har du tenkt å skille 255 kombinasjoner med én bit , skal du ha garantert ulike summer må hashstrengen være like lang som den lengste mulige fil-lengden. Så lenge hash verdien er kortere enn filen vil det alltid være mulig å få to to like summer fra samme input, men hvis hash algoritmen er brukbar vil den alltid skille filer m f.eks bare én ulik byte. Med md5sum (128 bits) har du 1 : 3.4*10^38 stor sannsynlighet for at to ulike filer har samme hashverdi, det vil i praksis si aldri, jeg antar at teapot gir lignende tall. Lenke til kommentar
DrDoogie Skrevet 25. juni 2003 Forfatter Del Skrevet 25. juni 2003 Hvordan har du tenkt å skille 255 kombinasjoner med én bit ' date=' Akkurat det var ikke helt poenget, men la meg nå ikke være hårsår. skal du ha garantert ulike summer må hashstrengen være like lang som den lengste mulige fil-lengden. Hmf. Jaså? Så lenge hash verdien er kortere enn filen vil det alltid være mulig å få to to like summer fra samme input, men hvis hash algoritmen er brukbar vil den alltid skille filer m f.eks bare én ulik byte. Joa... her kommer mumlinga mi om ditionary inn i bildet. F.eks hvis 0xOAOD forekommer ofte isammen, kan det betraktes som étt symbol, og hashes med mindre info enn 0xYYXX - forutsatt en symbol-tabell eller dictionary. Med md5sum (128 bits) har du 1 : 3.4*10^38 stor sannsynlighet for at to ulike filer har samme hashverdi, det vil i praksis si aldri, jeg antar at teapot gir lignende tall. Takker. Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå