Gå til innhold

Størrelsen / lengden på hash'en?


Anbefalte innlegg

Tenkte jeg skulle hashe noen litt store filer, men har en snikende mistanke om at jeg trenger minst en bit hash for hver byte hvis jeg vil at hashen skal skille mellom, si, kun én bytes forskjell mellom to filer.

 

1. Er dette rekti'?

2. Er det noe lurt jeg kan gjøre med dictionary?

 

Filstørrelsen er da noen hundre meg i komprimert form...(flac'a wav).

 

Og som nevnt ønsker jeg så liten mulighet for kollisjoner som realistisk mulig - under forutsetningen av at hash'en ikke vokser over 1% av størrelsen til fila den hasher. Antar da at jeg snakker om teapot og ikke md5.

Lenke til kommentar
Videoannonse
Annonse
har en snikende mistanke om at jeg trenger minst en bit hash for hver byte hvis jeg vil at hashen skal skille mellom, si, kun én bytes forskjell mellom to filer.
Hvordan har du tenkt å skille 255 kombinasjoner med én bit :roll: , skal du ha garantert ulike summer må hashstrengen være like lang som den lengste mulige fil-lengden.

 

Så lenge hash verdien er kortere enn filen vil det alltid være mulig å få to to like summer fra samme input, men hvis hash algoritmen er brukbar vil den alltid skille filer m f.eks bare én ulik byte.

 

Med md5sum (128 bits) har du 1 : 3.4*10^38 stor sannsynlighet for at to ulike filer har samme hashverdi, det vil i praksis si aldri, jeg antar at teapot gir lignende tall.

Lenke til kommentar
Hvordan har du tenkt å skille 255 kombinasjoner med én bit :roll: ' date='

 

Akkurat det var ikke helt poenget, men la meg nå ikke være hårsår.

 

skal du ha garantert ulike summer må hashstrengen være like lang som den lengste mulige fil-lengden.

 

Hmf. Jaså?

 

Så lenge hash verdien er kortere enn filen vil det alltid være mulig å få to to like summer fra samme input, men hvis hash algoritmen er brukbar vil den alltid skille filer m f.eks bare én ulik byte.

 

Joa... her kommer mumlinga mi om ditionary inn i bildet. F.eks hvis 0xOAOD forekommer ofte isammen, kan det betraktes som étt symbol, og hashes med mindre info enn 0xYYXX - forutsatt en symbol-tabell eller dictionary.

 

Med md5sum (128 bits) har du 1 : 3.4*10^38 stor sannsynlighet for at to ulike filer har samme hashverdi, det vil i praksis si aldri, jeg antar at teapot gir lignende tall.

 

Takker.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...