当前位置:  开发笔记 > 编程语言 > 正文

截断md5的均匀分布?

如何解决《截断md5的均匀分布?》经验,为你挑选了2个好方法。

我们可以说截断的md5哈希仍然是均匀分布的吗?

为了避免误解:我知道当你开始从md5结果中删除部分时碰撞的可能性要大得多; 我的用例实际上是有意故意碰撞.我也知道有其他 哈希方法可能更适合使用较短哈希的情况(实际上包括我自己的哈希),我肯定会研究那些.

但我也很想知道md5均匀分布是否也适用于它的大块.(认为​​这是一种燃烧的好奇心.)

由于mediawiki使用它(特别是最左边的两个十六进制数字作为结果的字符)来生成图像的文件路径(例如/4/42/The-image-name-here.png),并且他们可能也对至少接近均匀的分布感兴趣,我想答案是'是',但我实际上并不知道.



1> Bruno Rohée..:

是的,没有表现出任何偏见是加密哈希的设计要求.从加密的角度来看,MD5是破碎的,但结果的分布从未出现过问题.

如果你仍然需要被说服,那么散列一堆文件,截断输出并使用ent(http://www.fourmilab.ch/random/)分析结果并不是一件大事.



2> 小智..:

我写了一个小程序来回答这个问题.它不是很科学,但它显示了使用自然数作为hashtext的哈希值的第一个和最后一个8位的分布.在大约40.000.000哈希之后,最高和最低计数之间的差异下降到1%,所以我说分配是可以的.我希望代码在解释计算内容时更精确:-)顺便说一句,我发现最后的8位似乎比第一位略好分布.

 $max) $max = $n;
      print $n."\t";
    }
    print "\n";
  }
  print "Hashes: $hashCount, Min: $min, Max: $max, Delta: ".((($max-$min)*100)/$max)."%\n";
} 
?>

推荐阅读
sx-March23
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有