10赞

php-perl哈希算法实现(times33哈希算法)_PHP-php教程

作者：mobiledu2402851323 | 2021-09-01 11:49

php-perl哈希实现算法–DJBX33A(DanielJ.Bernstein,Times33withAddition)APR哈希默认算法

代码如下:
APR_DECLARE_NONSTD(unsigned int) apr_hashfunc_default(const char *char_key,
apr_ssize_t *klen)
{
unsigned int hash = 0;
const unsigned char *key = (const unsigned char *)char_key;
const unsigned char *p;
apr_ssize_t i;

/*
* This is the popular `times 33' hash algorithm which is used by
* perl and also appears in Berkeley DB. This is one of the best
* known hash functions for strings because it is both computed
* very fast and distributes very well.
*
* The originator may be Dan Bernstein but the code in Berkeley DB
* cites Chris Torek as the source. The best citation I have found
* is "Chris Torek, Hash function for text in C, Usenet message
* <27038@mimsy.umd.edu> in comp.lang.c , October, 1990." in Rich
* Salz's USENIX 1992 paper about INN which can be found at
* .
*
* The magic of number 33, i.e. why it works better than many other
* constants, prime or not, has never been adequately explained by
* anyone. So I try an explanation: if one experimentally tests all
* multipliers between 1 and 256 (as I did while writing a low-level
* data structure library some time ago) one detects that even
* numbers are not useable at all. The remaining 128 odd numbers
* (except for the number 1) work more or less all equally well.
* They all distribute in an acceptable way and this way fill a hash
* table with an average percent of approx. 86%.
*
* If one compares the chi^2 values of the variants (see
* Bob Jenkins ``Hashing Frequently Asked Questions'' at
* http://burtleburtle.net/bob/hash/hashfaq.html for a description
* of chi^2), the number 33 not even has the best value. But the
* number 33 and a few other equally good numbers like 17, 31, 63,
* 127 and 129 have nevertheless a great advantage to the remaining
* numbers in the large set of possible multipliers: their multiply
* operation can be replaced by a faster operation based on just one
* shift plus either a single addition or subtraction operation. And
* because a hash function has to both distribute good _and_ has to
* be very fast to compute, those few numbers should be preferred.
*
* -- Ralf S. Engelschall
*/

if (*klen == APR_HASH_KEY_STRING) {
for (p = key; *p; p++) {
hash = hash * 33 + *p;
}
*klen = p - key;
}
else {
for (p = key, i = *klen; i; i--, p++) {
hash = hash * 33 + *p;
}
}
return hash;
}

对函数注释部分的翻译: 这是很出名的times33哈希算法,此算法被perl语言采用并在Berkeley DB中出现.它是已知的最好的哈希算法之一,在处理以字符串为键值的哈希时,有着极快的计算效率和很好哈希分布.最早提出这个算法的是Dan Bernstein,但是源代码确实由Clris Torek在Berkeley DB出实作的.我找到的最确切的引文中这样说”Chris Torek,C语言文本哈希函数,Usenet消息<<27038@mimsy.umd.edu> in comp.lang.c ,1990年十月.”在Rich Salz于1992年在USENIX报上发表的讨论INN的文章中提到.这篇文章可以在上找到. 33这个奇妙的数字,为什么它能够比其他数值效果更好呢?无论重要与否,却从来没有人能够充分说明其中的原因.因此在这里,我来试着解释一下.如果某人试着测试1到256之间的每个数字(就像我前段时间写的一个底层数据结构库那样),他会发现,没有哪一个数字的表现是特别突出的.其中的128个奇数(1除外)的表现都差不多,都能够达到一个能接受的哈希分布,平均分布率大概是86%. 如果比较这128个奇数中的方差值(gibbon:统计术语,表示随机变量与它的数学期望之间的平均偏离程度)的话(见Bob Jenkins的<哈希常见疑问>http://burtleburtle.net/bob/hash/hashfaq.html,中对平方差的描述),数字33并不是表现最好的一个.(gibbon:这里按照我的理解,照常理,应该是方差越小稳定,但是由于这里不清楚作者方差的计算公式,以及在哈希离散表,是不是离散度越大越好,所以不得而知这里的表现好是指方差值大还是指方差值小),但是数字33以及其他一些同样好的数字比如 17,31,63,127和129对于其他剩下的数字,在面对大量的哈希运算时,仍然有一个大大的优势,就是这些数字能够将乘法用位运算配合加减法来替换,这样的运算速度会提高.毕竟一个好的哈希算法要求既有好的分布,也要有高的计算速度,能同时达到这两点的数字很少.

推荐阅读

程序员
我可以在C#中找到BigInteger的位数吗？

如何解决《我可以在C#中找到BigInteger的位数吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
可视化免费Monad

如何解决《可视化免费Monad》经验，为你挑选了1个好方法。 ... [详细]
程序员
Thread.Sleep(2500)vs. Task.Delay(2500).Wait()

如何解决《Thread.Sleep(2500)vs.Task.Delay(2500).Wait()》经验，为你挑选了2个好方法。 ... [详细]
程序员
C#代码在Unity中不起作用

如何解决《C#代码在Unity中不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中的UIPopoverController上设置多个箭头方向

如何解决《在Swift中的UIPopoverController上设置多个箭头方向》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有指示器和下一个/上一个按钮的Onsen-UI Carousel

如何解决《带有指示器和下一个/上一个按钮的Onsen-UICarousel》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python:它不允许我使用Tkinter root = Tk()错误

如何解决《Python:它不允许我使用Tkinterroot=Tk()错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
对数组进行排序,以便第一个和最后一个元素形成"对"

如何解决《对数组进行排序,以便第一个和最后一个元素形成"对"》经验，为你挑选了1个好方法。 ... [详细]
程序员
jsfiddle中没有框架部分

如何解决《jsfiddle中没有框架部分》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Python 3中安装和运行模块（入门）

如何解决《在Python3中安装和运行模块（入门）》经验，为你挑选了1个好方法。 ... [详细]
程序员
多列表理解

如何解决《多列表理解》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何获取字符串中组的所有排列？

如何解决《如何获取字符串中组的所有排列？》经验，为你挑选了1个好方法。 ... [详细]
程序员
浏览器支持Angular材质

如何解决《浏览器支持Angular材质》经验，为你挑选了2个好方法。 ... [详细]
程序员
在C#中的接口实现中使用继承的接口

如何解决《在C#中的接口实现中使用继承的接口》经验，为你挑选了1个好方法。 ... [详细]
程序员
打印任何STL容器

如何解决《打印任何STL容器》经验，为你挑选了2个好方法。 ... [详细]
程序员
当我需要总数时生成NAN

如何解决《当我需要总数时生成NAN》经验，为你挑选了1个好方法。 ... [详细]
程序员
响应式图像拉伸 - 基于y轴的网格？

如何解决《响应式图像拉伸-基于y轴的网格？》经验，为你挑选了0个好方法。 ... [详细]
程序员
显示分配堆栈跟踪时防止程序崩溃

如何解决《显示分配堆栈跟踪时防止程序崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
斯坦福依赖解析器设置和NLTK

如何解决《斯坦福依赖解析器设置和NLTK》经验，为你挑选了1个好方法。 ... [详细]
程序员
SecCopyErrorMessageString在swift中给出"使用未解析的标识符"

如何解决《SecCopyErrorMessageString在swift中给出"使用未解析的标识符"》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851323

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章