5赞

使用hash_map时,在stl字符串上使用的最佳散列算法是什么？

作者：黄晓敏3023 | 2023-09-05 12:24

如何解决《使用hash_map时,在stl字符串上使用的最佳散列算法是什么？》经验，为你挑选了6个好方法。

我发现VS2005上的标准哈希函数在尝试实现高性能查找时非常缓慢.有哪些快速有效的哈希算法可以解决大多数冲突的好例子？

1> George V. Re..：

我与微软研究院的Paul Larson合作进行了一些散列表实现.他研究了各种数据集上的一些字符串散列函数,发现简单地乘以101和add循环工作得非常好.

unsigned int
hash(
    const char* s,
    unsigned int seed = 0)
{
    unsigned int hash = seed;
    while (*s)
    {
        hash = hash * 101  +  *s++;
    }
    return hash;
}

Soumajyoti,溢出无所谓.大多数哈希函数溢出.关键是你可以在低位32位中得到合适的位组合.

2> Dark Shikari..：

从我的一些旧代码:

/* magic numbers from http://www.isthe.com/chongo/tech/comp/fnv/ */
static const size_t InitialFNV = 2166136261U;
static const size_t FNVMultiple = 16777619;

/* Fowler / Noll / Vo (FNV) Hash */
size_t myhash(const string &s)
{
    size_t hash = InitialFNV;
    for(size_t i = 0; i < s.length(); i++)
    {
        hash = hash ^ (s[i]);       /* xor  the low 8 bits */
        hash = hash * FNVMultiple;  /* multiply by the magic number */
    }
    return hash;
}

它很快.真的吓坏了.

它可能很快,但它可能是有史以来发明的最糟糕的散列函数之一.

@Matthieu:为什么？很多重复？你有什么参考资料我可以在这里阅读更多信息吗？

3> David Pierre..：

Boost有一个boost :: hash库,它可以为大多数常见类型提供一些基本的哈希函数.

4> Nils Pipenbr..：

这总取决于您的数据集.

我通过使用字符串的CRC32获得了令人惊讶的好结果.适用于各种不同的输入集,效果非常好.

很多好的CRC32实现很容易在网上找到.

编辑:几乎忘了:这个页面有一个很好的哈希函数枪战,包括性能数据和测试数据:

http://smallcode.weblogs.us/ < - 在页面下方.

5> SquareCog..：

我使用Jenkins哈希来编写Bloom过滤器库,它具有很好的性能.

详细信息和代码可在此处获取:http://burtleburtle.net/bob/c/lookup3.c

这就是Perl用于散列操作的原因,fwiw.

6> bk1e..：

如果要散列一组固定的单词,最好的散列函数通常是一个完美的散列函数.但是,它们通常要求在编译时知道您尝试散列的单词集.检测词法分析器中的关键词(以及将关键词转换为标记)是使用诸如gperf之类的工具生成的完美哈希函数的常见用法.一个完美的哈希也可以让你替换hash_map一个简单的数组或vector.

如果你没有散列一组固定的单词,那么显然这不适用.

推荐阅读

程序员
从ksh获取包含env变量的文件

如何解决《从ksh获取包含env变量的文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Chrome通过jQuery通过ajax发送废话

如何解决《Chrome通过jQuery通过ajax发送废话》经验，为你挑选了0个好方法。 ... [详细]
程序员
vim编辑器:如何在不同方向切换分割窗口

如何解决《vim编辑器:如何在不同方向切换分割窗口》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何确定nsarray/nsmutablearray中是否存在具有给定属性的对象

如何解决《如何确定nsarray/nsmutablearray中是否存在具有给定属性的对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
UISearchBar与iOS7中UITableView标头中的UISearchDisplayController链接

如何解决《UISearchBar与iOS7中UITableView标头中的UISearchDisplayController链接》经验，为你挑选了1个好方法。 ... [详细]
程序员
mosquitto MQTT代理和带有SSL/TLS的Java客户端

如何解决《mosquittoMQTT代理和带有SSL/TLS的Java客户端》经验，为你挑选了1个好方法。 ... [详细]
程序员
Haskell的Control.Concurrent.Async.mapConcurrent当前有限制吗？

如何解决《Haskell的Control.Concurrent.Async.mapConcurrent当前有限制吗？》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Wordpress页面和帖子中插入PHP代码

如何解决《在Wordpress页面和帖子中插入PHP代码》经验，为你挑选了2个好方法。 ... [详细]
程序员
c#linq从linq返回一个多维数组

如何解决《c#linq从linq返回一个多维数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
128位结构或2个64位记录,用于提高性能和可读性

如何解决《128位结构或2个64位记录,用于提高性能和可读性》经验，为你挑选了1个好方法。 ... [详细]
程序员
从.bat调用Gradle会导致批处理执行停止

如何解决《从.bat调用Gradle会导致批处理执行停止》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在SQL Server 2005中更新视图

如何解决《如何在SQLServer2005中更新视图》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Haskell中对无限列表进行燕尾迭代

如何解决《在Haskell中对无限列表进行燕尾迭代》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在每个输出记录中显示结果集的总计数？

如何解决《如何在每个输出记录中显示结果集的总计数？》经验，为你挑选了1个好方法。 ... [详细]
程序员
JCabi方面@RetryOnFailure如何抛出异常

如何解决《JCabi方面@RetryOnFailure如何抛出异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS7:UICollectionView出现在UINavigationBar下

如何解决《iOS7:UICollectionView出现在UINavigationBar下》经验，为你挑选了3个好方法。 ... [详细]
程序员
Resharper重新格式化String.Format()参数

如何解决《Resharper重新格式化String.Format()参数》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法在终端中找到XML架构命名空间错误的Spring NamespaceHandler

如何解决《无法在终端中找到XML架构命名空间错误的SpringNamespaceHandler》经验，为你挑选了0个好方法。 ... [详细]
程序员
RENAME语句实际上如何工作？

如何解决《RENAME语句实际上如何工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ArrayAdapter中重写getDropDownView时的样式问题

如何解决《在ArrayAdapter中重写getDropDownView时的样式问题》经验，为你挑选了0个好方法。 ... [详细]

黄晓敏3023

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章