13赞

高效计算32位整数乘法的高阶位

作者：黄晓敏3023 | 2023-08-19 18:01

如何解决《高效计算32位整数乘法的高阶位》经验，为你挑选了1个好方法。

许多CPU具有用于返回单个组件的操作码的高 32位的整数乘法的序位.通常将两个32位整数相乘会产生64位结果,但如果将其存储为32位整数,则会将其截断为低32位.

例如,在PowerPC上,mulhw操作码在一个时钟内返回32位32位乘法的64位结果的高32位.这正是我正在寻找的,但更便携.在NVidia CUDA中有一个类似的操作码,umulhi().

在C/C++中,是否有一种有效的方法来返回32x32乘法的高阶位？目前我通过转换为64位来计算它,例如:

unsigned int umulhi32(unsigned int x, unsigned int y)
{
  unsigned long long xx=x;
  xx*=y;
  return (unsigned int)(xx>>32);
}

但这比常规的32乘32乘以慢11倍,因为即使是乘法,我也使用了过度的64位数学运算.

有更快的方法来计算高阶位吗？

对于BigInteger库来说,这显然不是最好的解决方案(这是一种过度杀伤并且会产生巨大的开销).

SSE似乎有PMULHUW,16x16 - > 16位版本,但不是32x32 - > 32版本,就像我在寻找.

1> caf..：

gcc 4.3.2,带-O1优化或更高版本,将您的功能完全翻译为IA32程序集,如下所示:

umulhi32:
        pushl   %ebp
        movl    %esp, %ebp
        movl    12(%ebp), %eax
        mull    8(%ebp)
        movl    %edx, %eax
        popl    %ebp
        ret

这只是做一个32位mull并将结果的高32位(从%edx)放入返回值.

这就是你想要的,对吧？听起来你只需要在编译器上进行优化;)你可以通过消除中间变量来推动编译器正确的方向:

unsigned int umulhi32(unsigned int x, unsigned int y)
{
  return (unsigned int)(((unsigned long long)x * y)>>32);
}

推荐阅读

程序员
如果没有处理,则抛出相同的异常,或者构造一个新的异常？

如何解决《如果没有处理,则抛出相同的异常,或者构造一个新的异常？》经验，为你挑选了1个好方法。 ... [详细]
程序员
存储过程不会插入数据

如何解决《存储过程不会插入数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
将数据框重塑为宽大的形状

如何解决《将数据框重塑为宽大的形状》经验，为你挑选了1个好方法。 ... [详细]
程序员
将大型集合对象(从json解析)写入excel范围

如何解决《将大型集合对象(从json解析)写入excel范围》经验，为你挑选了1个好方法。 ... [详细]
程序员
在SVN中是否有一个命令来查看代码已经签出的位置？

如何解决《在SVN中是否有一个命令来查看代码已经签出的位置？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio代码中的XML自动注释C#

如何解决《VisualStudio代码中的XML自动注释C#》经验，为你挑选了1个好方法。 ... [详细]
程序员
DateTime未正确保存到我的数据库中

如何解决《DateTime未正确保存到我的数据库中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在node.js中发送200响应

如何解决《如何在node.js中发送200响应》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何覆盖wkwebview超链接操作表

如何解决《如何覆盖wkwebview超链接操作表》经验，为你挑选了0个好方法。 ... [详细]
程序员
全局变量类c ++

如何解决《全局变量类c++》经验，为你挑选了1个好方法。 ... [详细]
程序员
差异两个rpms？ - linux

如何解决《差异两个rpms？-linux》经验，为你挑选了1个好方法。 ... [详细]
程序员
监视生产服务器上的django rest framework api

如何解决《监视生产服务器上的djangorestframeworkapi》经验，为你挑选了2个好方法。 ... [详细]
程序员
在不同的Linux机器上部署PyQt5应用程序

如何解决《在不同的Linux机器上部署PyQt5应用程序》经验，为你挑选了0个好方法。 ... [详细]
程序员
以编程方式获取内存使用率iOS

如何解决《以编程方式获取内存使用率iOS》经验，为你挑选了0个好方法。 ... [详细]
程序员
计划中的汽车和Cdr

如何解决《计划中的汽车和Cdr》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用iomanip匹配printf格式

如何解决《使用iomanip匹配printf格式》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Swift中以wav格式录制音频？

如何解决《如何在Swift中以wav格式录制音频？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在dplyr和列中使用重命名时避免错误不存在

如何解决《在dplyr和列中使用重命名时避免错误不存在》经验，为你挑选了2个好方法。 ... [详细]
程序员
DjangoRestFramework ModelSerializer DateTimeField仅在创建对象时转换为当前时区

如何解决《DjangoRestFrameworkModelSerializerDateTimeField仅在创建对象时转换为当前时区》经验，为你挑选了1个好方法。 ... [详细]
程序员
RxJS:如何让一个Observer处理多个Observables？

如何解决《RxJS:如何让一个Observer处理多个Observables？》经验，为你挑选了0个好方法。 ... [详细]

黄晓敏3023

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章