5赞

在x86上将float转换为int的最快方法是什么

作者：落单鸟人 | 2023-09-05 14:50

如何解决《在x86上将float转换为int的最快方法是什么》经验，为你挑选了6个好方法。

在x86 CPU上将浮点数转换为int的最快方法是什么.优选在C或组件中(可以在C中内嵌)以获得以下任何组合:

32/64/80位浮点数 - > 32/64位整数

我正在寻找一些比让编译器更快的技术.

1> Zach Burling..：

这取决于您是否需要截断转换或舍入转换以及精确度.默认情况下,当您从float转到int时,C将执行截断转换.有FPU指令可以做到这一点,但它不是ANSI C转换,并且使用它有很多警告(例如了解FPU舍入状态).由于你的问题的答案非常复杂,并且取决于你没有表达的一些变量,我推荐这篇文章:

http://www.stereopsis.com/FPU.html

2> Dark Shikari..：

使用SSE的打包转换是迄今为止最快的方法,因为您可以在同一指令中转换多个值. ffmpeg有很多组装(主要用于将音频的解码输出转换为整数样本); 检查它的一些例子.

3> Suma..：

普通x86/x87代码的常用技巧是强制浮点的尾数部分表示int.随后是32位版本.

64位版本是类比的.上面发布的Lua版本更快,但依赖于截断double到32位结果,因此它需要将x87单位设置为双精度,并且不能适用于双到64位int转换.

这个代码的好处是它对于符合IEEE 754的所有平台都是完全可移植的,唯一的假设是将浮点舍入模式设置为最接近.注意:便携式的编译和工作.如果有的话,x86以外的平台通常不会从这种技术中受益很多.

static const float Snapper=3<<22;

union UFloatInt {
 int i;
 float f;
};

/** by Vlad Kaipetsky
portable assuming FP24 set to nearest rounding mode
efficient on x86 platform
*/
inline int toInt( float fval )
{
  Assert( fabs(fval)<=0x003fffff ); // only 23 bit values handled
  UFloatInt &fi = *(UFloatInt *)&fval;
  fi.f += Snapper;
  return ( (fi.i)&0x007fffff ) - 0x00400000;
}

在x86上它并不慢,因为生成的代码是相同的.没有FPU指令在x87上立即参数.

对于无符号整数,它可以更简单:inline uint32_t toInt(float fval){static float const snapper = 1 << 23; fval + = snapper; return(*(uint32_t*)fval)&0x007FFFFF; }

4> akauppi..：

如果可以保证运行代码的CPU与SSE3兼容(即使是Pentium 5,JBB),也可以允许编译器使用其FISTTP指令(即-msse3用于gcc).它似乎做了应该总是这样做的事情:

http://software.intel.com/en-us/articles/how-to-implement-the-fisttp-streaming-simd-extensions-3-instruction/

请注意,FISTTP与FISTP不同(它有问题,导致速度慢).它是SSE3的一部分,但实际上是(唯一的)X87端的改进.

除此之外,X86 CPU可能会很好地进行转换.:)

支持SSE3的处理器

5> dreamlax..：

在汇编中有一条指令将浮点转换为int:使用FISTP指令.它将浮点堆栈中的值弹出,将其转换为整数,然后将其存储在指定的地址处.我认为不会有更快的方式(除非你使用像我不熟悉的MMX或SSE这样的扩展指令集).

另一条指令FIST将值留在FP堆栈上,但我不确定它是否适用于四字大小的目的地.

6> akauppi..：

Lua代码库有以下代码片段(请访问www.lua.org查看src/luaconf.h).如果你发现(SO发现)更快的方式,我相信他们会很激动.

哦,lua_Number意味着双倍.:)

/*
@@ lua_number2int is a macro to convert lua_Number to int.
@@ lua_number2integer is a macro to convert lua_Number to lua_Integer.
** CHANGE them if you know a faster way to convert a lua_Number to
** int (with any rounding method and without throwing errors) in your
** system. In Pentium machines, a naive typecast from double to int
** in C is extremely slow, so any alternative is worth trying.
*/

/* On a Pentium, resort to a trick */
#if defined(LUA_NUMBER_DOUBLE) && !defined(LUA_ANSI) && !defined(__SSE2__) && \
    (defined(__i386) || defined (_M_IX86) || defined(__i386__))

/* On a Microsoft compiler, use assembler */
#if defined(_MSC_VER)

#define lua_number2int(i,d)   __asm fld d   __asm fistp i
#define lua_number2integer(i,n)     lua_number2int(i, n)

/* the next trick should work on any Pentium, but sometimes clashes
   with a DirectX idiosyncrasy */
#else

union luai_Cast { double l_d; long l_l; };
#define lua_number2int(i,d) \
  { volatile union luai_Cast u; u.l_d = (d) + 6755399441055744.0; (i) = u.l_l; }
#define lua_number2integer(i,n)     lua_number2int(i, n)

#endif

/* this option always works, but may be slow */
#else
#define lua_number2int(i,d) ((i)=(int)(d))
#define lua_number2integer(i,d) ((i)=(lua_Integer)(d))

#endif

推荐阅读

程序员
如何使用repmat将1d矢量重塑为3d矩阵？

如何解决《如何使用repmat将1d矢量重塑为3d矩阵？》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么Array.prototype.every在空数组上返回true？

如何解决《为什么Array.prototype.every在空数组上返回true？》经验，为你挑选了1个好方法。 ... [详细]
程序员
用封面图片标记mkv文件？

如何解决《用封面图片标记mkv文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在标记旁边显示位置名称

如何解决《如何在标记旁边显示位置名称》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何理解这种功能声明？

如何解决《如何理解这种功能声明？》经验，为你挑选了1个好方法。 ... [详细]
程序员
window.safari在iframe中未定义

如何解决《window.safari在iframe中未定义》经验，为你挑选了0个好方法。 ... [详细]
程序员
的JavaScript.如果方法命名为字符串加args,我如何调用原型方法？

如何解决《的JavaScript.如果方法命名为字符串加args,我如何调用原型方法？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在EPPlus导出中检测数据表日期字段和强制日期格式

如何解决《在EPPlus导出中检测数据表日期字段和强制日期格式》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用多个线程时性能提升很少

如何解决《使用多个线程时性能提升很少》经验，为你挑选了1个好方法。 ... [详细]
程序员
读取字符串并与特定值进行比较

如何解决《读取字符串并与特定值进行比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法在C++中的for循环条件语句中使用vector.size()

如何解决《无法在C++中的for循环条件语句中使用vector.size()》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用carthage集成ReactiveCocoa失败

如何解决《使用carthage集成ReactiveCocoa失败》经验，为你挑选了1个好方法。 ... [详细]
程序员
将过滤器应用于WordPress短代码输出

如何解决《将过滤器应用于WordPress短代码输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
与填充的传单边界

如何解决《与填充的传单边界》经验，为你挑选了1个好方法。 ... [详细]
程序员
EMV离线批准/拒绝

如何解决《EMV离线批准/拒绝》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何测试ViewController的Deinit

如何解决《如何测试ViewController的Deinit》经验，为你挑选了0个好方法。 ... [详细]
程序员
Logicify jQuery位置选择器插件 - 以编程方式设置位置

如何解决《LogicifyjQuery位置选择器插件-以编程方式设置位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让inputAccessoryView锚定在UITabBar之上？

如何解决《如何让inputAccessoryView锚定在UITabBar之上？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在bash脚本中从grep打印输出会产生损坏的字符串

如何解决《在bash脚本中从grep打印输出会产生损坏的字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
在使用redux构建React应用程序时,何处存储WebRTC流

如何解决《在使用redux构建React应用程序时,何处存储WebRTC流》经验，为你挑选了1个好方法。 ... [详细]

落单鸟人

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章