17赞

John Carmack不寻常的快速反向平方根(Quake III)

作者：小白也坚强_177 | 2023-08-20 13:18

如何解决《JohnCarmack不寻常的快速反向平方根(QuakeIII)》经验，为你挑选了5个好方法。

John Carmack在Quake III源代码中有一个特殊的功能,它计算浮点的平方根,比常规的快4倍(float)(1.0/sqrt(x)),包括一个奇怪的0x5f3759df常量.请参阅下面的代码.有人可以逐行解释这里究竟发生了什么以及为什么这比常规实现快得多？

float Q_rsqrt( float number )
{
  long i;
  float x2, y;
  const float threehalfs = 1.5F;

  x2 = number * 0.5F;
  y  = number;
  i  = * ( long * ) &y;
  i  = 0x5f3759df - ( i >> 1 );
  y  = * ( float * ) &i;
  y  = y * ( threehalfs - ( x2 * y * y ) );

  #ifndef Q3_VM
  #ifdef __linux__
    assert( !isnan(y) );
  #endif
  #endif
  return y;
}


    
  




  
  
  

    

      

        Rushyo..
         71
      
      
仅供参考.卡马克没有写下来.Terje Mathisen和Gary Tarolli都为此获得了部分(并且非常适度)的信用,并且还记入其他一些来源.

这个神话常数是如何产生的,这是一个神秘的东西.

引用加里塔罗利:


  实际上这是以整数形式进行浮点计算 - 花了很长时间才弄清楚这是如何以及为什么这样做的,我不记得细节了.


由专家数学家(Chris Lomont)开发的一个稍好的常数,试图弄清楚原始算法是如何工作的:

float InvSqrt(float x)
{
    float xhalf = 0.5f * x;
    int i = *(int*)&x;              // get bits for floating value
    i = 0x5f375a86 - (i >> 1);      // gives initial guess y0
    x = *(float*)&i;                // convert bits back to float
    x = x * (1.5f - xhalf * x * x); // Newton step, repeating increases accuracy
    return x;
}


尽管如此,他最初尝试的数学'上级'版本的id's sqrt(几乎相同的常数)证明不如最初由加里开发的版本,尽管在数学上更"纯粹".他无法解释为什么id是如此优秀的iirc.


1> Rushyo..：
仅供参考.卡马克没有写下来.Terje Mathisen和Gary Tarolli都为此获得了部分(并且非常适度)的信用,并且还记入其他一些来源.

这个神话常数是如何产生的,这是一个神秘的东西.

引用加里塔罗利:


  实际上这是以整数形式进行浮点计算 - 花了很长时间才弄清楚这是如何以及为什么这样做的,我不记得细节了.


由专家数学家(Chris Lomont)开发的一个稍好的常数,试图弄清楚原始算法是如何工作的:

float InvSqrt(float x)
{
    float xhalf = 0.5f * x;
    int i = *(int*)&x;              // get bits for floating value
    i = 0x5f375a86 - (i >> 1);      // gives initial guess y0
    x = *(float*)&i;                // convert bits back to float
    x = x * (1.5f - xhalf * x * x); // Newton step, repeating increases accuracy
    return x;
}


尽管如此,他最初尝试的数学'上级'版本的id's sqrt(几乎相同的常数)证明不如最初由加里开发的版本,尽管在数学上更"纯粹".他无法解释为什么id是如此优秀的iirc.

        
这完全是*我在恐慌引号中封装该单词的原因,以避免这种废话.我想这可以让读者熟悉口语英语写作.你认为常识就足够了.我没有使用含糊的术语,因为我认为"你知道什么,我真的很想被一个不会费心去查找原始资源的人在Google上查询". 
有一个cookie 
什么是"数学上更纯粹"应该是什么意思？ 

2> Crashworks..：
当然,最近发现它比仅仅使用FPU的sqrt(特别是在360/PS3上)要慢得多,因为在float和int寄存器之间进行交换会导致load-hit-store,而浮点单元可以做倒数平方根源于硬件. 

它只是展示了随着底层硬件性质的变化,优化必须如何发展.

        
它仍然比std :: sqrt()快很多. 
你有资源吗？我想测试运行时，但是没有Xbox 360开发工具包。 

3> BJovke..：
Greg Hewgill和IllidanS4给出了一个很好的数学解释链接.对于那些不想过多介绍细节的人,我会在这里总结一下.

除了一些例外,任何数学函数都可以用多项式和来表示:

y = f(x)


可以完全转化为:

y = a0 + a1*x + a2*(x^2) + a3*(x^3) + a4*(x^4) + ...


其中a0,a1,a2,...是常数.问题是对于许多函数,比如平方根,对于精确值,这个和有无限数量的成员,它不会在某个x ^ n处结束.但是,如果我们停在某个x ^ n处,我们仍然会得到一些精确度的结果.

所以,如果我们有:

y = 1/sqrt(x)


在这种特殊情况下,他们决定丢弃所有超过秒的多项式成员,可能是因为计算速度:

y = a0 + a1*x + [...discarded...]


现在,任务已经下降到计算a0和a1,以便y与精确值的差异最小.他们计算出最合适的值是:

a0 = 0x5f375a86
a1 = -0.5


所以,当你把它变成等式时,你得到:

y = 0x5f375a86 - 0.5*x


这与您在代码中看到的行相同:

i = 0x5f375a86 - (i >> 1);


编辑:实际上这里y = 0x5f375a86 - 0.5*x不一样,i = 0x5f375a86 - (i >> 1);因为将float移动为整数不仅除以2而且将指数除以2并导致其他一些伪影,但它仍然归结为计算一些系数a0,a1,a2 .......

在这一点上,他们发现这个结果的精度不足以达到目的.所以他们另外只做了牛顿迭代的一步来提高结果的准确性:

x = x * (1.5f - xhalf * x * x)


他们本可以在一个循环中完成一些迭代,每个迭代都会改进结果,直到满足所需的精度.这正是它在CPU/FPU中的工作原理!但似乎只有一次迭代就足够了,这也是对速度的祝福.CPU/FPU根据需要进行尽可能多的迭代,以达到存储结果的浮点数的精度,并且它具有适用于所有情况的更通用的算法.



简而言之,他们所做的是:

使用(差不多)与CPU/FPU相同的算法,利用1/sqrt(x)的特殊情况下的初始条件的改进,并且不计算精确CPU/FPU的所有方式将转到但更早停止,因此获得计算速度.

        
将指针强制转换为long是log_2(float)的近似值.将它投回来的是近似2 ^长.这意味着您可以使比率近似线性. 

4> Dillie-O..：
根据这篇不错的文章写了一会儿...


  即使你不能遵循它,代码的神奇之处在于i = 0x5f3759df  - (i >> 1); 线.简化后,Newton-Raphson是一种近似值,它以猜测开始并通过迭代进行精炼.利用32位x86处理器的特性,i,一个整数,最初设置为您想要使用整数转换的反转平方的浮点数的值.然后我将其设置为0x5f3759df,减去自身向右移位一位.右移降低了i的最低位,基本上将其减半.


这是一个非常好的阅读.这只是它的一小部分.

        

5> 小智..：
我很好奇看到常量是浮点数所以我只是编写了这段代码并用google搜索弹出的整数. 

    long i = 0x5F3759DF;
    float* fp = (float*)&i;
    printf("(2^127)^(1/2) = %f\n", *fp);
    //Output
    //(2^127)^(1/2) = 13211836172961054720.000000


看起来常量是"2 ^ 127的平方根的整数近似,其浮点表示的十六进制形式更为人所知,0x5f3759df" https://mrob.com/pub/math/numbers-18.html

它在同一个网站上解释了整个事情.https://mrob.com/pub/math/numbers-16.html#le009_16

        
这值得更多关注.在意识到它只是2 ^ 127的平方根之后,这一切都有意义......



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        在android-priority-jobqueue中检索当前活动作业列表
                    

                    
                                                
                        如何解决《在android-priority-jobqueue中检索当前活动作业列表》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        媒体查询字体大小不起作用
                    

                    
                                                
                        如何解决《媒体查询字体大小不起作用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何播放AMR音频文件？
                    

                    
                                                
                        如何解决《如何播放AMR音频文件？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Django,级联移动到单独的表而不是级联删除
                    

                    
                                                
                        如何解决《Django,级联移动到单独的表而不是级联删除》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Powershell实例的Streams属性上的"Information"属性不可用于编译时
                    

                    
                                                
                            
                        
                                                
                        如何解决《Powershell实例的Streams属性上的"Information"属性不可用于编译时》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何从具有相同名称的嵌套类型的类中引用全局类型？
                    

                    
                                                
                        如何解决《如何从具有相同名称的嵌套类型的类中引用全局类型？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在Selenium中isDisplayed()vs isVisible()
                    

                    
                                                
                        如何解决《在Selenium中isDisplayed()vsisVisible()》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何将current_user传递给Sidekiq的Worker
                    

                    
                                                
                        如何解决《如何将current_user传递给Sidekiq的Worker》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Xamarin/Visual Studio 2015:自定义Proguard配置
                    

                    
                                                
                            
                        
                                                
                        如何解决《Xamarin/VisualStudio2015:自定义Proguard配置》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将变量传递给catch  -  Java
                    

                    
                                                
                        如何解决《将变量传递给catch-Java》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Bash尝试在heredoc中执行命令
                    

                    
                                                
                        如何解决《Bash尝试在heredoc中执行命令》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在机器学习中,"下游"的定义是什么？
                    

                    
                                                
                        如何解决《在机器学习中,"下游"的定义是什么？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何检测dict修改？
                    

                    
                                                
                        如何解决《如何检测dict修改？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在View中访问会话变量
                    

                    
                                                
                        如何解决《在View中访问会话变量》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        sdkman在哪里安装包？
                    

                    
                                                
                        如何解决《sdkman在哪里安装包？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用带有活动或碎片的导航抽屉？
                    

                    
                                                
                        如何解决《使用带有活动或碎片的导航抽屉？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        将库源添加到Android Studio中
                    

                    
                                                
                            
                        
                                                
                        如何解决《将库源添加到AndroidStudio中》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在没有拉动的情况下推？
                    

                    
                                                
                            
                        
                                                
                        如何解决《如何在没有拉动的情况下推？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        编译器虚拟化,不是太聪明？
                    

                    
                                                
                        如何解决《编译器虚拟化,不是太聪明？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        附加两个字符串
                    

                    
                                                
                        如何解决《附加两个字符串》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                小白也坚强_177            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1Spring @RequestParam和控制器接口
                
                                
                    2将ES6"import"转换为nodejs"require"的正确方法
                
                                
                    3当另一组CompletableFutures完成后,您如何完成CompletableFuture？
                
                                
                    4如何访问Angular2中的HTML视频元素
                
                                
                    5从神经网络的不同成本函数和激活函数中选择
                
                                
                    6在NSStackView中拖动视图以重新排列顺序
                
                                
                    7Android onResume和onCreate
                
                                
                    8无法删除或更新父行:外键约束失败 - 删除博客中的帖子
                
                                
                    9应该在左侧或右侧检查null
                
                                
                    10与RxJava结合了解Android内存泄漏
                
                                
                    11我可以在Prolog找到一本关于"确定条款文法"的详尽书籍吗？
                
                                
                    12.htaccess:非www到www(带https)在Firefox中显示ssl_error_bad_cert_domain
                
                                
                    13当我指定1px时,为什么我的SVG线条模糊或高度为2px？
                
                                
                    14如何在golang中执行linux内置命令
                
                                
                    15javascript-slice（-1）中slice的用途是什么
                
                                
                    16无法在4.1中的弹出窗口中选择列表视图中的行但在android 5.0中工作
                
                                
                    17如何在CSS中纵向和横向对齐？
                
                                
                    18从SQL数据库读取时如何指定字段数据类型
                
                                
                    19Golang:在哪里调用接口方法？
                
                                
                    20使用jasmine对karma运行超过10次测试会导致:"错误:您的某些测试会重新加载整页!"