16赞

如何使用SSE执行uint32/float转换？

作者：手机用户2402851155 | 2023-09-11 11:14

如何解决《如何使用SSE执行uint32/float转换？》经验，为你挑选了2个好方法。

在SSE中有一个函数_mm_cvtepi32_ps(__m128i input),它接受32位宽的有符号整数(int32_t)的输入向量并将它们转换为floats.

现在,我想将输入整数解释为未签名.但是没有功能_mm_cvtepu32_ps,我找不到一个实现.你知道我在哪里可以找到这样的功能,或者至少对实现有所暗示吗？为了说明结果的差异:

unsigned int a = 2480160505; // 10010011 11010100 00111110 11111001   
float a1 = a; // 01001111 00010011 11010100 00111111;  
float a2 = (signed int)a; // 11001110 11011000 01010111 10000010

wim.. 6

使用Paul R的解决方案和我以前的解决方案，舍入的浮点数与原始整数之间的差小于或等于0.75 ULP（最后一位的单位）。在这些方法中，可能会在两个地方出现舍入：_mm_cvtepi32_ps和_mm_add_ps。这导致某些输入的结果不太准确。

例如，使用Paul R的方法，将0x2000003 = 33554435转换为33554432.0，但33554436.0也作为浮点数存在，这在这里会更好。我以前的解决方案也存在类似的错误。编译器生成的代码也可能发生这种不准确的结果，请参见此处。

遵循gcc的方法（请参阅Peter Cordes对另一个SO问题的回答），可以在0.5 ULP内获得准确的转换：

inline __m128 _mm_cvtepu32_ps(const __m128i v)
{
    __m128i msk_lo    = _mm_set1_epi32(0xFFFF);
    __m128  cnst65536f= _mm_set1_ps(65536.0f);

    __m128i v_lo      = _mm_and_si128(v,msk_lo);          /* extract the 16 lowest significant bits of v                                   */
    __m128i v_hi      = _mm_srli_epi32(v,16);             /* 16 most significant bits of v                                                 */
    __m128  v_lo_flt  = _mm_cvtepi32_ps(v_lo);            /* No rounding                                                                   */
    __m128  v_hi_flt  = _mm_cvtepi32_ps(v_hi);            /* No rounding                                                                   */
            v_hi_flt  = _mm_mul_ps(cnst65536f,v_hi_flt);  /* No rounding                                                                   */
    return              _mm_add_ps(v_hi_flt,v_lo_flt);    /* Rounding may occur here, mul and add may fuse to fma for haswell and newer    */
}                                                         /* _mm_add_ps is guaranteed to give results with an error of at most 0.5 ULP     */

请注意，只要_mm_cvt_ps可以将两个片段都转换为浮点数而无需取整，则可以使用其他高位/低位分区。例如，具有20个高位和12个低位的分区将同样有效。

1> wim..：

遵循gcc的方法（请参阅Peter Cordes对另一个SO问题的回答），可以在0.5 ULP内获得准确的转换：

inline __m128 _mm_cvtepu32_ps(const __m128i v)
{
    __m128i msk_lo    = _mm_set1_epi32(0xFFFF);
    __m128  cnst65536f= _mm_set1_ps(65536.0f);

    __m128i v_lo      = _mm_and_si128(v,msk_lo);          /* extract the 16 lowest significant bits of v                                   */
    __m128i v_hi      = _mm_srli_epi32(v,16);             /* 16 most significant bits of v                                                 */
    __m128  v_lo_flt  = _mm_cvtepi32_ps(v_lo);            /* No rounding                                                                   */
    __m128  v_hi_flt  = _mm_cvtepi32_ps(v_hi);            /* No rounding                                                                   */
            v_hi_flt  = _mm_mul_ps(cnst65536f,v_hi_flt);  /* No rounding                                                                   */
    return              _mm_add_ps(v_hi_flt,v_lo_flt);    /* Rounding may occur here, mul and add may fuse to fma for haswell and newer    */
}                                                         /* _mm_add_ps is guaranteed to give results with an error of at most 0.5 ULP     */

请注意，只要_mm_cvt_ps可以将两个片段都转换为浮点数而无需取整，则可以使用其他高位/低位分区。例如，具有20个高位和12个低位的分区将同样有效。

2> Paul R..：

这个功能存在于AVX-512中,但是如果你不能等到那时我唯一能建议的就是将unsigned int输入值转换成较小值的对,转换它们,然后再将它们加在一起,例如

inline __m128 _mm_cvtepu32_ps(const __m128i v)
{
    __m128i v2 = _mm_srli_epi32(v, 1);     // v2 = v / 2
    __m128i v1 = _mm_sub_epi32(v, v2);     // v1 = v - (v / 2)
    __m128 v2f = _mm_cvtepi32_ps(v2);
    __m128 v1f = _mm_cvtepi32_ps(v1);
    return _mm_add_ps(v2f, v1f); 
}





UPDATE

正如@wim在他的回答中指出的那样,上述解决方案的输入值失败了UINT_MAX.这是一个更强大但效率稍低的解决方案,它应该适用于整个uint32_t输入范围:

inline __m128 _mm_cvtepu32_ps(const __m128i v)
{
    __m128i v2 = _mm_srli_epi32(v, 1);                 // v2 = v / 2
    __m128i v1 = _mm_and_si128(v, _mm_set1_epi32(1));  // v1 = v & 1
    __m128 v2f = _mm_cvtepi32_ps(v2);
    __m128 v1f = _mm_cvtepi32_ps(v1);
    return _mm_add_ps(_mm_add_ps(v2f, v2f), v1f);      // return 2 * v2 + v1
}



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        std :: weak_ptr:lock或shared_ptr构造函数？
                    

                    
                                                
                        如何解决《std::weak_ptr:lock或shared_ptr构造函数？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        无法解析Manifest.permission.ACCESS_FINE_LOCATION
                    

                    
                                                
                        如何解决《无法解析Manifest.permission.ACCESS_FINE_LOCATION》经验，为你挑选了4个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        为什么我的BroadcastHashJoin比Spark中的ShuffledHashJoin慢
                    

                    
                                                
                        如何解决《为什么我的BroadcastHashJoin比Spark中的ShuffledHashJoin慢》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如果异常不为null,则Nlog输出字符
                    

                    
                                                
                        如何解决《如果异常不为null,则Nlog输出字符》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何将分割更改为R中的水平分割？
                    

                    
                                                
                        如何解决《如何将分割更改为R中的水平分割？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        pandas.read_csv中dtype和转换器之间有什么区别？
                    

                    
                                                
                        如何解决《pandas.read_csv中dtype和转换器之间有什么区别？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何迭代Pandas中的MultiIndex级别？
                    

                    
                                                
                        如何解决《如何迭代Pandas中的MultiIndex级别？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Matplotlib只是给出错误消息
                    

                    
                                                
                        如何解决《Matplotlib只是给出错误消息》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        未找到本机DLL
                    

                    
                                                
                        如何解决《未找到本机DLL》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在Ext.panel.Tool中使用字体awesome
                    

                    
                                                
                        如何解决《如何在Ext.panel.Tool中使用字体awesome》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        SaveTo StringHelper？
                    

                    
                                                
                        如何解决《SaveToStringHelper？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        CakePHP错误:在Acl中找不到类'String'
                    

                    
                                                
                        如何解决《CakePHP错误:在Acl中找不到类'String'》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        CoordinatorLayout和AppBarLayout提升
                    

                    
                                                
                            
                        
                                                
                        如何解决《CoordinatorLayout和AppBarLayout提升》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Laravel  - 防止错误显示在控制台中
                    

                    
                                                
                        如何解决《Laravel-防止错误显示在控制台中》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何随机洗牌具有比PRNG时期更多排列的列表？
                    

                    
                                                
                        如何解决《如何随机洗牌具有比PRNG时期更多排列的列表？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何创建"逐步匹配"的正则表达式？
                    

                    
                                                
                        如何解决《如何创建"逐步匹配"的正则表达式？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Aurelia aurelia-fetch-client和JSON POST
                    

                    
                                                
                        如何解决《Aureliaaurelia-fetch-client和JSONPOST》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在C#中的json中反序列化表情符号
                    

                    
                                                
                        如何解决《如何在C#中的json中反序列化表情符号》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        用于Cordova的Azure移动服务/ VS工具 -  404
                    

                    
                                                
                        如何解决《用于Cordova的Azure移动服务/VS工具-404》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        从列表中调用元素的析构函数
                    

                    
                                                
                        如何解决《从列表中调用元素的析构函数》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                手机用户2402851155            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1如何在QTabWidget中隐藏选项卡并在按下按钮时显示它
                
                                
                    2在pandas数据帧中使用最大似然估计的自回归(AR)模型:correlate()得到了一个意外的关键字参数'旧行为'
                
                                
                    3OpenCV:是否可以从角落检测矩形？
                
                                
                    4RegExp匹配键值对列表中的值
                
                                
                    5如果只需要结果的低部分,那么可以使用哪个2的补码整数运算而不将输入中的高位置零？
                
                                
                    6在perl中通过HASH迭代
                
                                
                    7什么是linux中的链接irq,何时需要使用？
                
                                
                    8如何在Android中向推送通知添加按钮
                
                                
                    9如何配置流明以通过Pusher广播事件？
                
                                
                    10是否可以在Integration Tests中的规范之间重新启动浏览器？
                
                                
                    11flask模板继承教程
                
                                
                    12SQL select语句结合不同的表
                
                                
                    13如何在firefox开发人员版中为移动设备模拟chrome浏览器
                
                                
                    14什么是在必要时将`this`变成`forEach`回调的首选方法？
                
                                
                    15从MapKit(Swift 2)获取中心坐标并在UILabel中显示
                
                                
                    16在Laravel中使用https加载刀片资产
                
                                
                    17求和整数树(Haskell)
                
                                
                    18在IPython笔记本(Bokeh)中绘制大型数据集
                
                                
                    19Visual Studio 2015  - 我可以为支持bower和AngularJS intellisense的客户端开发项目制作项目吗？
                
                                
                    20C弦指针