16赞

将可能为null的ascii byte []转换为字符串的最快方法？

作者：拾味湖 | 2023-09-04 18:30

如何解决《将可能为null的asciibyte[]转换为字符串的最快方法？》经验，为你挑选了3个好方法。

我需要将一个(可能)以null结尾的ascii字节数组转换为C#中的字符串,我发现这样做的最快方法是使用下面显示的UnsafeAsciiBytesToString方法.此方法使用String.String(sbyte*)构造函数,其中包含警告:

"假设value参数指向一个数组,该数组表示使用默认ANSI代码页编码的字符串(即Encoding.Default指定的编码方法).

注意:*因为默认的ANSI代码页是系统相关的,所以此构造函数从相同的有符号字节数组创建的字符串可能在不同的系统上有所不同.* ......

*如果指定的数组不以null结尾,则此构造函数的行为取决于系统.例如,这种情况可能会导致访问冲突.* "

现在,我很肯定字符串编码的方式永远不会改变......但是我的应用程序运行的系统上的默认代码页可能会改变.那么,为什么我不应该为使用String.String(sbyte*)而尖叫呢？

using System;
using System.Text;

namespace FastAsciiBytesToString
{
    static class StringEx
    {
        public static string AsciiBytesToString(this byte[] buffer, int offset, int maxLength)
        {
            int maxIndex = offset + maxLength;

            for( int i = offset; i < maxIndex; i++ )
            {
                /// Skip non-nulls.
                if( buffer[i] != 0 ) continue;
                /// First null we find, return the string.
                return Encoding.ASCII.GetString(buffer, offset, i - offset);
            }
            /// Terminating null not found. Convert the entire section from offset to maxLength.
            return Encoding.ASCII.GetString(buffer, offset, maxLength);
        }

        public static string UnsafeAsciiBytesToString(this byte[] buffer, int offset)
        {
            string result = null;

            unsafe
            {
                fixed( byte* pAscii = &buffer[offset] )
                { 
                    result = new String((sbyte*)pAscii);
                }
            }

            return result;
        }
    }

    class Program
    {
        static void Main(string[] args)
        {
            byte[] asciiBytes = new byte[]{ 0, 0, 0, (byte)'a', (byte)'b', (byte)'c', 0, 0, 0 };

            string result = asciiBytes.AsciiBytesToString(3, 6);

            Console.WriteLine("AsciiBytesToString Result: \"{0}\"", result);

            result = asciiBytes.UnsafeAsciiBytesToString(3);

            Console.WriteLine("UnsafeAsciiBytesToString Result: \"{0}\"", result);

            /// Non-null terminated test.
            asciiBytes = new byte[]{ 0, 0, 0, (byte)'a', (byte)'b', (byte)'c' };

            result = asciiBytes.UnsafeAsciiBytesToString(3);

            Console.WriteLine("UnsafeAsciiBytesToString Result: \"{0}\"", result);

            Console.ReadLine();
        }
    }
}

Jon Skeet.. 11

有什么理由不使用String(sbyte*, int, int)构造函数？如果你已经找出了你需要的缓冲区的哪一部分,其余部分应该很简单:

public static string UnsafeAsciiBytesToString(byte[] buffer, int offset, int length)
{
    unsafe
    {
       fixed (byte* pAscii = buffer)
       { 
           return new String((sbyte*)pAscii, offset, length);
       }
    }
}

如果你需要先看看:

public static string UnsafeAsciiBytesToString(byte[] buffer, int offset)
{
    int end = offset;
    while (end < buffer.Length && buffer[end] != 0)
    {
        end++;
    }
    unsafe
    {
       fixed (byte* pAscii = buffer)
       { 
           return new String((sbyte*)pAscii, offset, end - offset);
       }
    }
}

如果这确实是一个ASCII字符串(即所有字节都小于128),那么代码页问题应该不是问题,除非你有一个特别奇怪的默认代码页,它不是基于ASCII的.

出于兴趣,您是否实际上已经分析了您的应用程序以确保这确实是瓶颈？你肯定需要绝对最快的转换,而不是更可读的转换(例如使用Encoding.GetString进行适当的编码)？

1> Jon Skeet..：

有什么理由不使用String(sbyte*, int, int)构造函数？如果你已经找出了你需要的缓冲区的哪一部分,其余部分应该很简单:

public static string UnsafeAsciiBytesToString(byte[] buffer, int offset, int length)
{
    unsafe
    {
       fixed (byte* pAscii = buffer)
       { 
           return new String((sbyte*)pAscii, offset, length);
       }
    }
}

如果你需要先看看:

public static string UnsafeAsciiBytesToString(byte[] buffer, int offset)
{
    int end = offset;
    while (end < buffer.Length && buffer[end] != 0)
    {
        end++;
    }
    unsafe
    {
       fixed (byte* pAscii = buffer)
       { 
           return new String((sbyte*)pAscii, offset, end - offset);
       }
    }
}

如果这确实是一个ASCII字符串(即所有字节都小于128),那么代码页问题应该不是问题,除非你有一个特别奇怪的默认代码页,它不是基于ASCII的.

哦,它也不是瓶颈或任何东西.我只是一个书呆子,在周末没有更好的事情:)

2> user3042599..：

Oneliner(假设缓冲区实际上包含一个格式良好的空终止字符串):

String MyString = Encoding.ASCII.GetString(MyByteBuffer).TrimEnd((Char)0);

仅当缓冲区仅包含一个从数组索引0开始的单个字符串时，此方法才有效

3> Vladimir Pos..：

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace TestProject1
{
    class Class1
    {
    static public string cstr_to_string( byte[] data, int code_page)
    {
        Encoding Enc = Encoding.GetEncoding(code_page);  
        int inx = Array.FindIndex(data, 0, (x) => x == 0);//search for 0
        if (inx >= 0)
          return (Enc.GetString(data, 0, inx));
        else 
          return (Enc.GetString(data)); 
    }

    }
}

推荐阅读

程序员
如何选择功能名称？

如何解决《如何选择功能名称？》经验，为你挑选了1个好方法。 ... [详细]
程序员
水平/垂直线图

如何解决《水平/垂直线图》经验，为你挑选了2个好方法。 ... [详细]
程序员
python逻辑回归(初学者)

如何解决《python逻辑回归(初学者)》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用C++将结构复制到数组中

如何解决《使用C++将结构复制到数组中》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从方法中打印指针的值？

如何解决《如何从方法中打印指针的值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在C中安全二进制搜索

如何解决《在C中安全二进制搜索》经验，为你挑选了1个好方法。 ... [详细]
程序员
匹配列表后修复类型擦除

如何解决《匹配列表后修复类型擦除》经验，为你挑选了1个好方法。 ... [详细]
程序员
Object.wait()超过了超时

如何解决《Object.wait()超过了超时》经验，为你挑选了1个好方法。 ... [详细]
程序员
强制SQL Server查询不返回任何行

如何解决《强制SQLServer查询不返回任何行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从COBOL中的COMP-3字段读取Java中的日期？

如何解决《如何从COBOL中的COMP-3字段读取Java中的日期？》经验，为你挑选了1个好方法。 ... [详细]
程序员
WinSCP .NET程序集:如何下载目录

如何解决《WinSCP.NET程序集:如何下载目录》经验，为你挑选了0个好方法。 ... [详细]
程序员
确定最大开放空间的高效算法

如何解决《确定最大开放空间的高效算法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果孩子的总数是偶数,如何将样式添加到倒数第二？

如何解决《如果孩子的总数是偶数,如何将样式添加到倒数第二？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Jupyter和Common Lisp

如何解决《Jupyter和CommonLisp》经验，为你挑选了1个好方法。 ... [详细]
程序员
即时添加/删除组件

如何解决《即时添加/删除组件》经验，为你挑选了1个好方法。 ... [详细]
程序员
滚动淡出div

如何解决《滚动淡出div》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何按顺序刷新IPython Notebook中的图？

如何解决《如何按顺序刷新IPythonNotebook中的图？》经验，为你挑选了0个好方法。 ... [详细]
程序员
扩展"读取"式行为

如何解决《扩展"读取"式行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
将前导零添加到varchar字段

如何解决《将前导零添加到varchar字段》经验，为你挑选了2个好方法。 ... [详细]
程序员
在swift中将阴影应用于导航栏

如何解决《在swift中将阴影应用于导航栏》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章