我正在研究串行端口,以8位数据向某些硬件发送和接收数据.我想将它存储为字符串以便于比较,并且预设数据以字符串或十六进制格式存储在xml文件中.我发现只有在使用ANSI编码的Encoding.Default时才能正确转换8位数据,并且很容易可逆.ASCII编码仅适用于7位数据,UTF8或UTF7也不适用,因为我使用的是1-255中的某些字符.Encoding.Default会很好,但我在MSDN上读到它依赖于OS代码页设置,这意味着它可能在配置的不同代码页上表现不同.我使用编码广泛使用GetBytes()和GetString,但是想要一种在任何配置下始终可用的故障安全和可移植方法.
Latin-1 aka ISO-8859-1 aka codepage 28591是这种情况的有用代码页,因为它映射128-255范围内的值不变.以下是可以互换的:
Encoding.GetEncoding(28591) Encoding.GetEncoding("Latin1") Encoding.GetEncoding("iso-8859-1")
以下代码说明了对于Latin1,与Encoding.Default不同,0-255范围内的所有字符都未更改映射:
static void Main(string[] args) { Console.WriteLine("Test Default Encoding returned {0}", TestEncoding(Encoding.Default)); Console.WriteLine("Test Latin1 Encoding returned {0}", TestEncoding(Encoding.GetEncoding("Latin1"))); Console.ReadLine(); return; } private static bool CompareBytes(char[] chars, byte[] bytes) { bool result = true; if (chars.Length != bytes.Length) { Console.WriteLine("Length mismatch {0} bytes and {1} chars" + bytes.Length, chars.Length); return false; } for (int i = 0; i < chars.Length; i++) { int charValue = (int)chars[i]; if (charValue != (int)bytes[i]) { Console.WriteLine("Byte at index {0} value {1:X4} does not match char {2:X4}", i, (int) bytes[i], charValue); result = false; } } return result; } private static bool TestEncoding(Encoding encoding) { byte[] inputBytes = new byte[256]; for (int i = 0; i < 256; i++) { inputBytes[i] = (byte) i; } char[] outputChars = encoding.GetChars(inputBytes); Console.WriteLine("Comparing input bytes and output chars"); if (!CompareBytes(outputChars, inputBytes)) return false; byte[] outputBytes = encoding.GetBytes(outputChars); Console.WriteLine("Comparing output bytes and output chars"); if (!CompareBytes(outputChars, outputBytes)) return false; return true; }
为什么不使用字节数组呢?使用文本方法可能不会遇到任何编码问题.