所以这是交易:我正在尝试打开一个文件(从字节),将其转换为字符串,以便我可以在标题中混淆一些元数据,将其转换回字节,然后保存.我现在遇到的问题是使用此代码.当我比较来回转换(但没有修改)的字符串到原始字节数组时,它是不相等的.我怎样才能做到这一点?
public static byte[] StringToByteArray(string str) { UTF8Encoding encoding = new UTF8Encoding(); return encoding.GetBytes(str); } public string ByteArrayToString(byte[] input) { UTF8Encoding enc = new UTF8Encoding(); string str = enc.GetString(input); return str; }
这是我如何比较它们.
byte[] fileData = GetBinaryData(filesindir[0], Convert.ToInt32(fi.Length)); string fileDataString = ByteArrayToString(fileData); byte[] recapturedBytes = StringToByteArray(fileDataString); Response.Write((fileData == recapturedBytes));
我确定它是UTF-8,使用:
StreamReader sr = new StreamReader(filesindir[0]); Response.Write(sr.CurrentEncoding);
返回"System.Text.UTF8Encoding".
尝试在Encoding
类上提供静态函数,为您提供各种编码的实例.您不需要实例化Encoding
just以转换为/从字节数组转换.你是如何比较代码中的字符串的?
编辑
你在比较数组,而不是字符串.它们是不平等的,因为它们指的是两个不同的阵列; 使用==
运算符只会比较它们的引用,而不是它们的值.您需要检查数组的每个元素,以确定它们是否相同.
public bool CompareByteArrays(byte[] lValue, byte[] rValue) { if(lValue == rValue) return true; // referentially equal if(lValue == null || rValue == null) return false; // one is null, the other is not if(lValue.Length != rValue.Length) return false; // different lengths for(int i = 0; i < lValue.Length; i++) { if(lValue[i] != rValue[i]) return false; } return true; }
当你有原始字节(8位可能不可打印的字符)并想要将它们作为.NET字符串操作并将它们转回字节时,你可以通过使用
Encoding.GetEncoding(1252)
而不是UTF8Encoding.该编码可以获取任何8位值并将其转换为.NET 16位字符,然后再返回,而不会丢失任何信息.
在上面描述的特定情况下,使用二进制文件,您将无法"弄乱标题中的元数据"并使事情正常工作,除非您使用的数据长度不变.例如,如果标头包含
{any}{any}ABC{any}{any}
并且你想将ABC改为DEF,这应该按你的意愿工作.但是如果要将ABC更改为WXYZ,则必须在"C"之后的字节上进行写操作,否则您将(实质上)将所有内容向右移动一个字节.在典型的二进制文件中,这会使事情变得非常糟糕.
如果"ABC"之后的字节是空格或空字符,那么编写更大的替换数据的机会就更有可能不会造成麻烦 - 但是你仍然无法用.NET字符串中的WXYZ替换ABC,使其更长 - 你会必须用WXYZ替换ABC {whatever_follows_it}.鉴于此,您可能会发现将数据保留为字节并将替换数据一次写入一个字节更容易.
由于.NET字符串使用Unicode字符串这一事实,你不能再像C语言那样做了.在大多数情况下,你甚至不应该尝试从字符串< - >字节数组来回,除非内容实际上是文字.
我必须明确这一点:在.NET中,如果byte[]
数据不是文本,则不要尝试将其转换为string
除了文本通道上二进制数据的特殊Base64编码.这是在.NET中工作的人们普遍存在的误解.