当前位置:  开发笔记 > 编程语言 > 正文

在Java中将UTF-8转换为ISO-8859-1 - 如何将其保持为单字节

如何解决《在Java中将UTF-8转换为ISO-8859-1-如何将其保持为单字节》经验,为你挑选了3个好方法。

我试图将UTF-8中编码的字符串转换为ISO-8859-1.比如说,在字符串'âabcd''中,在ISO-8859-1中表示为E2.在UTF-8中,它表示为两个字节.C3 A2我相信.当我执行getbytes(编码)然后使用ISO-8859-1编码中的字节创建一个新字符串时,我得到两个不同的字符.¢?.有没有其他方法可以做到这一点,以保持角色相同,即âabcd?



1> Adam Rosenfi..:

如果你正在处理UTF-16以外的字符编码,你不应该使用java.lang.Stringchar原语 - 你应该只使用byte[]数组或ByteBuffer对象.然后,您可以使用java.nio.charset.Charset转换编码:

Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");

ByteBuffer inputBuffer = ByteBuffer.wrap(new byte[]{(byte)0xC3, (byte)0xA2});

// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);

// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();



2> Joachim Saue..:
byte[] iso88591Data = theString.getBytes("ISO-8859-1");

会做的伎俩.从您的描述看起来好像您正试图"存储ISO-8859-1字符串".Java中的字符串对象始终以UTF-16隐式编码.没有办法改变那种编码.

你可以做什么,'但是要获得构成它的其他编码的字节(使用如上所示的.getBytes()方法).



3> Pete Kirkham..:

从使用UTF-8编码字符串的一组字节开始,从该数据创建一个字符串,然后获取一些字节,以不同的编码对字符串进行编码:

    byte[] utf8bytes = { (byte)0xc3, (byte)0xa2, 0x61, 0x62, 0x63, 0x64 };
    Charset utf8charset = Charset.forName("UTF-8");
    Charset iso88591charset = Charset.forName("ISO-8859-1");

    String string = new String ( utf8bytes, utf8charset );

    System.out.println(string);

    // "When I do a getbytes(encoding) and "
    byte[] iso88591bytes = string.getBytes(iso88591charset);

    for ( byte b : iso88591bytes )
        System.out.printf("%02x ", b);

    System.out.println();

    // "then create a new string with the bytes in ISO-8859-1 encoding"
    String string2 = new String ( iso88591bytes, iso88591charset );

    // "I get a two different chars"
    System.out.println(string2);

这会正确输出字符串和iso88591字节:

âabcd 
e2 61 62 63 64 
âabcd

所以你的字节数组没有与正确的编码配对:

    String failString = new String ( utf8bytes, iso88591charset );

    System.out.println(failString);

输出

âabcd

(或者你只是将utf8字节写入文件并在别处将其作为iso88591读取)

推荐阅读
无名有名我无名_593
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有