正在将自定义HTTP标头传递给Servlet应用程序以进行身份验证.标头值必须能够包含重音和其他非ASCII字符,因此必须采用特定编码(理想情况下为UTF-8).
控制身份验证环境的开发人员向我提供了这段Java代码:
String firstName = request.getHeader("my-custom-header"); String decodedFirstName = new String(firstName.getBytes(),"UTF-8");
但是这段代码对我来说看起来并不合适:它假定了头值的编码,当我觉得有一种正确的方法来指定头值的编码时(我认为来自MIME).
这是我的问题:处理需要支持UTF-8编码的自定义标头值的正确方法(tm)是什么:
在电线上(标题在电线上的样子)
从解码的角度来看(如何使用Java Servlet API对其进行解码,我们可以假设request.getHeader()已经正确地进行了解码)
这是一个与环境无关的代码示例,如果您无法更改服务,则将标头视为UTF-8:
String valueAsISO = request.getHeader("my-custom-header"); String valueAsUTF8 = new String(firstName.getBytes("ISO8859-1"),"UTF-8");
小智.. 7
再说一次:RFC 2047在实践中没有实现.HTTP/1.1的下一个版本将删除任何提及它.
因此,如果您需要传输非ASCII字符,最安全的方法是将它们编码为ASCII序列,例如Atom发布协议中的"Slug"标头.
再说一次:RFC 2047在实践中没有实现.HTTP/1.1的下一个版本将删除任何提及它.
因此,如果您需要传输非ASCII字符,最安全的方法是将它们编码为ASCII序列,例如Atom发布协议中的"Slug"标头.
HTTPbis工作组知道这个问题,并且最新的草案摆脱了与TEXT和RFC 2047编码相关的所有语言 - 它实际上并未在HTTP上使用.
有关整个故事,请参见http://trac.tools.ietf.org/wg/httpbis/trac/ticket/74.