我有一个JavaScript请求转到ASP.Net(2.0)HTTP处理程序,它将请求传递给java Web服务.在此系统中,特殊字符(例如具有重音的字符)无法正确传递.
例如
人力投入: Düsseldorf
成为JavaScript asynch请求http://site/serviceproxy.ashx?q=D%FCsseldorf
,据我所知,它在ISO-8859-1和UTF-8中都有效.(除非它是UTF-8中的%c3%bc)
HttpContext.Current.Request.QueryString.Get("q")
返回D?sseldorf
故障开始的地方.
但是HttpUtility.UrlEncode(HttpContext.Current.Request.QueryString.Get("q"), Encoding.GetEncoding("ISO-8859-1"))
返回D%3fsseldorf
('''')
并 HttpUtility.UrlEncode(HttpContext.Current.Request.QueryString.Get("q"), Encoding.UTF8)
返回D%ef%bfsseldorf
因此,该值不会被解码,也不会被正确地重新编码以传递给java服务.
注意HttpContext.Current.Request.Url.Query
是?q=D%FCsseldorf&output=json&from=1&to=10
虽然HttpContext.Current.Request.QueryString.ToString()
是q=D%ufffdsseldorf&output=json&from=1&to=10
为什么这样,我怎么能告诉它HttpContext
尊重请求标题,包括:
Content-Type=application/x-www-form-urlencoded;+charset=UTF-8
并QueryString
使用UTF-8字符集解码URL .
附录:正如答案所指出的那样,问题不在于解码与编码有关; escape()
在JavaScript中使用不会根据UTF-8进行转义,而使用时encodeURIComponent()
也是如此.
我不知道您的服务器(IIS?)使用的默认字符编码是什么,或者是否可以更改,但我可以告诉您一些可能有用的信息.
0xFC是ü的ISO-8859-1编码.虽然Unicode代码点是U + 00FC,但当使用UTF-8编码时,这需要两个字节,并且变为0xC3 0xBC.
如果UTF-8解码器要查看非法字节序列0xFC,它会将其解码为Unicode"替换字符",U + FFFD,并在它看到另一个有效字节序列的开头时拾取,在本例中为".
你得到的原因%3f
是'?' 是拉丁字符集的"替换字符",类似于Unicode字符集中的 .
我相信您所看到的是使用ISO-8859-1的客户端编码,但服务器使用UTF-8进行解码.一旦它到达服务器,您的数据就会被破坏.我建议您修改客户端以使用UTF-8编码; 它应该是请求http://site/serviceproxy.ashx?q=D%C3%BCsseldorf
听起来您正在使用JavaScript构建这些URL,因此您应该使用encodeURI
和encodeURIComponent
函数,而不是escape
.