20赞

如何在python中取消引用urlencoded unicode字符串？

作者：殉情放开那只小兔子 | 2023-09-02 18:07

如何解决《如何在python中取消引用urlencodedunicode字符串？》经验，为你挑选了3个好方法。

我有一个像"Tanım"这样的unicode字符串,它以某种方式被编码为"Tan%u0131m".如何将此编码的字符串转换回原始的unicode.显然urllib.unquote不支持unicode.

1> Aaron Maenpa..：

%uXXXX是一种非标准的编码方案,虽然实际上仍然存在于JavaScript领域,但已被w3c拒绝.

更常见的技术似乎是UTF-8编码字符串,然后%%使用%XX转义结果字节.urllib.unquote支持此方案:

>>> urllib2.unquote("%0a")
'\n'

不幸的是,如果你真的需要支持%uXXXX,你可能不得不推出自己的解码器.否则,简单地UTF-8编码你的unicode然后%转义结果字节可能更为可取.

一个更完整的例子:

>>> u"Tan?m"
u'Tan\u0131m'
>>> url = urllib.quote(u"Tan?m".encode('utf8'))
>>> urllib.unquote(url).decode('utf8')
u'Tan\u0131m'

'urllib2.unquote'应为'urllib.unquote'

2> Markus Jarde..：

def unquote(text):
    def unicode_unquoter(match):
        return unichr(int(match.group(1),16))
    return re.sub(r'%u([0-9a-fA-F]{4})',unicode_unquoter,text)

3> Ali Afshar..：

如果你绝对必须这样做,我会这样做(我真的同意"非标准"的呼声):

from urllib import unquote

def unquote_u(source):
    result = unquote(source)
    if '%u' in result:
        result = result.replace('%u','\\u').decode('unicode_escape')
    return result

print unquote_u('Tan%u0131m')

> Tan?m

推荐阅读

程序员
plotly js:如何在加载绘图图像后运行我的javascript

如何解决《plotlyjs:如何在加载绘图图像后运行我的javascript》经验，为你挑选了0个好方法。 ... [详细]
程序员
Stata访问元素作为标量或宏的矩阵

如何解决《Stata访问元素作为标量或宏的矩阵》经验，为你挑选了1个好方法。 ... [详细]
程序员
重构Ruby

如何解决《重构Ruby》经验，为你挑选了1个好方法。 ... [详细]
程序员
java:如何为变量自动生成自定义方法

如何解决《java:如何为变量自动生成自定义方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
自定义URI方案和Skype链接

如何解决《自定义URI方案和Skype链接》经验，为你挑选了0个好方法。 ... [详细]
程序员
有没有办法关闭JIT编译器,这样做会对性能产生影响吗？

如何解决《有没有办法关闭JIT编译器,这样做会对性能产生影响吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
因大小而无法上传文件

如何解决《因大小而无法上传文件》经验，为你挑选了0个好方法。 ... [详细]
程序员
当键盘出现在swift中时,向上滚动UITableView

如何解决《当键盘出现在swift中时,向上滚动UITableView》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android上的Cordova全屏启动画面仍显示标题栏

如何解决《Android上的Cordova全屏启动画面仍显示标题栏》经验，为你挑选了2个好方法。 ... [详细]
程序员
Swing Ui倍增面板重影

如何解决《SwingUi倍增面板重影》经验，为你挑选了1个好方法。 ... [详细]
程序员
移动到vim中行中给定字符的最后一个实例？

如何解决《移动到vim中行中给定字符的最后一个实例？》经验，为你挑选了1个好方法。 ... [详细]
程序员
应用程序在HttpLoggingInterceptor上崩溃

如何解决《应用程序在HttpLoggingInterceptor上崩溃》经验，为你挑选了1个好方法。 ... [详细]
程序员
docker组合中'image'和'build'之间的区别

如何解决《docker组合中'image'和'build'之间的区别》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android 6.0.1上的Spinner内部填充更大

如何解决《Android6.0.1上的Spinner内部填充更大》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Python中将浮点数舍入到最接近的整数

如何解决《如何在Python中将浮点数舍入到最接近的整数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在换行符和逗号上拆分字符串

如何解决《在换行符和逗号上拆分字符串》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用Ninject获取实例

如何解决《使用Ninject获取实例》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在UWP App中编码/解码url字符串

如何解决《如何在UWPApp中编码/解码url字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Visual Studio代码中注释多行？

如何解决《如何在VisualStudio代码中注释多行？》经验，为你挑选了11个好方法。 ... [详细]
程序员
如何使用spark sc.textFile获取文件名？

如何解决《如何使用sparksc.textFile获取文件名？》经验，为你挑选了1个好方法。 ... [详细]

殉情放开那只小兔子

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章