6赞

当前位置: 开发笔记 > 编程语言 > 正文

编码/解码有什么区别？

作者：mobiledu2402851203 | 2023-08-31 20:42

如何解决《编码/解码有什么区别？》经验，为你挑选了5个好方法。

我从来不确定我理解str/unicode解码和编码之间的区别.

我知道这str().decode()是因为当你有一个字符串,你知道它有一定的字符编码,给定编码名称它将返回一个unicode字符串.

我知道unicode().encode()根据给定的编码名称将unicode字符转换为字符串.

但我不明白是什么str().encode(),unicode().decode()是为了什么.任何人都可以解释,并可能还纠正我上面遇到的任何其他错误吗？

编辑:

几个答案给出了.encode关于字符串上的内容的信息,但似乎没有人知道.decodeunicode 是做什么的.

1> 小智..：

decodeunicode字符串的方法实际上根本没有任何应用程序(除非你出于某种原因在unicode字符串中有一些非文本数据 - 见下文).我认为这主要是出于历史原因.在Python 3中它完全消失了.

unicode().decode()将执行隐式编码的s使用默认(ASCII)编解码器.验证这样:

>>> s = u'ö'
>>> s.decode()
Traceback (most recent call last):
  File "", line 1, in 
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in position 0:
ordinal not in range(128)

>>> s.encode('ascii')
Traceback (most recent call last):
  File "", line 1, in 
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in position 0:
ordinal not in range(128)

错误消息完全相同.

对于str().encode()它周围的其他方法-它试图隐式解码的s默认编码方式:

>>> s = 'ö'
>>> s.decode('utf-8')
u'\xf6'
>>> s.encode()
Traceback (most recent call last):
  File "", line 1, in 
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0:
ordinal not in range(128)

像这样使用,str().encode()也是多余的.

但后一种方法的另一个应用是有用的:存在与字符集无关的编码,因此可以以有意义的方式应用于8位字符串:

>>> s.encode('zip')
'x\x9c;\xbc\r\x00\x02>\x01z'

不过你是对的:对这两个应用程序的"编码"模糊用法是......尴尬.同样,使用Python 3中的单独byte和string类型,这不再是一个问题.

Unicode字符串上的`.decode()`可能很有用,例如,'print u'\\ u0203'.decode('unicode-escape')`

2> codeape..：

将unicode字符串表示为字节串称为编码.使用u'...'.encode(encoding).

例:

    >>> u'æøå'.encode('utf8')
    '\xc3\x83\xc2\xa6\xc3\x83\xc2\xb8\xc3\x83\xc2\xa5'
    >>> u'æøå'.encode('latin1')
    '\xc3\xa6\xc3\xb8\xc3\xa5'
    >>> u'æøå'.encode('ascii')
    UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: 
    ordinal not in range(128)

通常,只要需要将其用于IO,就可以对unicode字符串进行编码,例如通过网络传输,或将其保存到磁盘文件中.

将字符串转换为unicode字符串称为解码.使用unicode('...', encoding)或'...'.解码(编码).

例:

   >>> u'æøå'
   u'\xc3\xa6\xc3\xb8\xc3\xa5' # the interpreter prints the unicode object like so
   >>> unicode('\xc3\xa6\xc3\xb8\xc3\xa5', 'latin1')
   u'\xc3\xa6\xc3\xb8\xc3\xa5'
   >>> '\xc3\xa6\xc3\xb8\xc3\xa5'.decode('latin1')
   u'\xc3\xa6\xc3\xb8\xc3\xa5'

每当从网络或磁盘文件接收字符串数据时,通常会解码一串字节.

我相信在python 3中unicode处理有一些变化,所以上面的python 3可能不正确.

一些好的链接:

绝对最低每个软件开发人员绝对必须知道Unicode和字符集(没有借口!)

Unicode HOWTO

你没有回答OP的问题.OP想知道str.encode()和unicode.decode()的作用.你刚才重复了原问题中的陈述.

3> Abgan..：

anUnicode.encode('encoding')产生一个字符串对象,可以在unicode对象上调用

ASTRING.decode('encoding')产生一个unicode对象,可以在一个字符串上调用,以给定的编码进行编码.

更多解释:

您可以创建一些unicode对象,该对象没有任何编码集.Python在内存中存储的方式无关紧要.你可以搜索它,拆分它并调用你喜欢的任何字符串操作函数.

但有一段时间,当你想将你的unicode对象打印到控制台或某个文本文件时.所以你必须对它进行编码(例如 - 在UTF-8中),你调用encode('utf-8'),你会得到一个内部带有'\ u '的字符串,这是完全可打印的.

然后,再次 - 你想做相反的事情 - 读取UTF-8编码的字符串并将其视为Unicode,因此\ u360将是一个字符,而不是5.然后你解码一个字符串(使用选定的编码)和获得unicode类型的全新对象.

正如旁注 - 你可以选择一些变态编码,如'zip','base64','rot',其中一些将从字符串转换为字符串,但我相信最常见的情况是涉及UTF-8/UTF-16和字符串.

4> nosklo..：

mybytestring.encode(somecodec)对以下值有意义somecodec:

BASE64

BZ2

zlib的

十六进制

quopri

ROT13

string_escape

我不确定解码已经解码的unicode文本是什么有用的.尝试使用任何编码似乎总是尝试首先使用系统的默认编码进行编码.

5> 小智..：

有一些编码可用于从str到str或从unicode到unicode进行解码/编码.例如base64,hex或甚至rot13.它们列在编解码器模块中.

编辑:

unicode字符串上的解码消息可以撤消相应的编码操作:

In [1]: u'0a'.decode('hex')
Out[1]: '\n'

返回的类型是str而不是unicode,这在我看来是不幸的.但是当你没有在str和unicode之间进行适当的en//解码时,无论如何这看起来都像是一团糟.

@nosklo:你是对的.我真正的意思是unicode对象有一个decode()方法,所以你也可以对它们应用非字符编码编解码器.这整个非字符编码业务使得这个界面在Python <3中变得一团糟.

推荐阅读

程序员
Azure Portal无法创建新的os磁盘,vm映像等

如何解决《AzurePortal无法创建新的os磁盘,vm映像等》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何管理iOS apns令牌更改

如何解决《如何管理iOSapns令牌更改》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Javascript在每个第二个字符后添加冒号(:)

如何解决《使用Javascript在每个第二个字符后添加冒号(:)》经验，为你挑选了2个好方法。 ... [详细]
程序员
IB Designables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常

如何解决《IBDesignables:无法更新自动布局状态:代理引发了"CALayerInvalidGeometry"异常》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQLSTATE [HY000] [2002] php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道

如何解决《SQLSTATE[HY000][2002]php_network_getaddresses:getaddrinfo失败:提供nodename或servname,或者不知道》经验，为你挑选了1个好方法。 ... [详细]
程序员
抛出constexpr功能

如何解决《抛出constexpr功能》经验，为你挑选了2个好方法。 ... [详细]
程序员
通过IO了解Haskell中的纯函数

如何解决《通过IO了解Haskell中的纯函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Yii2中的视图文件中使用ArrayHelper

如何解决《在Yii2中的视图文件中使用ArrayHelper》经验，为你挑选了1个好方法。 ... [详细]
程序员
尾递归与原始递归

如何解决《尾递归与原始递归》经验，为你挑选了1个好方法。 ... [详细]
程序员
语法错误:'delimiter'在这里输入无效

如何解决《语法错误:'delimiter'在这里输入无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么不能满足相关类型的From <>的更高的kinded特性限制,但Into <>可以吗？

如何解决《为什么不能满足相关类型的From<>的更高的kinded特性限制,但Into<>可以吗？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将Future [Vector [UserLocation]]转换为Future [Vector [User]]

如何解决《如何将Future[Vector[UserLocation]]转换为Future[Vector[User]]》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以构建一个惰性条件元函数

如何解决《是否可以构建一个惰性条件元函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
制作填充图Matplotlib-错误：类型升级无效

如何解决《制作填充图Matplotlib-错误：类型升级无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
在R中将两个列值粘贴在一起时省略NA值

如何解决《在R中将两个列值粘贴在一起时省略NA值》经验，为你挑选了0个好方法。 ... [详细]
程序员
从视图运行时如何修复Url（〜/ Views / Home / Index.cshtml）

如何解决《从视图运行时如何修复Url（〜/Views/Home/Index.cshtml）》经验，为你挑选了1个好方法。 ... [详细]
程序员
Gunicorn Upstart文件无法启动

如何解决《GunicornUpstart文件无法启动》经验，为你挑选了0个好方法。 ... [详细]
程序员
函数uasort在PHP 5.5和PHP 7.0中的不同行为

如何解决《函数uasort在PHP5.5和PHP7.0中的不同行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们应该如何实现对象类型的移动？

如何解决《我们应该如何实现对象类型的移动？》经验，为你挑选了1个好方法。 ... [详细]
程序员
BeautifulSoup中的select方法无法用空格选择属性值

如何解决《BeautifulSoup中的select方法无法用空格选择属性值》经验，为你挑选了1个好方法。 ... [详细]

mobiledu2402851203

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章