编码

admin · 发表于 2018-1-1 21:51:49

编码是将字符串转化为一系列字节的过程（因为最终传递的是0101这样的二进制字节）。字符串的 encode() 函数所接收的第一个参数是编码方式名。可选的编码方式列在了中。

你可以将任何 Unicode 数据以 UTF-8 的方式进行编码。我们试着将 Unicode 字符串 '\u2603'赋值给 snowman：
>>> snowman = '\u2603'
snowman 是一个仅包含一个字符的 Unicode 字符串，这与它存储所需的字节数没有任何关系：
>>> len(snowman)
1
下一步将这个 Unicode 字符编码为字节序列：
>>> ds = snowman.encode('utf-8')
就像我之前提到的， UTF-8 是一种变长编码方式。在这个例子中，单个 Unicode 字符snowman 占用了 3 字节的空间：
>>> len(ds)
3
用中文来举例：

import unicodedata
snowman = '货币'
print(len(snowman))
ds = snowman.encode('utf-8')
print(ds)

复制代码

输出：

2
b'\xe8\xb4\xa7\xe5\xb8\x81'

复制代码

		自动登录	找回密码
密码			立即注册

[Python语言及其应用] 编码

本帖子中包含更多资源

浏览过的版块