admin 发表于 2018-1-1 21:51:49

编码

   编码是将字符串转化为一系列字节的过程(因为最终传递的是0101这样的二进制字节)。字符串的 encode() 函数所接收的第一个参数是编码方式名。可选的编码方式列在了中。

   
   你可以将任何 Unicode 数据以 UTF-8 的方式进行编码。我们试着将 Unicode 字符串 '\u2603'赋值给 snowman:
>>> snowman = '\u2603'
   snowman 是一个仅包含一个字符的 Unicode 字符串,这与它存储所需的字节数没有任何关系:
>>> len(snowman)
1
   下一步将这个 Unicode 字符编码为字节序列:
>>> ds = snowman.encode('utf-8')
    就像我之前提到的, UTF-8 是一种变长编码方式。在这个例子中,单个 Unicode 字符snowman 占用了 3 字节的空间:
>>> len(ds)
3
   用中文来举例:import unicodedata
snowman = '货币'
print(len(snowman))
ds = snowman.encode('utf-8')
print(ds)输出:2
b'\xe8\xb4\xa7\xe5\xb8\x81'
页: [1]
查看完整版本: 编码