51学通信论坛2017新版
标题:
编码
[打印本页]
作者:
admin
时间:
2018-1-1 21:51
标题:
编码
编码是将字符串转化为一系列字节的过程(因为最终传递的是0101这样的二进制字节)。字符串的 encode() 函数所接收的第一个参数是编码方式名。可选的编码方式列在了中。
[attach]5606[/attach]
你可以将任何 Unicode 数据以 UTF-8 的方式进行编码。我们试着将 Unicode 字符串 '\u2603'赋值给 snowman:
>>> snowman = '\u2603'
snowman 是一个仅包含一个字符的 Unicode 字符串,这与它存储所需的字节数没有任何关系:
>>> len(snowman)
1
下一步将这个 Unicode 字符编码为字节序列:
>>> ds = snowman.encode('utf-8')
就像我之前提到的, UTF-8 是一种变长编码方式。在这个例子中,单个 Unicode 字符snowman 占用了 3 字节的空间:
>>> len(ds)
3
用中文来举例:
import unicodedata
snowman = '货币'
print(len(snowman))
ds = snowman.encode('utf-8')
print(ds)
复制代码
输出:
2
b'\xe8\xb4\xa7\xe5\xb8\x81'
复制代码
欢迎光临 51学通信论坛2017新版 (http://bbs.51xuetongxin.com/)
Powered by Discuz! X3