51学通信论坛2017新版

标题: 编码 [打印本页]

作者: admin    时间: 2018-1-1 21:51
标题: 编码
   编码是将字符串转化为一系列字节的过程(因为最终传递的是0101这样的二进制字节)。字符串的 encode() 函数所接收的第一个参数是编码方式名。可选的编码方式列在了中。  

   [attach]5606[/attach]
   你可以将任何 Unicode 数据以 UTF-8 的方式进行编码。我们试着将 Unicode 字符串 '\u2603'赋值给 snowman:
>>> snowman = '\u2603'
   snowman 是一个仅包含一个字符的 Unicode 字符串,这与它存储所需的字节数没有任何关系:
>>> len(snowman)
1
   下一步将这个 Unicode 字符编码为字节序列:
>>> ds = snowman.encode('utf-8')
    就像我之前提到的, UTF-8 是一种变长编码方式。在这个例子中,单个 Unicode 字符snowman 占用了 3 字节的空间:
>>> len(ds)
3  
   用中文来举例:
  1. import unicodedata
  2. snowman = '货币'
  3. print(len(snowman))
  4. ds = snowman.encode('utf-8')
  5. print(ds)
复制代码
输出:
  1. 2
  2. b'\xe8\xb4\xa7\xe5\xb8\x81'
复制代码





欢迎光临 51学通信论坛2017新版 (http://bbs.51xuetongxin.com/) Powered by Discuz! X3