首页 > 文章列表 > python UTF-8编码是什么

python UTF-8编码是什么

Python UTF-8编码
255 2022-08-07

1、说明

UTF-8编码,即“可变长的编码”。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,很生僻的字符会被编码成4-6个字节。

2、注意点

Python的诞生比Unicode标准早,所以最早的Python只支持ASCII代码。

一般字符串ABC在Python中都是ASCII编码。

使用UTF-8代码还有另一个好处,那就是ASCII代码实际上可以被视为UTF-8代码的一部分。

因此,大量只支持ASCII代码的历史遗留软件可以在UTF-8代码下继续工作。

这就是为什么我们每次使用中文都需要在文件开头声明UTF-8。

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。