Go 语言字符串的字节标识 Unicode 文本
在 Go 语言中,字符串的字节使用 UTF-8 编码。这似乎有些矛盾,因为 UTF-8 是一种编码,而 Unicode 也是一种编码。
Unicode 与 UTF-8 的区别
Unicode 是一个字符集,而 UTF-8 是一种编码。准确地说,Unicode 规定了字符与二进制的映射关系,而 UTF-8 则定义了如何存储和传输这些字符。
Go 语言中字符串的编码
Go 语言的字符串使用 UTF-8 编码,这意味着字符串中的每一个字节都代表一个 Unicode 字符。UTF-8 是一种可变长度编码,每个字符可以由 1 到 4 个字节表示。
常见字符集和编码
除了 Unicode 和 UTF-8 外,还有其他几个常见的字符集和编码: