UTF-8“字”的编码是&#x 5B57，5B57是2个字节，请问&#x是啥意思？怎么缺少1个字节

如题所述

推荐答案 2020-12-30

你讨论的字是 html 文件里的汉字编码。
汉字 "字" 的 unicode 编码是十六进制数 5B57, 5B57是2个字节。
&#x 是网页文件 html 格式文件里汉字 unicode 编码的前缀。
字 x表示下面数值是十六进制。分号是一个汉字编码的结束符。
UTF-8 里字符编码长度与用到的字符集有关，最短是1字节。汉字国标 GB2312 用两字节。你的 "字" 字是国标 GB2312，只有2字节。不是3字节。

温馨提示：答案为网友推荐，仅供参考

当前网址：https://verywind.cn/ee/vj377yfxy2yx2xjyeej.html

其他回答

第1个回答 2020-12-29

Utf-8是一个引入 utf-8编码规则的字符集。首先，ucs 和 unicode 只是将整数分配给字符的编码表。有几种方法可以将字符串表示为字节字符串。最常用的两种方法是将 unicode 文本存储为由两个或四个字节序列组成的字符串。这两种方法的形式名分别为 ucs-2和 ucs-4。除非另有说明，大多数字节都是这样的(big endian 约定)。要将 ascii 或 latin-1文件转换为 ucs-2，只需在每个 ascii 字节前插入0x00。要转换为 ucs-4，必须在每个 ascii 字节前插入三个0x00。在 unix 下使用 ucs-2(或 ucs-4)会导致严重的问题。这些经过编码的字符串包含特殊字符，如“或”/“ ，这些字符在文件名和其他 c 库函数参数中具有特殊意义。此外，大多数使用 ascii 文件的基于 unix 的工具不经过重大修改就无法读取16位字符。由于这些原因，ucs-2不适用于 unicode 文件名、文本文件、环境变量等的外部编码。

你可能感兴趣的内容

大家正在搜

汉字的两种编码是什么最普遍的汉字字符编码 x是什么编码汉字的三种编码汉字字形编码加个x编码为什么苹果x卡槽有编码苹果x的数据线没有编码身份证编码x表示什么信息

非常风气网www.verywind.cn

UTF-8“字”的编码是&#x 5B57，5B57是2个字节，请问&#x是啥意思？怎么缺少1个字节

相关了解……

你可能感兴趣的内容