如题所述
一个汉字=2字节
中文标点占三个字节,一个英文字母占一个字节,英文标点占一个字节。
字节的换算关系为:
1字节(Byte)=8字位=8个二进制数
1字位(bit)=1个二进制数
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
b称为字位、B称为字节、KB称为千字节、MB称为兆字节、GB称为吉字节。
扩展资料:
不同的编码格式占字节数是不同的,以下为不同编码汉字、标点符号所占用的字节:
1、ASCII码:一个中文(含繁体)占两个字节,一个中文标点占三个字节。一个英文字母占一个字节的,一个英文标点占一个字节。
2、UTF-8编码:一个中文(含繁体)占三个字节,一个中文标点占三个字节。一个英文字母占一个字节,一个英文标点占一个字节。
3、Unicode编码:一个中文(含繁体)占两个字节,一个中文标点占两个字节。一个英文占两个字节,一个英文标点占一个字节。
参考资料来源:百度百科—字节
一个汉字是2个字节。
官方标准:1字节(byte)= 8位(bit)=8个二进制数1字位(bit)=1个二进制数1B=8b1KB=1024B1MB=1024KB1GB=1024MB
1、在16位的系统中(比如8086微机) 1字 (word)= 2字节(byte)= 16(bit)
2、在32位的系统中(比如win32) 1字(word)= 4字节(byte)=32(bit)
3、在64位的系统中(比如win64)1字(word)= 8字节(byte)=64(bit)
一个英文字母(不分大小写)是一个字节,中文标点占三个字节,英文标点占一个字节。1byte 存1个英文字母,2个byte存一个汉字。规定上是1个字节等于8个比特(1Byte = 8bit)。
扩展资料
B与bit
数据存储是以“字节”(Byte)为单位,数据传输大多是以“位”(bit,又名“比特”)为单位,一个位就代表一个0或1(即二进制),每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位。
字符与字节
1、ASCII码:一个英文字母(不分大小写)占一个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。换算为十进制 ,最小值-128,最大值127。如一个ASCII码就是一个字节。
2、UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
3、Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点占两个字节
参考资料来源:
本回答被网友采纳一个汉字=2个英文字母=2字节
官方标准:
1汉字=2字节
1字节(Byte)=8字位=8个二进制数
1字位(bit)=1个二进制数
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
硬件商标准:
1GB=1000MB
1MB=1000KB
1KB=1000B
扩展资料
字符与字节
ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数。
换算为十进制 ,最小值-128,最大值127。如一个ASCII码就是一个字节。
UTF-8编码:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
中文标点占三个字节,英文标点占一个字节
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。
中文标点占两个字节,英文标点占两个字节
不同数量级间
国际单位制:
1KB=1024B;1MB=1024KB=1024×1024B。
1B(byte,字节)= 8 bit;
1KB(Kilobyte,千字节)=1024B= 2^10 B;
1MB(Megabyte,兆字节,百万字节,简称“兆”)=1024KB= 2^20 B;
1GB(Gigabyte,吉字节,十亿字节,又称“千兆”)=1024MB= 2^30 B;
1TB(Terabyte,万亿字节,太字节)=1024GB= 2^40 B;
1PB(Petabyte,千万亿字节,拍字节)=1024TB= 2^50 B;
1EB(Exabyte,百亿亿字节,艾字节)=1024PB= 2^60 B;
1ZB(Zettabyte,十万亿亿字节,泽字节)= 1024EB= 2^70 B;
参考资料来源:
本回答被网友采纳官方标准:
1汉字=2字节
1字节(Byte)=8字位=8个二进制数
1字位(bit)=1个二进制数
1B=8b
1KB=1024B
1MB=1024KB
1GB=1024MB
硬件商标准:
1GB=1000MB
1MB=1000KB
1KB=1000B
通常情况下,把B称为字节、b称为字位、KB称为千字节、MB称为兆字节、GB称为吉字节。本回答被网友采纳
我看前面答案都是说了2字节,但是都没说为啥2字节,和编码的问题。
首先我们知道1字节=8位。位是最基础的单位,1位只有0和1两种状态。2位能有4种状态(00,01,10,11),3位能有8种状态(000,001,010,011,100,101,110,111),依次类推,8位有256种状态(既2的位数的次方种状态),所以1字节能表达256种不同状态,英文字母只有26个而已,自然1字节256种状态能表达出所有字母和符号,具体详见ASCII表。但是汉字不行,我们都知道汉字有近十万个,1字节256个状态肯定是装不下的。2字节能表达256X256=65536个汉字。现实中,1000个常用汉字就能覆盖92%的日常使用了。2字节能装6万多汉字,基本是够用了。但也不是所有汉字都能装进去,毕竟汉字有10万多个,所以GBK编码里,部分生僻字会直接乱码掉,典型的就是显示为一个方框。为了解决这个问题,utf-8编码里,一个汉字是3字节的,能装下256X256X256约1600万个汉字,绝对够了。甚至有的编码里一个汉字占4字节。
所以说一个汉字2字节并不准确。需要看编码方式。这也是为啥编码不对会乱码。比如GBK里每2字节是一个汉字,你用utf-8的编码的每3字节一个汉字的方式去读取数据,自然读出来都是些乱七八糟的东西。
PS:可能有人好奇为啥GBK编码要用2字节来装汉字,明明装不下所有汉字。当然是为了节省空间啊,为了几万个使用率不到1%的生僻字,一个汉字要多占50%空间是得不偿失的,毕竟当初的存储空间又小又金贵。现在无所谓了~