一级汉子和二级汉子有什么区别

如题所述

这位朋友,您好!

这个问题说起来就有点复杂:

首先说明 gb2312 的编码规则

汉字采用区位码表示 每个区有 94 个汉字容量。 1~94
区的编码从 1开始倒94
所以gb2312的最大编码容量是 94*94 (实际上只包含了6737个汉字)

区码: 1~8 是符号区,全角英文字母,希腊、日文、俄文等等,
9 区是造表符号
10~15 空,未定义,
16~55 一级字库 汉字3755个,采用拼音排序;
56-87 二级字库,汉字3008个,采用部首排序;
87~94空

由于此编码方案顶得比较早,有很多不完善的地方,所以后来有了 gb12345,和gb 13000 等其他编码方案。

个人记忆,可能有些出入,仅供参考。

---------------------------------------------------------------

内码也简单,就是gb2312的编码都加上 0xa0 (160) 就行了

比如
区位码:1601 “啊”字
他在计算机里面的内码就是
10进制 16 +160, 01+160
16进制 10 + A0,01+A0
得出来的就是B0A1

汉字的区位码标准是将汉字分为一级字库和二级字库,一级字库中汉字是按拼音顺序编码,是通常用的汉字,二级字库是不经常用的汉字,是按汉字的部首笔划顺序编码的。
GB 2312 汉字编码字符集
  从1975年开始,我国为了研究汉字的使用频度,进行了大规模的字频统计工作,内容包括工业、农业、军事、科技、政治、经济、文学、艺术、教育、体育、医药卫生、天文地理、自然、化学、文字改革、考古等多方面的出版物,在数以亿计的浩瀚文献资料中,统计出实际使用的不同的汉字数为6335个,而其中有3000多个汉字的累计使用频度达到了99.9%,而另外的3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。遇到“镕、啰、瞭、袆、祎、曌、赟、贇、鱻、驫、犇……”等汉字,既无法输入,又不能打印。
后来国家技术监督局又颁布了一个与之相对应的繁体字集,全称《信息交换用汉字编码字符集辅助集》,标准号为GB/T12345-90。

希望以上回答能够帮助到您,祝好~!
温馨提示:答案为网友推荐,仅供参考

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网