GB2312编码

本节介绍了GB2312编码方法。GB2312字符编码是根据字符的区位号加32,再加128,形成 的。

GB2312原始编码(encoding)是对所收录的每个字符都用两个字节(2 bytes)表示。第一字 节为“高字节”,由字符的区号值加上32而形成;第二字节为“低字节”,由字符的位号 值加上32而形成。例如:汉字“啊”,编号为16区01位。它的高字节为16+32=48(0x30), 低字节为01+32=33(0x21),合并而成的编码为0x3021。

在区位号值上加32的原因大慨是为了避开低值字节区间。

由于GB2312原始编码与ASCII编码的字节有重叠,现在通行的GB2312编码是在原始编码的 两个字节上各加128(0x80)修改而形成。例如:汉字“啊”,编号为16区01位。它的原 始编码为0x3021,通行编码为0xB0A1。

如果不另加说明,GB2312常指这种修改过的通行编码。

本书后半部分列出了GB2312的全部字符和它们的区位号。

Table of Contents

 说明与摘要

国标GB2312字符集和编码说明

 GB2312字符集

GB2312编码

 GB2312与Unicode的关系

 从GB2312到Unicode转换表制作程式

 GB2312符号区:01-09区

 GB2312一级汉字区: 16-55区

 GB2312二级汉字区: 56-87区

 从Unicode到GB2312转换表制作程式

 Unicode编码中的GB2312汉字: 7,445个

 参考文献

 PDF打印版