国标GB2312编码自学教程 - v3.12,杨和荣
Warning: GB2312 encoding used!
GB2312编码
本节介绍了GB2312编码方法。GB2312字符编码是根据字符的区位号加32,再加128,形成 的。
GB2312原始编码(encoding)是对所收录的每个字符都用两个字节(2 bytes)表示。第一字 节为“高字节”,由字符的区号值加上32而形成;第二字节为“低字节”,由字符的位号 值加上32而形成。例如:汉字“啊”,编号为16区01位。它的高字节为16+32=48(0x30), 低字节为01+32=33(0x21),合并而成的编码为0x3021。
在区位号值上加32的原因大慨是为了避开低值字节区间。
由于GB2312原始编码与ASCII编码的字节有重叠,现在通行的GB2312编码是在原始编码的 两个字节上各加128(0x80)修改而形成。例如:汉字“啊”,编号为16区01位。它的原 始编码为0x3021,通行编码为0xB0A1。
如果不另加说明,GB2312常指这种修改过的通行编码。
本书后半部分列出了GB2312的全部字符和它们的区位号。
Table of Contents