GB2312与Unicode的关系

GB2312字符集是Unicode字符集的一个子集。但是GB2312编码和Unicode编码确毫无关系。

GB2312字符集是Unicode字符集的一个子集。这也就是说,GB2312所收录的每一个字符都 收录在Unicode之中。

但是GB2312编码和Unicode编码确没有什么相同之处。同一个汉字,它的GB2312编码和 Unicode编码确毫不相同。例如:汉字“啊”,它的GB2312编码为0xB0A1,但是它的 Unicode编码为 0x554A。

本书后半部分列出了GB2312的全部字符和它们所对应的Unicode编码和 UTF-8 (Unicode Transformation Format - 8-bit) 编码。

Table of Contents

 说明与摘要

国标GB2312字符集和编码说明

 GB2312字符集

 GB2312编码

GB2312与Unicode的关系

 从GB2312到Unicode转换表制作程式

 GB2312符号区:01-09区

 GB2312一级汉字区: 16-55区

 GB2312二级汉字区: 56-87区

 从Unicode到GB2312转换表制作程式

 Unicode编码中的GB2312汉字: 7,445个

 参考文献

 PDF打印版