文字编码说明

识别类型	识别编码范围	备注
全角符号区	0x00区 0x30区 0xFF区	-
汉字区	0x4E00 ---- 0x9FFF	共20902个汉字

识别类型	识别编码范围	备注
全角符号区	单字节UTF8字符中的“对应Unicode的0x00区的内容” 双字节UTF8字符中的“对应Unicode的部分00区和全部03区的符号”	-
汉字区	三字节UTF8字符中的“对应Unicode的：20区以上的符号 + 汉字”	共20902个汉字

1字节	0xxxxxxx
2字节	110xxxxx	10xxxxxx
3字节	1110xxxx	10xxxxxx	10xxxxxx
4字节	11110xxx	10xxxxxx	10xxxxxx	10xxxxxx
5字节	111110xx	10xxxxxx	10xxxxxx	10xxxxxx	10xxxxxx
6字节	1111110x	10xxxxxx	10xxxxxx	10xxxxxx	10xxxxxx	10xxxxxx

¶ 1. GB2312编码体系